Skip to main content

Guide

常见的问题解答

MCP 和 Skill的主要区别

定位:

  • MCP:连接外部世界 (外部系统交互)
  • Skill:封装领域知识("操作手册",教会它如何专业地完成特定任务)

脚本能力:

  • MCP:需通过MCP协议提供的工具来远程调用外部API或执行操作
  • Skill:自带可执行脚本(Python、Bash等),AI可直接运行,执行结果不占用上下文,省Token且结果可靠。

调用:

  • 面向外部用户:提供某个端口下的服务
  • 通过复制SKILL.md等文件到特定目录即可安装

场景:

  • 需要MCP的场景:你的AI需要获取实时、外部的数据。比如,查询云端数据库、调用CRM系统获取客户信息、访问第三方SaaS API(如Slack、Jira)等。MCP的价值在于提供一个安全、标准化的管道来连接这些外部系统。
  • 需要Skill的场景:你需要AI以特定、专业的方式处理本地任务。比如,按照公司规范审查代码、用固定格式处理Excel报表、执行PDF解析等。这些工作用Skill封装,能让团队所有人都能复用到同一种"专业能力"。

langChain

说白了就是 SDK,不同于传统 SDK 封装的是确定性的 API,LangChain 封装的是非确定性的 LLM 和其周边生态,因此它更像一个“胶水层 SDK”

  • 提供标准化接口:它抽象了不同大模型(OpenAI、Anthropic、Google 等)的 API 差异,让你用一套代码就能切换模型,这正是 SDK 的核心价值。
  • 封装复杂逻辑:你不需要自己处理“如何把长文档切成小块嵌入向量库”或“如何实现对话记忆”这类复杂的工程细节,LangChain 已经提供好了现成的模块。
  • 提供开发范式:它定义的 LCEL(LangChain 表达式语言)和 Chain 概念,就像 SDK 定义的编程模式,引导你如何用“链式”思维组装应用。

ref: https://www.ibm.com/think/topics/langchain

Token超过上下文的处理办法

  • 上下文检索(RAG):不让AI看全文,而是把它当“搜索引擎”。先把超长文档切成小段存进向量库,用户提问时,只检索出最相关的3-5个小段落送给AI。这是目前处理超长文本最主流、最经济的方法,消耗的Token极少。
  • 信息压缩与摘要:让一个专门的AI先对原始内容做“脱水”处理,总结成摘要或提取关键点,再把精炼后的内容送给主AI。注意,这会损失细节,适合只需要了解大意的场景。
  • 分块处理:像流水线作业一样,把大任务拆成多个小任务。例如,让AI每次只分析一个章节,最后再汇总所有章节的分析结论。

ReAct 和 Plan-and-Execute

Reasoning + Acting

ReAct 是 2022 年提出的一种 Prompt 策略,核心循环是:

思考(Thought)-> 行动(Action)-> 观察(Observation)-> 再思考(Thought)...

就像人解决问题一样:我先想想该怎么做(Thought),然后动手查资料(Action),看到结果后(Observation),再根据新情况决定下一步(再 Thought)。

Plan-and-Execute

先将任务分解为清晰的步骤计划,再按计划执行。

制定计划(Plan) → 执行步骤1 → 执行步骤2 → ... → 汇总结果

Reflection (反思)

生成初稿 → Critic(批评者角色)指出问题 → 根据反馈修改 → (可能重复)

就像 DeepSeek 刚推出的思考模式一样。