如何构建Skills与知识系统，使AI拥有特定领域的专业能力？

摘要：Skills 与知识系统：让 AI 具备领域专业能力 AI 核心技能系列 &#183; 第 10 篇导语通用大模型什么都会一点，但什么都不精。你让 GPT 写一份金融合规报告，它写得&quot;像那么回事

Skills 与知识系统：让 AI 具备领域专业能力 AI 核心技能系列 · 第 10 篇导语通用大模型什么都会一点，但什么都不精。你让 GPT 写一份金融合规报告，它写得"像那么回事"但经不起专业审查；你让它做医疗辅助诊断，它能说出一堆教科书知识但不了解临床实践。企业需要的不是"什么都会的通才"，而是"懂我这个行业的专家"。怎么让 Agent 从通用走向专业？答案是 Skills 系统 + 知识库。Skills 定义"怎么做"，知识库提供"知道什么"，再加上 MCP 连接"能做什么"——三者协同，让 Agent 具备真正的领域专业能力。一、从通用到专业：Agent 能力进化路径 Level 0: 裸模型 ↓ 加 System Prompt Level 1: Prompt 定制（角色设定、规则约束） ↓ 加 RAG Level 2: RAG 增强（接入领域知识库） ↓ 加 Skills Level 3: Skills 加载（领域工作流 + 最佳实践） ↓ 加 MCP 工具 Level 4: 全能专家（知识 + 流程 + 工具三位一体）每一层解决不同的问题：层级解决什么局限 Prompt "用什么角色、什么风格" 信息量有限，无法传递大量知识 RAG "需要知道什么" 只提供参考信息，不指导工作流程 Skills "按什么流程做" 封装领域最佳实践和操作规范 MCP "能执行什么操作" 连接真实世界的工具和数据二、Skills 系统设计理念 2.1 什么是 Skill Skill 是一个结构化的知识包，以 Anthropic 标准格式定义。一个 SKILL.md 文件包含： YAML 前置元数据：name（技能标识符，小写连字符）和 description（功能描述及使用时机） Markdown 正文：具体的工作流程（Workflow）、指南（Guidelines）、示例（Examples）等指令内容可选依赖：dependencies 字段声明运行所需的软件包 2.2 渐进式披露（Progressive Disclosure） Skill 的信息架构采用三层结构，按需加载，避免一次性塞入过多信息： ┌─────────────────────────────────────┐ │ Layer 1: 元数据层（Frontmatter） │ │ name + description │ │ → 用于 Skill 发现和选择 │ │ 大小：name ≤64字符, desc ≤200字符 │ ├─────────────────────────────────────┤ │ Layer 2: 指令层（Instructions） │ │ 工作流程、Guidelines、Examples │ │ → 加载 Skill 时自动注入 │ │ 大小：几百字到几千字 │ ├─────────────────────────────────────┤ │ Layer 3: 参考层（Reference） │ │ 完整的 API 文档、示例、边界情况 │ │ → 通过 REFERENCE.md 等文件按需查阅 │ │ 大小：任意 │ └─────────────────────────────────────┘ 2.3 Skill 的生命周期发现 → 加载 → 使用 → 卸载 1. 发现：Agent 根据用户需求，从 Skill 列表中找到匹配的 Skill 2. 加载：将 Skill 的指南层注入到 Agent 的上下文中 3. 使用：Agent 按 Skill 定义的流程完成任务 4. 卸载：任务完成后释放上下文空间三、实战：创建你的第一个 Skill 3.1 Skill 文件结构 skills/ ├── code-reviewer/ │ ├── SKILL.md # Skill 定义文件 │ ├── templates/ # 模板文件 │ │ └── review-report.md │ └── examples/ # 示例 │ └── sample-review.md ├── sql-optimizer/ │ ├── SKILL.md │ └── ... └── README.md # Skill 目录索引 3.2 SKILL.md 编写示例 Anthropic 定义的 Skill 标准格式要求 SKILL.md 以 YAML 前置元数据（frontmatter）开头，包含 name 和 description 两个必填字段，然后是 Markdown 正文指令： --- name: code-reviewer description: 专业的代码审查助手，对 Python/JavaScript/Go 代码进行安全性、性能、可维护性审查，输出结构化报告。当用户要求代码审查、Code Review 或安全审计时使用。 --- # Code Reviewer - 代码审查专家 ## 工作流程 ### Step 1: 理解上下文 - 确认编程语言和框架 - 了解代码的业务场景 - 询问审查重点（安全/性能/规范/全面） ### Step 2: 逐层审查按以下优先级逐层审查： 1. **安全性**（P0） - SQL 注入、XSS、CSRF - 敏感数据暴露 - 认证/授权缺陷 - 输入验证缺失 2. **正确性**（P1） - 逻辑错误 - 边界条件处理 - 错误处理缺失 - 并发安全问题 3. **性能**（P2） - N+1 查询 - 内存泄露风险 - 不必要的计算 - 缓存机会 4. **可维护性**（P3） - 代码重复 - 命名规范 - 注释和文档 - 测试覆盖 ### Step 3: 输出报告使用以下格式输出审查报告： | 优先级 | 文件:行号 | 类型 | 问题描述 | 修复建议 | |--------|----------|------|----------|----------| | P0 | app.py:42 | 安全 | SQL注入风险 | 使用参数化查询 | ### 审查统计 - P0 (阻塞): X 个 - P1 (重要): X 个 - P2 (建议): X 个 - P3 (可选): X 个 ## Guidelines - 对 P0 问题必须提供修复代码 - 每个问题都要说清楚"为什么这是问题" - 好的代码也要给予肯定 - 审查意见要具体，不要笼统的"代码需要优化" ## Examples - 用户说"帮我 review 这段代码"→ 激活本 Skill，按四层优先级审查 - 用户说"检查一下安全漏洞"→ 激活本 Skill，聚焦 P0 安全性审查 3.3 在 Agent 中使用 Skill class SkillManager: """Skills 管理器""" def __init__(self, skills_dir: str): self.skills = {} self.load_skills(skills_dir) def load_skills(self, directory: str): """加载所有 Skill 的描述层""" for skill_dir in os.listdir(directory): skill_path = os.path.join(directory, skill_dir, "SKILL.md") if os.path.exists(skill_path): content = open(skill_path).read() # 提取描述（第一段） desc = self._extract_description(content) self.skills[skill_dir] = { "description": desc, "full_content": content, "loaded": False } def find_skill(self, user_request: str) -> str: """根据用户需求匹配 Skill""" skill_list = "\n".join( f"- {name}: {info['description']}" for name, info in self.skills.items() ) # 用 LLM 判断哪个 Skill 最匹配 response = llm.chat(f"用户需求: {user_request}\n\n可用Skills:\n{skill_list}\n\n最匹配的Skill是:") return response # 返回 skill 名称 def activate_skill(self, skill_name: str) -> str: """激活 Skill，返回完整指南注入到 Agent 上下文""" skill = self.skills.get(skill_name) if skill: skill["loaded"] = True return skill["full_content"] return "" 四、知识库构建方法论 4.1 知识库的类型类型内容用途示例文档库产品文档、技术手册 RAG 检索公司产品手册 FAQ 库常见问题和标准答案快速匹配客服知识库案例库历史案例和解决方案参考学习运维故障案例规则库业务规则和约束条件决策依据合规审查规则 4.2 知识结构化流程原始数据结构化处理知识库 ┌──────────┐ ┌──────────────┐ ┌──────────────┐ │ PDF 文档 │ │ 提取+清洗 │ │ 向量化存储 │ │ Word 文档 │ → │ 分类+标签 │ → │ 元数据索引 │ │ 网页内容 │ │ 关联+去重 │ │ 版本管理 │ │ 数据库 │ │ 质量审核 │ │ 权限控制 │ └──────────┘ └──────────────┘ └──────────────┘ 4.3 知识更新策略策略频率做法自动同步实时/每日监控数据源变化，自动更新向量库定期重建每周/每月全量重新处理，保证一致性人工审核按需关键知识变更需要人工确认五、Skills + MCP + RAG 协同三者各有分工，组合起来才是完整的企业级 AI 能力： ┌─────────────────────────────────────────────┐ │ 用户请求 │ │ "帮我审查这份合同是否符合最新的合规要求" │ └──────────────────┬──────────────────────────┘ │ ▼ ┌─────────────────────────────────────────────┐ │ Skills: "合规审查" Skill 被激活 │ │ 定义了审查流程： │ │ 1. 提取合同关键条款 │ │ 2. 对照合规规则逐条检查 │ │ 3. 标记风险点并给出建议 │ │ 4. 生成审查报告 │ └──────────────────┬──────────────────────────┘ │ ┌────────┼────────┐ │ │ │ ▼ ▼ ▼ ┌────────────┐ ┌────────┐ ┌──────────┐ │ RAG: │ │ RAG: │ │ MCP: │ │ 检索最新的 │ │ 检索 │ │ 读取合同 │ │ 合规法规 │ │ 历史案例│ │ 文件内容 │ └────────────┘ └────────┘ └──────────┘ │ │ │ └────────┼────────┘ │ ▼ ┌─────────────────────────────────────────────┐ │ Agent 按 Skill 流程整合所有信息 │ │ 输出结构化的合规审查报告 │ └─────────────────────────────────────────────┘ 三者的关系总结： Skills 定义 "怎么做"（流程和规则） RAG 提供 "知道什么"（领域知识） MCP 连接 "能做什么"（工具和数据）六、企业级案例案例一：金融合规审查 Agent Skills: 合规审查流程（反洗钱规则、KYC 流程、风险评级标准） RAG: 最新法规库 + 历史违规案例库 MCP: 交易数据库连接 + 客户信息查询 + 报告生成工具效果: 审查时间从 2 天缩短到 2 小时，漏检率降低 40% 案例二：技术客服 Agent Skills: 故障排查流程（分层诊断、升级标准、话术规范） RAG: 产品文档库 + FAQ 库 + 历史工单库 MCP: 工单系统 + 监控系统 + 知识库管理效果: 一次解决率从 45% 提升到 78% 案例三：代码审查 Agent Skills: 代码审查规范（安全→正确性→性能→可维护性四层审查） RAG: 编码规范文档 + 安全漏洞库 MCP: Git 仓库访问 + CI/CD 触发 + 代码分析工具效果: 审查覆盖率 100%，P0 漏洞检出率提升 60% 七、职业视角能设计 Skills 系统 = 能做 AI 产品化。这是从"能用 AI"到"能让 AI 产出业务价值"的关键跃升。问题核心答案要点怎么让 Agent 具备领域能力？ Skills（流程）+ RAG（知识）+ MCP（工具）三层协同 Skill 和 System Prompt 的区别？ Skill 更结构化、可复用、按需加载；System Prompt 一次性全量注入知识库怎么保持更新？自动同步 + 定期重建 + 人工审核三策略结合总结能力进化路径：Prompt → RAG → Skills → MCP，四层递进 Skills 三层架构：元数据层（发现）→ 指令层（使用）→ 参考层（深入）知识库四种类型：文档库、FAQ 库、案例库、规则库三者协同：Skills 定义流程，RAG 提供知识，MCP 连接工具企业落地：金融、客服、代码审查等场景已有成熟实践本文是 AI 核心技能系列第 10 篇，共 12 篇。上一篇：MCP 深入理解 | 下一篇：多模态与模型评测关注公众号「coft」，获取完整系列更新、配套代码和学习路线图。一起交流 AI 转行经验，助力职业跃升，迈向高薪岗位。

如何构建Skills与知识系统，使AI拥有特定领域的专业能力？

相关推荐