01 / 26
ANTHROPIC · 完全指南 · 中文精读版

为 Claude
构建 Skills
的完全指南

从设计到测试、从分发到迭代
一次讲透 Agent Skills 的底层逻辑与工程实践
原著 · Anthropic 精读整理 · Wayne 研究室 2026 · 04 · 16
CONTENTS

六章 · 一次读懂

01

基础概念

Skill 是什么 · 渐进披露 · 与 MCP 的关系

02

规划与设计

用例 · 成功指标 · 文件结构 · YAML 规范

03

测试与迭代

三层测试 · skill-creator · 过/欠触发

04

分发与共享

GitHub · API · 组织级部署

05

模式与排障

五大编排模式 · 常见问题速查

06

资源与清单

官方资料 · 工具 · 上线检查

01 · 定义

Skill 到底是什么?

一个 文件夹,里面装着一组 指令
用来教会 Claude 如何处理 特定任务或工作流

核心价值

  • 教一次,每次对话都生效
  • 不必在每个会话里重复解释偏好
  • 把领域专长固化成可复用资产

适合什么场景

  • 可重复的多步工作流
  • 有固定方法论的研究/写作
  • 按公司风格规范生成内容
  • 跨多个工具的复杂流程编排
01 · 文件结构

一个 Skill = 一个文件夹

your-skill/
├── SKILL.md        # 必需 · 主指令
├── scripts/        # 可选 · 可执行代码
│   ├── process.py
│   └── validate.sh
├── references/     # 可选 · 深度文档
│   └── api-guide.md
└── assets/         # 可选 · 模板/字体/图标
    └── template.md

SKILL.md

主指令文件,YAML frontmatter + Markdown 正文,必须精确命名

scripts/

确定性代码:数据处理、校验、API 调用

references/

按需加载的深度文档,避免塞进主指令

assets/

产出用的模板、字体、图标、样式

01 · 核心设计原则

渐进披露 · Progressive Disclosure

三级加载机制,让 Claude 只在需要时看到必要的内容 —— 最小化 token,最大化专长。

LEVEL 1
YAML frontmatter
始终加载进系统提示 · 只含足够判断"何时使用"的元信息
常驻
LEVEL 2
SKILL.md 正文
当 Claude 判断当前任务相关时加载 · 包含完整指令
按需
LEVEL 3
链接文件
references / scripts / assets · Claude 主动发现并按需导航
深挖
01 · 另外两条设计原则

组合性 + 可移植性

Composability · 组合性

Claude 可同时加载多个 Skill。你的 Skill 应当与其他 Skill 友好共存,不能假设自己是唯一能力


→ 命名聚焦、职责单一、不抢场景

Portability · 可移植性

同一个 Skill 在 Claude.ai、Claude Code、API 三端行为一致。写一次,三处可用。


→ 前提:运行环境能满足 Skill 所需依赖

01 · 厨房类比

Skills 与 MCP 的关系

MCP = 专业厨房

提供 工具、食材、设备
让 Claude 连接上你的服务 —— Notion、Asana、Linear。


回答"Claude 能做什么"

Skills = 食谱

提供 分步指令,教 Claude 如何做出一道菜。
把工作流和最佳实践固化下来。


回答"Claude 应当怎么做"

关键洞察:只给 MCP 不给 Skill,用户连上后不知道下一步做什么,每次对话重新摸索,结果参差不齐 —— 往往把问题怪到 connector 头上,其实是工作流指引缺失。

CHAPTER · 02

规划与设计

动手前先想清楚:你要解决谁的什么问题?

02 · 起点

先定义 2-3 个具体用例

一个好的用例定义长什么样

用例:Sprint 规划
触发:用户说"帮我排这个 sprint" / "创建 sprint 任务"
步骤:
  1. 从 Linear(经由 MCP)拉取当前项目状态
  2. 分析团队速度与容量
  3. 给出优先级建议
  4. 在 Linear 创建带标签与估点的任务
结果:完整可执行的 sprint 与任务

自问四个问题

  • 用户想完成什么结果?
  • 需要哪些多步工作流?
  • 需要哪些工具(内置 or MCP)?
  • 应该嵌入哪些领域知识和最佳实践?
02 · 分类

Anthropic 观察到的三类 Skill

01

文档与资产生成

生成高一致性、高质量的文档、演示、代码、设计、海报。


示例 frontend-design · docx · pptx · xlsx

关键技巧:嵌入风格指南、模板结构、交付前质量清单,无需外部工具。

02

工作流自动化

需要一致方法论的多步流程,可能跨多个 MCP。


示例 skill-creator

关键技巧:带校验关卡的分步流程、模板、内置评审、迭代优化回路。

03

MCP 增强

为已有 MCP server 提供工作流级别的指引。


示例 Sentry code-review

关键技巧:协调多 MCP 调用顺序、嵌入领域专长、内置错误处理。

02 · 成功指标

怎么判断 Skill 真的有用?

定量 · Quantitative

  • 目标:90% 相关查询能触发
  • 测法:跑 10-20 条应触发的测试查询
  • 目标:X 次工具调用内完成
  • 测法:对比开启 / 不开启 Skill 的 token 和调用数
  • 目标:0 次失败 API 调用
  • 测法:监控 MCP 日志,追踪重试率与错误码

定性 · Qualitative

  • 用户无需提示 Claude 下一步
  • 工作流无需用户纠偏即可完成
  • 同一请求 3-5 次运行,结果结构一致
  • 新用户首次试用就能完成任务

注:这是粗略基准,而非精确阈值。接受"基于直觉"的判断。

02 · 技术规范

YAML frontmatter · 最关键的部分

Claude 就靠 frontmatter 决定要不要加载你的 Skill —— 务必写对。

---
name: your-skill-name
description: 做什么。当用户
  要求 [具体短语] 时使用。
---

两个必填字段

name · kebab-case,小写,无空格、下划线、大写,与文件夹名一致


description · 必须同时包含:
① 做什么 ② 何时用 ③ 不超过 1024 字符 ④ 禁用 XML 尖括号

命名硬规则

notion-project-setup     ✗ Notion Project Setup     ✗ notion_project_setup     ✗ NotionProjectSetup

文件名必须是 SKILL.md(大小写敏感)· 不要放 README.md 进 Skill 文件夹

02 · description 字段

description 的写作公式

[做什么]  +  [何时使用]  +  [关键能力]

✓ 好的例子

分析 Figma 设计文件,生成开发交接文档。当用户上传 .fig 文件、索要"设计规范"或"组件文档"时使用。

管理 Linear 项目工作流 —— sprint 规划、任务创建、状态追踪。用户提到"sprint"、"Linear 任务"或"创建工单"时触发。

✗ 差的例子

帮你处理项目。(太空)

创建复杂的多页文档系统。(缺触发词)

实现带层级关系的 Project 实体模型。(太技术,没用户侧触发)

02 · 主指令

SKILL.md 正文的最佳实践

具体且可执行

运行 python scripts/validate.py --input {filename}。若校验失败,常见问题:缺字段(加到 CSV)、日期格式错(用 YYYY-MM-DD)

校验数据后再继续。(太模糊)

包含错误处理

明确列出:常见错误 → 原因 → 解决方案。例如 MCP 连接失败时的三步排查。

清晰引用资源

主动指向 references:
"写查询前先阅读 references/api-patterns.md,了解限流、分页、错误码。"

用渐进披露

SKILL.md 只写核心;详细文档搬到 references/;超过 5000 词时必须拆分。

CHAPTER · 03

测试与迭代

Skill 是活文档 —— 靠反馈持续进化

03 · 测试方法

三个必测层面

01

触发测试

确保 Skill 在合适时机加载。


✓ 明显任务触发
✓ 改写说法也能触发
✗ 不相关主题不触发

02

功能测试

确认 Skill 产出正确。


✓ 输出有效
✓ API 调用成功
✓ 错误处理可用
✓ 边界情况覆盖

03

性能对比

证明比"没有 Skill"更好。


对比:消息数、tool calls、失败 API、token 消耗

黄金建议:先在单个有挑战的任务上迭代到 Claude 能成功处理,再把成功的做法固化成 Skill,然后扩展到更多测试用例 —— 利用 Claude 的 in-context learning,反馈信号比"撒大网测试"快得多。

03 · 迭代信号

触发出问题的两种信号

欠触发 · Under-triggering

症状:

  • 该用时没自动加载
  • 用户要手动启用
  • 不断有"什么时候用它"的问题

对策:

description 加细节与技术关键词,提升触发敏感度

过触发 · Over-triggering

症状:

  • 在无关查询里被加载
  • 用户要关掉它
  • 目的模糊混乱

对策:

加负面触发词("不用于 X"),description 更具体

调试技巧:直接问 Claude —— "你会在什么时候用 [Skill 名]?" Claude 会复述它理解的 description,照着补齐缺失信息。

03 · 工具

用 skill-creator 构建与迭代

Claude.ai 插件目录或 Claude Code 可用 —— 若已有 MCP server 与 2-3 个核心工作流,通常 15-30 分钟即可产出可用 Skill。

创建

  • 从自然语言描述生成
  • 产出合格式的 SKILL.md
  • 建议触发短语和结构

评审

  • 标记常见问题(描述模糊、缺触发词、结构缺陷)
  • 识别过/欠触发风险
  • 基于用途建议测试用例

迭代

  • 遇到边界问题或失败,把案例带回 skill-creator
  • "用本对话中发现的问题改进 Skill 处理 [边界] 的方式"
CHAPTER · 04

分发与共享

从个人工具到开放标准

04 · 分发

三种分发路径

个人用户

  • 下载 Skill 文件夹
  • 打包 zip(如需要)
  • 上传到 Claude.ai:Settings → Capabilities → Skills
  • 或放入 Claude Code 目录

组织级

  • 管理员可全 workspace 部署
    (2025-12-18 已上线)
  • 自动更新
  • 集中管理

API / Agent

  • /v1/skills 端点
  • Messages API 的 container.skills 参数
  • Console 版本管理
  • 配合 Claude Agent SDK 构建自定义 Agent

开放标准:Agent Skills 已作为开放标准发布。和 MCP 一样,Anthropic 相信 Skill 应当跨工具、跨平台可移植 —— 同一份 Skill 应在 Claude 之外的 AI 平台也能工作。

04 · 选型

何时用 API · 何时用 Claude.ai

场景最佳落地
终端用户直接使用 SkillClaude.ai / Claude Code
开发期的手动测试与迭代Claude.ai / Claude Code
个人 / 临时工作流Claude.ai / Claude Code
应用以程序化方式调用 SkillAPI
规模化生产部署API
自动化流水线 + Agent 系统API

注:API 使用 Skill 需要 Code Execution Tool beta —— 提供 Skill 运行所需的安全环境。

CHAPTER · 05

五大编排模式

从早期采用者沉淀出的通用骨架

05 · 模式 1 · 2

顺序编排 · 多 MCP 协调

① Sequential Workflow

适用:多步流程有严格顺序


举例 新客户 onboarding:创建账号 → 绑定支付 → 订阅 → 发欢迎邮件


关键技巧:显式步骤编号、步骤间依赖、每步校验、失败回滚指令。

② Multi-MCP Coordination

适用:工作流跨多个服务


举例 设计交接:Figma 导出 → Drive 存储 → Linear 建任务 → Slack 通知工程团队


关键技巧:阶段分离、数据在 MCP 间传递、阶段前置校验、集中错误处理。

05 · 模式 3 · 4

迭代精修 · 情境工具选择

③ Iterative Refinement

适用:输出质量靠迭代提升


举例 报告生成:初稿 → 运行校验脚本 → 识别缺段/格式/数据问题 → 修复 → 重验证 → 达到阈值停止


关键技巧:明确质量标准、逐轮改进、校验脚本、知道何时停止。

④ Context-aware Tool Selection

适用:同一结果、不同情境用不同工具


举例 文件存储:大文件→云盘 MCP;协作文档→Notion;代码→GitHub;临时→本地


关键技巧:清晰的决策树、兜底选项、向用户解释为什么选这个工具。

05 · 模式 5

领域专长嵌入

⑤ Domain-specific Intelligence

当 Skill 要添加"工具访问之外的专业知识"时使用。

举例 · 金融合规

  • 处理前合规检查:拉取交易 → 比对制裁名单 → 验证司法辖区 → 评估风险 → 记录决策
  • 处理阶段:通过则正常支付;不通过则标记审查、生成合规 case
  • 审计轨迹:记录所有检查、处理决策、审计报告

关键技巧

  • 领域专长嵌入决策逻辑
  • 合规先行 —— 不满足条件不执行动作
  • 全程留痕
  • 清晰的治理路径
05 · 排障

常见问题速查表

症状根因对策
上传失败:"找不到 SKILL.md"文件名大小写错了严格命名为 SKILL.md
"Invalid frontmatter"YAML 缺 --- 分隔符或引号未闭合补齐分隔符、检查引号
"Invalid skill name"name 有空格或大写改为 kebab-case
Skill 加载但不执行指令指令冗长 / 埋太深 / 语义模糊关键放顶部、用 ## Critical、改成祈使句
MCP 调用失败连接断 / 认证失效 / 工具名写错先独立测 MCP、核对工具名大小写
响应变慢 / 质量下降SKILL.md 过大、启用太多 Skill搬到 references、<5000 词、精简启用

高级技巧:关键校验用脚本实现而非自然语言指令 —— 代码是确定的,语言解释不是。参考 Office 系列 Skill 的实现方式。

06 · 速查

上线检查清单

开工前

  • 识别出 2-3 个具体用例
  • 识别所需工具(内置/MCP)
  • 阅读本指南和示例 Skill
  • 规划好文件夹结构

开发中

  • 文件夹用 kebab-case
  • SKILL.md 精确拼写
  • YAML 有 --- 分隔符
  • description 含"做什么+何时用"
  • 无 XML 尖括号
  • 指令清晰可执行
  • 包含错误处理与示例

上传前后

  • 测试明显任务触发
  • 测试改写说法也能触发
  • 确认无关话题不触发
  • 功能测试通过
  • 在真实对话中试用
  • 持续收集反馈并迭代
  • 更新 metadata 版本号
06 · 安全

安全与禁令

允许

  • 所有标准 YAML 类型(字符串、数字、布尔、列表、对象)
  • 自定义 metadata 字段
  • 长描述(上限 1024 字符)
  • 可选 licenseallowed-tools

禁止

  • XML 尖括号 < >(安全限制)
  • YAML 中执行代码(使用安全 YAML 解析)
  • name 前缀含 claudeanthropic(保留)

原因:frontmatter 出现在 Claude 系统提示中,恶意内容可能注入指令。

WAYNE 研究室 · CEO 视角

这份指南对千图网意味着什么?

核心洞察

Skills 是"组织级知识"的工程化封装。


MCP 让 AI 连上工具,Skills 让 AI 用好工具 —— 前者是连通性,后者是认知与工艺。


对创意内容平台,真正的护城河不在模型,而在"你们家的工艺怎么做出来"这种沉淀。

可行动作

  • 抽取工艺:把千图网设计师的方法论封装成 design-brief、poster-gen、brand-review 等 Skill
  • 渐进披露:高频知识常驻、深度知识按需加载 —— 降低 token 成本
  • 厨房+食谱:MCP 接千图素材库与模板系统,Skill 教会 Claude 做什么样的设计
  • 开放标准:Skill 跨平台可移植 —— 一次投入,所有主流 AI 都能用
REFERENCE

官方资源与本文出处

官方文档

  • Best Practices Guide
  • Skills Documentation
  • API Reference · MCP Documentation
  • Engineering Blog · Equipping Agents for the Real World

示例 Skill 仓库

  • GitHub: anthropics/skills
  • Document Skills · PDF · DOCX · PPTX · XLSX
  • Partner Skills · Asana · Atlassian · Canva · Figma · Sentry · Zapier

本文来源

原文:The Complete Guide to Building Skills for Claude(Anthropic)

PDF:resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf

精读整理:Wayne 研究室 · 2026-04-16 · 中文结构化重组版

本文按 Wayne 研究室规范进行结构化重组、概念翻译与视角补充,并非逐句翻译。原文版权归 Anthropic 所有。