ANTHROPIC · 完全指南 · 中文精读版

为 Claude
构建 Skills
的完全指南

从设计到测试、从分发到迭代
一次讲透 Agent Skills 的底层逻辑与工程实践

原著 · Anthropic 精读整理 · Wayne 研究室 2026 · 04 · 16

CONTENTS

六章 · 一次读懂

01

基础概念

Skill 是什么 · 渐进披露 · 与 MCP 的关系

02

规划与设计

用例 · 成功指标 · 文件结构 · YAML 规范

03

测试与迭代

三层测试 · skill-creator · 过/欠触发

04

分发与共享

GitHub · API · 组织级部署

05

模式与排障

五大编排模式 · 常见问题速查

06

资源与清单

官方资料 · 工具 · 上线检查

01 · 定义

Skill 到底是什么？

一个文件夹，里面装着一组指令，
用来教会 Claude 如何处理特定任务或工作流。

核心价值

教一次，每次对话都生效
不必在每个会话里重复解释偏好
把领域专长固化成可复用资产

适合什么场景

可重复的多步工作流
有固定方法论的研究/写作
按公司风格规范生成内容
跨多个工具的复杂流程编排

01 · 文件结构

一个 Skill = 一个文件夹

your-skill/
├── SKILL.md        # 必需 · 主指令
├── scripts/        # 可选 · 可执行代码
│   ├── process.py
│   └── validate.sh
├── references/     # 可选 · 深度文档
│   └── api-guide.md
└── assets/         # 可选 · 模板/字体/图标
    └── template.md

SKILL.md

主指令文件，YAML frontmatter + Markdown 正文，必须精确命名

scripts/

确定性代码：数据处理、校验、API 调用

references/

按需加载的深度文档，避免塞进主指令

assets/

产出用的模板、字体、图标、样式

01 · 核心设计原则

渐进披露 · Progressive Disclosure

三级加载机制，让 Claude 只在需要时看到必要的内容 —— 最小化 token，最大化专长。

LEVEL 1
          YAML frontmatter

          始终加载进系统提示 · 只含足够判断"何时使用"的元信息
        
常驻
LEVEL 2
          SKILL.md 正文

          当 Claude 判断当前任务相关时加载 · 包含完整指令
        
按需
LEVEL 3
          链接文件

          references / scripts / assets · Claude 主动发现并按需导航
        
深挖

01 · 另外两条设计原则

组合性 + 可移植性

Composability · 组合性

Claude 可同时加载多个 Skill。你的 Skill 应当与其他 Skill 友好共存，不能假设自己是唯一能力。

→ 命名聚焦、职责单一、不抢场景

Portability · 可移植性

同一个 Skill 在 Claude.ai、Claude Code、API 三端行为一致。写一次，三处可用。

→ 前提：运行环境能满足 Skill 所需依赖

01 · 厨房类比

Skills 与 MCP 的关系

MCP = 专业厨房

提供工具、食材、设备。
让 Claude 连接上你的服务 —— Notion、Asana、Linear。

回答"Claude 能做什么"

Skills = 食谱

提供分步指令，教 Claude 如何做出一道菜。
把工作流和最佳实践固化下来。

回答"Claude 应当怎么做"

关键洞察：只给 MCP 不给 Skill，用户连上后不知道下一步做什么，每次对话重新摸索，结果参差不齐 —— 往往把问题怪到 connector 头上，其实是工作流指引缺失。

CHAPTER · 02

规划与设计

动手前先想清楚：你要解决谁的什么问题？

02 · 起点

先定义 2-3 个具体用例

一个好的用例定义长什么样

用例：Sprint 规划
触发：用户说"帮我排这个 sprint" / "创建 sprint 任务"
步骤：
  1. 从 Linear（经由 MCP）拉取当前项目状态
  2. 分析团队速度与容量
  3. 给出优先级建议
  4. 在 Linear 创建带标签与估点的任务
结果：完整可执行的 sprint 与任务

自问四个问题

用户想完成什么结果？
需要哪些多步工作流？
需要哪些工具（内置 or MCP）？
应该嵌入哪些领域知识和最佳实践？

02 · 分类

Anthropic 观察到的三类 Skill

01

文档与资产生成

生成高一致性、高质量的文档、演示、代码、设计、海报。

示例 frontend-design · docx · pptx · xlsx

关键技巧：嵌入风格指南、模板结构、交付前质量清单，无需外部工具。

02

工作流自动化

需要一致方法论的多步流程，可能跨多个 MCP。

示例 skill-creator

关键技巧：带校验关卡的分步流程、模板、内置评审、迭代优化回路。

03

MCP 增强

为已有 MCP server 提供工作流级别的指引。

示例 Sentry code-review

关键技巧：协调多 MCP 调用顺序、嵌入领域专长、内置错误处理。

02 · 成功指标

怎么判断 Skill 真的有用？

定量 · Quantitative

目标：90% 相关查询能触发
测法：跑 10-20 条应触发的测试查询
目标：X 次工具调用内完成
测法：对比开启 / 不开启 Skill 的 token 和调用数
目标：0 次失败 API 调用
测法：监控 MCP 日志，追踪重试率与错误码

定性 · Qualitative

用户无需提示 Claude 下一步
工作流无需用户纠偏即可完成
同一请求 3-5 次运行，结果结构一致
新用户首次试用就能完成任务

注：这是粗略基准，而非精确阈值。接受"基于直觉"的判断。

02 · 技术规范

YAML frontmatter · 最关键的部分

Claude 就靠 frontmatter 决定要不要加载你的 Skill —— 务必写对。

---
name: your-skill-name
description: 做什么。当用户
  要求 [具体短语] 时使用。
---

两个必填字段

name · kebab-case，小写，无空格、下划线、大写，与文件夹名一致

description · 必须同时包含：
① 做什么 ② 何时用 ③ 不超过 1024 字符 ④ 禁用 XML 尖括号

命名硬规则

✓ notion-project-setup ✗ Notion Project Setup ✗ notion_project_setup ✗ NotionProjectSetup

文件名必须是 SKILL.md（大小写敏感）· 不要放 README.md 进 Skill 文件夹

02 · description 字段

description 的写作公式

[做什么] + [何时使用] + [关键能力]

✓ 好的例子

分析 Figma 设计文件，生成开发交接文档。当用户上传 .fig 文件、索要"设计规范"或"组件文档"时使用。

管理 Linear 项目工作流 —— sprint 规划、任务创建、状态追踪。用户提到"sprint"、"Linear 任务"或"创建工单"时触发。

✗ 差的例子

帮你处理项目。（太空）

创建复杂的多页文档系统。（缺触发词）

实现带层级关系的 Project 实体模型。（太技术，没用户侧触发）

02 · 主指令

SKILL.md 正文的最佳实践

具体且可执行

运行 python scripts/validate.py --input {filename}。若校验失败，常见问题：缺字段（加到 CSV）、日期格式错（用 YYYY-MM-DD）

校验数据后再继续。（太模糊）

包含错误处理

明确列出：常见错误 → 原因 → 解决方案。例如 MCP 连接失败时的三步排查。

清晰引用资源

主动指向 references：
"写查询前先阅读 references/api-patterns.md，了解限流、分页、错误码。"

用渐进披露

SKILL.md 只写核心；详细文档搬到 references/；超过 5000 词时必须拆分。

CHAPTER · 03

测试与迭代

Skill 是活文档 —— 靠反馈持续进化

03 · 测试方法

三个必测层面

01

触发测试

确保 Skill 在合适时机加载。

✓ 明显任务触发
✓ 改写说法也能触发
✗ 不相关主题不触发

02

功能测试

确认 Skill 产出正确。

✓ 输出有效
✓ API 调用成功
✓ 错误处理可用
✓ 边界情况覆盖

03

性能对比

证明比"没有 Skill"更好。

对比：消息数、tool calls、失败 API、token 消耗

黄金建议：先在单个有挑战的任务上迭代到 Claude 能成功处理，再把成功的做法固化成 Skill，然后扩展到更多测试用例 —— 利用 Claude 的 in-context learning，反馈信号比"撒大网测试"快得多。

03 · 迭代信号

触发出问题的两种信号

欠触发 · Under-triggering

症状：

该用时没自动加载
用户要手动启用
不断有"什么时候用它"的问题

对策：

description 加细节与技术关键词，提升触发敏感度

过触发 · Over-triggering

症状：

在无关查询里被加载
用户要关掉它
目的模糊混乱

对策：

加负面触发词（"不用于 X"），description 更具体

调试技巧：直接问 Claude —— "你会在什么时候用 [Skill 名]？" Claude 会复述它理解的 description，照着补齐缺失信息。

03 · 工具

用 skill-creator 构建与迭代

Claude.ai 插件目录或 Claude Code 可用 —— 若已有 MCP server 与 2-3 个核心工作流，通常 15-30 分钟即可产出可用 Skill。

创建

从自然语言描述生成
产出合格式的 SKILL.md
建议触发短语和结构

评审

标记常见问题（描述模糊、缺触发词、结构缺陷）
识别过/欠触发风险
基于用途建议测试用例

迭代

遇到边界问题或失败，把案例带回 skill-creator
"用本对话中发现的问题改进 Skill 处理 [边界] 的方式"

CHAPTER · 04

分发与共享

从个人工具到开放标准

04 · 分发

三种分发路径

个人用户

下载 Skill 文件夹
打包 zip（如需要）
上传到 Claude.ai：Settings → Capabilities → Skills
或放入 Claude Code 目录

组织级

管理员可全 workspace 部署
(2025-12-18 已上线)
自动更新
集中管理

API / Agent

/v1/skills 端点
Messages API 的 container.skills 参数
Console 版本管理
配合 Claude Agent SDK 构建自定义 Agent

开放标准：Agent Skills 已作为开放标准发布。和 MCP 一样，Anthropic 相信 Skill 应当跨工具、跨平台可移植 —— 同一份 Skill 应在 Claude 之外的 AI 平台也能工作。

04 · 选型

何时用 API · 何时用 Claude.ai

场景	最佳落地
终端用户直接使用 Skill	Claude.ai / Claude Code
开发期的手动测试与迭代	Claude.ai / Claude Code
个人 / 临时工作流	Claude.ai / Claude Code
应用以程序化方式调用 Skill	API
规模化生产部署	API
自动化流水线 + Agent 系统	API

注：API 使用 Skill 需要 Code Execution Tool beta —— 提供 Skill 运行所需的安全环境。

CHAPTER · 05

五大编排模式

从早期采用者沉淀出的通用骨架

05 · 模式 1 · 2

顺序编排 · 多 MCP 协调

① Sequential Workflow

适用：多步流程有严格顺序

举例新客户 onboarding：创建账号 → 绑定支付 → 订阅 → 发欢迎邮件

关键技巧：显式步骤编号、步骤间依赖、每步校验、失败回滚指令。

② Multi-MCP Coordination

适用：工作流跨多个服务

举例设计交接：Figma 导出 → Drive 存储 → Linear 建任务 → Slack 通知工程团队

关键技巧：阶段分离、数据在 MCP 间传递、阶段前置校验、集中错误处理。

05 · 模式 3 · 4

迭代精修 · 情境工具选择

③ Iterative Refinement

适用：输出质量靠迭代提升

举例报告生成：初稿 → 运行校验脚本 → 识别缺段/格式/数据问题 → 修复 → 重验证 → 达到阈值停止

关键技巧：明确质量标准、逐轮改进、校验脚本、知道何时停止。

④ Context-aware Tool Selection

适用：同一结果、不同情境用不同工具

举例文件存储：大文件→云盘 MCP；协作文档→Notion；代码→GitHub；临时→本地

关键技巧：清晰的决策树、兜底选项、向用户解释为什么选这个工具。

05 · 模式 5

领域专长嵌入

⑤ Domain-specific Intelligence

当 Skill 要添加"工具访问之外的专业知识"时使用。

举例 · 金融合规

处理前合规检查：拉取交易 → 比对制裁名单 → 验证司法辖区 → 评估风险 → 记录决策
处理阶段：通过则正常支付；不通过则标记审查、生成合规 case
审计轨迹：记录所有检查、处理决策、审计报告

关键技巧

领域专长嵌入决策逻辑
合规先行 —— 不满足条件不执行动作
全程留痕
清晰的治理路径

05 · 排障

常见问题速查表

症状	根因	对策
上传失败："找不到 SKILL.md"	文件名大小写错了	严格命名为 `SKILL.md`
"Invalid frontmatter"	YAML 缺 `---` 分隔符或引号未闭合	补齐分隔符、检查引号
"Invalid skill name"	name 有空格或大写	改为 kebab-case
Skill 加载但不执行指令	指令冗长 / 埋太深 / 语义模糊	关键放顶部、用 `## Critical`、改成祈使句
MCP 调用失败	连接断 / 认证失效 / 工具名写错	先独立测 MCP、核对工具名大小写
响应变慢 / 质量下降	SKILL.md 过大、启用太多 Skill	搬到 references、<5000 词、精简启用

高级技巧：关键校验用脚本实现而非自然语言指令 —— 代码是确定的，语言解释不是。参考 Office 系列 Skill 的实现方式。

06 · 速查

上线检查清单

开工前

识别出 2-3 个具体用例
识别所需工具（内置/MCP）
阅读本指南和示例 Skill
规划好文件夹结构

开发中

文件夹用 kebab-case
SKILL.md 精确拼写
YAML 有 --- 分隔符
description 含"做什么+何时用"
无 XML 尖括号
指令清晰可执行
包含错误处理与示例

上传前后

测试明显任务触发
测试改写说法也能触发
确认无关话题不触发
功能测试通过
在真实对话中试用
持续收集反馈并迭代
更新 metadata 版本号

06 · 安全

安全与禁令

允许

所有标准 YAML 类型（字符串、数字、布尔、列表、对象）
自定义 metadata 字段
长描述（上限 1024 字符）
可选 license、allowed-tools

禁止

XML 尖括号 < >（安全限制）
YAML 中执行代码（使用安全 YAML 解析）
name 前缀含 claude 或 anthropic（保留）

原因：frontmatter 出现在 Claude 系统提示中，恶意内容可能注入指令。

WAYNE 研究室 · CEO 视角

这份指南对千图网意味着什么？

核心洞察

Skills 是"组织级知识"的工程化封装。

MCP 让 AI 连上工具，Skills 让 AI 用好工具 —— 前者是连通性，后者是认知与工艺。

对创意内容平台，真正的护城河不在模型，而在"你们家的工艺怎么做出来"这种沉淀。

可行动作

抽取工艺：把千图网设计师的方法论封装成 design-brief、poster-gen、brand-review 等 Skill
渐进披露：高频知识常驻、深度知识按需加载 —— 降低 token 成本
厨房+食谱：MCP 接千图素材库与模板系统，Skill 教会 Claude 做什么样的设计
开放标准：Skill 跨平台可移植 —— 一次投入，所有主流 AI 都能用

REFERENCE

官方资源与本文出处

官方文档

Best Practices Guide
Skills Documentation
API Reference · MCP Documentation
Engineering Blog · Equipping Agents for the Real World

示例 Skill 仓库

GitHub: anthropics/skills
Document Skills · PDF · DOCX · PPTX · XLSX
Partner Skills · Asana · Atlassian · Canva · Figma · Sentry · Zapier

本文来源

原文：The Complete Guide to Building Skills for Claude（Anthropic）

PDF：resources.anthropic.com/hubfs/The-Complete-Guide-to-Building-Skill-for-Claude.pdf

精读整理：Wayne 研究室 · 2026-04-16 · 中文结构化重组版

本文按 Wayne 研究室规范进行结构化重组、概念翻译与视角补充，并非逐句翻译。原文版权归 Anthropic 所有。

为 Claude构建 Skills的完全指南

六章 · 一次读懂

基础概念

规划与设计

测试与迭代

分发与共享

模式与排障

资源与清单

Skill 到底是什么？

核心价值

适合什么场景

一个 Skill = 一个文件夹

SKILL.md

scripts/

references/

assets/

渐进披露 · Progressive Disclosure

组合性 + 可移植性

Composability · 组合性

Portability · 可移植性

Skills 与 MCP 的关系

MCP = 专业厨房

Skills = 食谱

规划与设计

先定义 2-3 个具体用例

一个好的用例定义长什么样

自问四个问题

Anthropic 观察到的三类 Skill

文档与资产生成

工作流自动化

MCP 增强

怎么判断 Skill 真的有用？

定量 · Quantitative

定性 · Qualitative

YAML frontmatter · 最关键的部分

两个必填字段

命名硬规则

description 的写作公式

✓ 好的例子

✗ 差的例子

SKILL.md 正文的最佳实践

具体且可执行

包含错误处理

清晰引用资源

用渐进披露

测试与迭代

三个必测层面

触发测试

功能测试

性能对比

触发出问题的两种信号

欠触发 · Under-triggering

过触发 · Over-triggering

用 skill-creator 构建与迭代

创建

评审

迭代

分发与共享

三种分发路径

个人用户

组织级

API / Agent

何时用 API · 何时用 Claude.ai

五大编排模式

顺序编排 · 多 MCP 协调

① Sequential Workflow

② Multi-MCP Coordination

迭代精修 · 情境工具选择

③ Iterative Refinement

④ Context-aware Tool Selection

领域专长嵌入

⑤ Domain-specific Intelligence

举例 · 金融合规

关键技巧

常见问题速查表

上线检查清单

开工前

开发中

上传前后

安全与禁令

为 Claude
构建 Skills
的完全指南