在 Agent 时代,真正拉开效率差距的不是“更长的提示词”,而是可复用、可迁移的工作方法。Agent Skills 的意义就在这里:把你反复验证过的流程、规则和边界写成一份标准化“执行说明书”,让模型在不同平台、不同团队、不同项目里都能按同一套 SOP 运行。
本文围绕 Gemini 3.0 的场景,解释 Skills 的最小结构、跨平台兼容的关键点、中文业务的设计框架,并给出一个可直接落地的 Skill 示例,帮你把“临场对话”升级为“可复制的生产力资产”。
最后更新时间:2026-01-26

为什么 Skills 会成为 Gemini 3.0 的“第二层能力”
Gemini 3.0 的优势并不只来自模型推理,而是“模型 + 规则”的组合能力:模型负责理解与生成,Skills 负责把正确路径写死、把错误路径封住。对企业或高频任务来说,这比“每次重新提示”更稳定,也更可控。
最近多个平台开始支持统一的 Skills 结构,尤其是 Google 侧推出的 Agent-first IDE 与 Gemini 3.0 的结合,让技能文件以极低成本落地,甚至可以作为项目资产随仓库同步。换句话说,Skills 不是某个平台的私有语法,而更像一套可迁移的协议层。1
当模型越来越通用、工具越来越多、流程越来越复杂时,Skills 就像是“第二层能力”:你不再依赖记忆和临场发挥,而是依赖被验证过的流程,让团队的正确做法变成默认行为。
Prompt 与 Skill 的差异:从“对话技巧”到“可迁移资产”
提示词更像是“当下对话的技巧”,而 Skill 更像是“可迁移的资产”。前者适合探索与试错,后者适合稳定交付与规模化复用。两者不是对立关系,而是工作流中的不同层级。
下面是一个简化对比,帮助你快速判断何时应该“写提示词”,何时应该“写 Skill”:
| 维度 | Prompt | Skill |
|---|---|---|
| 目标 | 提升单次输出 | 固化稳定流程 |
| 复用性 | 低,依赖个人记忆 | 高,可被团队共享 |
| 可审计 | 难,语义模糊 | 强,规则明确 |
| 迁移成本 | 高,易失真 | 低,结构化 |
在 Gemini 3.0 的场景里,你可以先用 Prompt 验证流程,再把高频成功路径抽象成 Skill;最终形成“探索在前、固化在后”的双层体系。
Skills 的最小结构与目录规范
一个 Skill 的最小结构非常简单:一个文件夹 + 一个 SKILL.md。文件里通常包含两部分:
- YAML 元数据:描述 Skill 的名称、适用场景、触发条件、输入输出。
- 具体指令:分步写清楚任务流程、规则、异常处理与输出格式。

为了避免技能在不同平台失效,建议把元数据写得更“工程化”,例如:
- owner:负责人或维护人,便于追踪责任。
- version:语义化版本号,避免“无感变更”。
- tools:允许调用的工具或能力清单。
- permissions:允许访问的文件、网络或系统范围。
- test_cases:最小可测集的输入与预期输出。
这些字段并不是必须,但它们可以显著提升可维护性与协作效率,尤其适合团队级的 Skill 资产库。
常见的两种目录形态如下:
# 项目级:随仓库版本控制,团队共享
<workspace-root>/.agent/skills/invoice-dedup/SKILL.md
# 全局级:你本机所有项目可用
~/.gemini/antigravity/skills/invoice-dedup/SKILL.md
这一结构的价值在于:迁移成本极低、协作成本极低。只要团队约定好命名与触发规则,就能把“个人经验”沉淀为“团队资产”。
命名上建议使用“动词-对象”的方式,比如 invoice-dedup、contract-risk-check,并统一使用小写与短横线,避免不同平台对大小写敏感导致的加载失败。
兼容性验证:用四类“陷阱”做最小可测集
如果你希望 Skill 可以跨平台复用,就不能只写“成功案例”,还要写“失败护栏”。一个可迁移的 Skill 应该先通过四类基础验证:
- 识别触发:能否正确命中 skill 的意图并加载对应文件。
- 复杂元数据:能否正确解析多层 YAML(规则、标签、版本、限制)。
- 严格结构输出:能否只输出纯 JSON/CSV 等,不夹杂解释或 Markdown。
- 文件生成能力:能否按约定路径创建文件并完成回写。
建议用一套最小测试集做“平台对齐基线”。你可以把这些测试 Skill 放在一个 skills-test 目录里,作为每次迁移或升级时的回归套件。
评估与指标:如何量化 Skill 的稳定性
很多团队写了 Skill,却无法判断“它到底稳定不稳定”。建议建立一套轻量指标体系,至少覆盖以下五类:
- 命中率:多少任务被正确触发并加载 Skill。
- 结构合规率:输出是否满足 JSON/表格等结构要求。
- 失败分流率:缺少关键信息时是否正确进入“待补充”分支。
- 人工复核率:需要人工修正的比例是否在可控范围。
- 平均耗时:完成任务所需时间是否可接受。
只要记录 2-4 周,就能发现哪些 Skill “稳定可复用”,哪些仅适合作为“探索模板”。这会直接影响你在 Gemini 3.0 的工作流里该优先固化哪些场景。
如果有条件,给每个 Skill 配一份简单的评估表,把“命中率、结构合规率、人工复核率”三项放在首页,形成周度复盘习惯。这样能持续优化,而不是靠主观感受决定是否继续使用。
面向中文业务的 Skill 设计框架
在中文场景里,Skills 的难点不是“写指令”,而是“写规则”。以下是更稳定的设计框架:
- 任务边界:明确“做什么、不做什么”。把不可执行的范围写在最前面。
- 输入约束:统一输入格式,必要时要求字段名、图片格式、文件命名。
- 关键规则:用编号列出强制规则,避免模型“自己发挥”。
- 输出结构:明确输出模板、字段类型、排序、去重策略。
- 质检步骤:在输出前进行自检,核对关键字段与长度阈值。
- 失败回退:缺少关键信息时,返回待补充清单而不是“猜”。
如果你要在 gemini 国内使用 的环境部署 Skills,建议把网络与权限信息也写进 Skill 说明,例如“禁止调用不可达的外部 API”“本地文件不得外传”等。
多模态与工具编排:把 Skill 写成“流程图”
Gemini 3.0 的优势在于多模态,但多模态并不等于“随便用”。一个高质量 Skill 应该明确“何时用文本、何时用图像、何时用结构化表格”,并把这些选择写成流程。最稳妥的做法是先做输入分流,再做工具调用,最后做结构化输出。
你可以把 Skill 的执行过程想象成一张流程图,通常包含四段:
- 识别:判断输入类型(文档、图片、音频、表格)。
- 结构化:抽取字段并统一格式(时间、金额、编号)。
- 校验:做规则检查与异常标记(缺失字段、重复记录)。
- 汇总:输出结构化结果,附带可复核的证据字段。
当你把“流程图”写进 Skill 后,模型就不再凭感觉回答,而是按步骤执行。这对复杂任务尤其关键,比如合同条款抽取、投研要点整理或多图表比对。
安全与合规:中文企业常见红线
中文业务里,Skill 的合规问题往往比模型能力更重要,尤其是涉及财务、人事、客户数据时。以下是常见红线与建议写法:
- 个人信息:明确“不得输出身份证号、银行卡号、手机号”等敏感字段。
- 数据驻留:如需本地处理,注明“不得上传外部云端”。
- 版权与合规:禁止生成未经授权的报告或第三方内部资料。
- 访问权限:限定可访问的目录和文件类型,防止越权读取。
这些规则建议写在 Skill 的“约束”部分,并在输出前做一次合规自检,确保模型不会“好心办坏事”。
实战案例:发票去重 Skill(含 Prompt + 规则)
下面是一个适合中文业务的发票去重 Skill,核心思路不是“视觉相似度”,而是通过 OCR 提取交易号,再做模糊匹配与分组输出。
---
name: invoice-dedup
description: 通过 OCR 提取交易号识别重复发票
when_to_use: 需要筛选重复发票或交易号疑似相同
input:
- 发票图片(jpg/png),或已识别文本
output:
- 重复分组清单(JSON 数组)
---
## 目标
识别交易号重复或高度相似的发票,并输出可核查的分组结果。
## 步骤
1. OCR 识别发票文本,提取候选交易号(20-30 位数字)。
2. 规则清洗:去空格、去分隔符,统一为纯数字。
3. 模糊匹配:对编辑距离 <= 2 的交易号视为同组候选。
4. 输出分组:每组列出原始文件名、交易号、相似度说明。
## 约束
- 不允许仅凭背景或版式相似判断重复。
- 当交易号缺失时,输出“待补充信息”的文件列表。
- 输出必须为纯 JSON,不要任何说明文字。
这个 Skill 的关键在于“规则优先”:它把可解释的业务规则写成硬约束,让模型无法用“看起来像”来替代“事实一致”。你也可以在此基础上增加“人工复核标记”字段,保证在财务场景里可追溯、可审计。

为了便于落地,可以在 Skill 附一段示例说明:给出 3 张发票图片,其中 2 张交易号仅差 1 位数字;预期输出分为 2 组,一组标记“疑似重复”,另一组标记“需人工确认”。这种“输入-输出对照”能显著降低新成员的理解成本。
版本化与生态建设:从个人复用到团队资产
当 Skills 开始多起来,建议把它们当成产品进行版本管理:
- 语义化版本号:
1.0.0表示稳定版本,1.1.0表示新增规则。 - 变更日志:记录规则调整的原因与影响范围。
- 质量门槛:设定最低通过率(解析/输出/落盘),未通过不发布。
- 评审机制:关键 Skill 需要双人审阅,避免“错误共识”。
在团队层面,最好维护一个“Skill 索引页”,把场景、输入、输出和责任人写清楚。这样可以避免重复造轮子,也方便新人直接复用。
国内落地路径与行动清单
如果你在评估“官方入口 + 镜像入口”的组合路线,可以这样做:
- 先用 gemini官网 的文档标准化 Skill 结构,再把同一套 Skill 迁移到 gemini镜像站 环境,验证兼容性。
- 把高频业务(发票、合同、投研、客服)拆成独立 Skill,优先固化“错误高发”的环节。
- 建立“Skill 回归测试包”,每次升级 Gemini 版本或工具版本都跑一遍。
- 对外发布时,配套给出示例输入与期望输出,降低复用门槛。
同时注意三个常见坑:一是把 Skill 写成“长提示词”,缺少明确规则;二是权限过宽,导致安全边界失控;三是没有回退逻辑,信息缺失时仍强行输出。把这三点写进规范里,能明显减少上线后的返工。
如果你希望更快完成国内部署,可以直接从 gemini中文版 入口进行测试与上线,并在收尾阶段把成果沉淀到 AIMirror Gemini 中文站 的团队规范里,形成可持续更新的技能库。