Gemini Agent Skills 生态指南：一次编写、多端复用的实战方法

在 Agent 时代，真正拉开效率差距的不是“更长的提示词”，而是可复用、可迁移的工作方法。Agent Skills 的意义就在这里：把你反复验证过的流程、规则和边界写成一份标准化“执行说明书”，让模型在不同平台、不同团队、不同项目里都能按同一套 SOP 运行。

本文围绕 Gemini 3.0 的场景，解释 Skills 的最小结构、跨平台兼容的关键点、中文业务的设计框架，并给出一个可直接落地的 Skill 示例，帮你把“临场对话”升级为“可复制的生产力资产”。

最后更新时间：2026-01-26

Agent Skills 生态与多平台适配要点示意 — Agent Skills 生态与多平台适配的核心视角

为什么 Skills 会成为 Gemini 3.0 的“第二层能力”

Gemini 3.0 的优势并不只来自模型推理，而是“模型 + 规则”的组合能力：模型负责理解与生成，Skills 负责把正确路径写死、把错误路径封住。对企业或高频任务来说，这比“每次重新提示”更稳定，也更可控。

最近多个平台开始支持统一的 Skills 结构，尤其是 Google 侧推出的 Agent-first IDE 与 Gemini 3.0 的结合，让技能文件以极低成本落地，甚至可以作为项目资产随仓库同步。换句话说，Skills 不是某个平台的私有语法，而更像一套可迁移的协议层。¹

当模型越来越通用、工具越来越多、流程越来越复杂时，Skills 就像是“第二层能力”：你不再依赖记忆和临场发挥，而是依赖被验证过的流程，让团队的正确做法变成默认行为。

Prompt 与 Skill 的差异：从“对话技巧”到“可迁移资产”

提示词更像是“当下对话的技巧”，而 Skill 更像是“可迁移的资产”。前者适合探索与试错，后者适合稳定交付与规模化复用。两者不是对立关系，而是工作流中的不同层级。

下面是一个简化对比，帮助你快速判断何时应该“写提示词”，何时应该“写 Skill”：

维度	Prompt	Skill
目标	提升单次输出	固化稳定流程
复用性	低，依赖个人记忆	高，可被团队共享
可审计	难，语义模糊	强，规则明确
迁移成本	高，易失真	低，结构化

在 Gemini 3.0 的场景里，你可以先用 Prompt 验证流程，再把高频成功路径抽象成 Skill；最终形成“探索在前、固化在后”的双层体系。

Skills 的最小结构与目录规范

一个 Skill 的最小结构非常简单：一个文件夹 + 一个 SKILL.md。文件里通常包含两部分：

YAML 元数据：描述 Skill 的名称、适用场景、触发条件、输入输出。
具体指令：分步写清楚任务流程、规则、异常处理与输出格式。

为了避免技能在不同平台失效，建议把元数据写得更“工程化”，例如：

owner：负责人或维护人，便于追踪责任。
version：语义化版本号，避免“无感变更”。
tools：允许调用的工具或能力清单。
permissions：允许访问的文件、网络或系统范围。
test_cases：最小可测集的输入与预期输出。

这些字段并不是必须，但它们可以显著提升可维护性与协作效率，尤其适合团队级的 Skill 资产库。

常见的两种目录形态如下：

# 项目级：随仓库版本控制，团队共享
<workspace-root>/.agent/skills/invoice-dedup/SKILL.md

# 全局级：你本机所有项目可用
~/.gemini/antigravity/skills/invoice-dedup/SKILL.md

这一结构的价值在于：迁移成本极低、协作成本极低。只要团队约定好命名与触发规则，就能把“个人经验”沉淀为“团队资产”。

命名上建议使用“动词-对象”的方式，比如 invoice-dedup、contract-risk-check，并统一使用小写与短横线，避免不同平台对大小写敏感导致的加载失败。

兼容性验证：用四类“陷阱”做最小可测集

如果你希望 Skill 可以跨平台复用，就不能只写“成功案例”，还要写“失败护栏”。一个可迁移的 Skill 应该先通过四类基础验证：

识别触发：能否正确命中 skill 的意图并加载对应文件。
复杂元数据：能否正确解析多层 YAML（规则、标签、版本、限制）。
严格结构输出：能否只输出纯 JSON/CSV 等，不夹杂解释或 Markdown。
文件生成能力：能否按约定路径创建文件并完成回写。

建议用一套最小测试集做“平台对齐基线”。你可以把这些测试 Skill 放在一个 skills-test 目录里，作为每次迁移或升级时的回归套件。

评估与指标：如何量化 Skill 的稳定性

很多团队写了 Skill，却无法判断“它到底稳定不稳定”。建议建立一套轻量指标体系，至少覆盖以下五类：

命中率：多少任务被正确触发并加载 Skill。
结构合规率：输出是否满足 JSON/表格等结构要求。
失败分流率：缺少关键信息时是否正确进入“待补充”分支。
人工复核率：需要人工修正的比例是否在可控范围。
平均耗时：完成任务所需时间是否可接受。

只要记录 2-4 周，就能发现哪些 Skill “稳定可复用”，哪些仅适合作为“探索模板”。这会直接影响你在 Gemini 3.0 的工作流里该优先固化哪些场景。

如果有条件，给每个 Skill 配一份简单的评估表，把“命中率、结构合规率、人工复核率”三项放在首页，形成周度复盘习惯。这样能持续优化，而不是靠主观感受决定是否继续使用。

面向中文业务的 Skill 设计框架

在中文场景里，Skills 的难点不是“写指令”，而是“写规则”。以下是更稳定的设计框架：

任务边界：明确“做什么、不做什么”。把不可执行的范围写在最前面。
输入约束：统一输入格式，必要时要求字段名、图片格式、文件命名。
关键规则：用编号列出强制规则，避免模型“自己发挥”。
输出结构：明确输出模板、字段类型、排序、去重策略。
质检步骤：在输出前进行自检，核对关键字段与长度阈值。
失败回退：缺少关键信息时，返回待补充清单而不是“猜”。

如果你要在 gemini 国内使用 的环境部署 Skills，建议把网络与权限信息也写进 Skill 说明，例如“禁止调用不可达的外部 API”“本地文件不得外传”等。

多模态与工具编排：把 Skill 写成“流程图”

Gemini 3.0 的优势在于多模态，但多模态并不等于“随便用”。一个高质量 Skill 应该明确“何时用文本、何时用图像、何时用结构化表格”，并把这些选择写成流程。最稳妥的做法是先做输入分流，再做工具调用，最后做结构化输出。

你可以把 Skill 的执行过程想象成一张流程图，通常包含四段：

识别：判断输入类型（文档、图片、音频、表格）。
结构化：抽取字段并统一格式（时间、金额、编号）。
校验：做规则检查与异常标记（缺失字段、重复记录）。
汇总：输出结构化结果，附带可复核的证据字段。

当你把“流程图”写进 Skill 后，模型就不再凭感觉回答，而是按步骤执行。这对复杂任务尤其关键，比如合同条款抽取、投研要点整理或多图表比对。

安全与合规：中文企业常见红线

中文业务里，Skill 的合规问题往往比模型能力更重要，尤其是涉及财务、人事、客户数据时。以下是常见红线与建议写法：

个人信息：明确“不得输出身份证号、银行卡号、手机号”等敏感字段。
数据驻留：如需本地处理，注明“不得上传外部云端”。
版权与合规：禁止生成未经授权的报告或第三方内部资料。
访问权限：限定可访问的目录和文件类型，防止越权读取。

这些规则建议写在 Skill 的“约束”部分，并在输出前做一次合规自检，确保模型不会“好心办坏事”。

实战案例：发票去重 Skill（含 Prompt + 规则）

下面是一个适合中文业务的发票去重 Skill，核心思路不是“视觉相似度”，而是通过 OCR 提取交易号，再做模糊匹配与分组输出。

---
name: invoice-dedup
description: 通过 OCR 提取交易号识别重复发票
when_to_use: 需要筛选重复发票或交易号疑似相同
input:
  - 发票图片（jpg/png），或已识别文本
output:
  - 重复分组清单（JSON 数组）
---

## 目标
识别交易号重复或高度相似的发票，并输出可核查的分组结果。

## 步骤
1. OCR 识别发票文本，提取候选交易号（20-30 位数字）。
2. 规则清洗：去空格、去分隔符，统一为纯数字。
3. 模糊匹配：对编辑距离 <= 2 的交易号视为同组候选。
4. 输出分组：每组列出原始文件名、交易号、相似度说明。

## 约束
- 不允许仅凭背景或版式相似判断重复。
- 当交易号缺失时，输出“待补充信息”的文件列表。
- 输出必须为纯 JSON，不要任何说明文字。

这个 Skill 的关键在于“规则优先”：它把可解释的业务规则写成硬约束，让模型无法用“看起来像”来替代“事实一致”。你也可以在此基础上增加“人工复核标记”字段，保证在财务场景里可追溯、可审计。

为了便于落地，可以在 Skill 附一段示例说明：给出 3 张发票图片，其中 2 张交易号仅差 1 位数字；预期输出分为 2 组，一组标记“疑似重复”，另一组标记“需人工确认”。这种“输入-输出对照”能显著降低新成员的理解成本。

版本化与生态建设：从个人复用到团队资产

当 Skills 开始多起来，建议把它们当成产品进行版本管理：

语义化版本号：1.0.0 表示稳定版本，1.1.0 表示新增规则。
变更日志：记录规则调整的原因与影响范围。
质量门槛：设定最低通过率（解析/输出/落盘），未通过不发布。
评审机制：关键 Skill 需要双人审阅，避免“错误共识”。

在团队层面，最好维护一个“Skill 索引页”，把场景、输入、输出和责任人写清楚。这样可以避免重复造轮子，也方便新人直接复用。

国内落地路径与行动清单

如果你在评估“官方入口 + 镜像入口”的组合路线，可以这样做：

先用 gemini官网 的文档标准化 Skill 结构，再把同一套 Skill 迁移到 gemini镜像站 环境，验证兼容性。
把高频业务（发票、合同、投研、客服）拆成独立 Skill，优先固化“错误高发”的环节。
建立“Skill 回归测试包”，每次升级 Gemini 版本或工具版本都跑一遍。
对外发布时，配套给出示例输入与期望输出，降低复用门槛。

同时注意三个常见坑：一是把 Skill 写成“长提示词”，缺少明确规则；二是权限过宽，导致安全边界失控；三是没有回退逻辑，信息缺失时仍强行输出。把这三点写进规范里，能明显减少上线后的返工。

如果你希望更快完成国内部署，可以直接从 gemini中文版 入口进行测试与上线，并在收尾阶段把成果沉淀到 AIMirror Gemini 中文站 的团队规范里，形成可持续更新的技能库。

腾讯新闻：实测 Agent Skills，一次编写，全网通用（访问日期：2026-01-26） ↩︎

为什么 Skills 会成为 Gemini 3.0 的“第二层能力”#

Prompt 与 Skill 的差异：从“对话技巧”到“可迁移资产”#

Skills 的最小结构与目录规范#

兼容性验证：用四类“陷阱”做最小可测集#

评估与指标：如何量化 Skill 的稳定性#

面向中文业务的 Skill 设计框架#

多模态与工具编排：把 Skill 写成“流程图”#

安全与合规：中文企业常见红线#

实战案例：发票去重 Skill（含 Prompt + 规则）#

版本化与生态建设：从个人复用到团队资产#

国内落地路径与行动清单#