Prompt Engineering

主要给"写 prompt 的人"看的工程指南。不重复 Anthropic / OpenAI 官方原文，但把跨厂商共识、学术证据、Agent Harness 场景下的实战约定整合成一套可对照的清单。

为什么单独开一章

Prompt 写作是 Agent Harness、Skill 设计、Workflow 编排的底层能力。模型默认不会写出好 prompt——它只会按训练分布给出"看起来还行"的版本。真正可靠的 prompt 来自把官方建议、学术结论、踩坑经验对照成显式规则，而不是凭直觉。

本章不绑定任何具体业务，所有原则来自当前主流厂商实时官方文档（2026-05 verified）：

Anthropic — Prompting best practices / Migration guide / Agent Skills best practices / Structured Outputs / Prompt caching（含 Claude Opus 4.7 / Sonnet 4.6 / Haiku 4.5 模型特性、effort / adaptive thinking / task_budget 等新参数）
OpenAI — GPT-5 Prompting Guide（reasoning_effort / verbosity / tool preambles / metaprompting / Responses API）
Google — Gemini API Prompting strategies（Gemini 3）
阿里云百炼 / DeepSeek / 智谱 GLM 官方 JSON Mode 文档（含 verbatim 报错信息 + 已知问题）
Liu et al. 2023, Lost in the Middle（TACL 2024）
Willard & Louf 2023, Efficient Guided Generation（Outlines）

每条引用都在各章末尾标注一手来源链接。

章节	解决什么问题	何时读
核心原则	Prompt 工程的 10 条跨厂商共识 + 学术底座	入门、想理解"为什么这样写"、做评审时回来对照
通用写作规范	文字层面怎么遣词造句、避免常见错误	每次写新 prompt、改旧 prompt
SKILL.md 作者指南	写 Agent Skill 的 frontmatter / progressive disclosure / 自由度	写或改 `.claude/skills/*/SKILL.md`
长上下文 + 结构化 + Caching	长文档喂模型、JSON / schema 输出、prompt caching、各厂商 quirks	输入 > 10k token、需要 JSON 输出、跨多家模型部署
模型差异与新参数	Claude 4.7 / GPT-5 / Gemini 3 各自的特殊行为与 effort / reasoning_effort / verbosity 等	升级模型、跨厂商部署、prompt 在新模型上行为变了
Prompt vs 工程约束	哪些"必须"该写进 prompt、哪些该写进代码	设计 pipeline 时、prompt 已堆满"必须"还是出错时

Harness / Context 设计 讲 CLAUDE.md 是什么、放什么；本章讲 怎么遣词造句 才能让模型听话。两者互补：先决定写什么（context-design），再决定怎么写（本章）。
Harness / 自进化 讲怎么从失败中迭代 prompt 规则；本章是迭代时的对照标尺。
Skills 知识中枢 评测的是别人写的 Skill；本章是你自己写新 Skill 时的指南。

Prompt 是给一个聪明但字面执行的同事写的工作交接单——他不读你的过往邮件、不知道项目历史、不会替你脑补隐含意图，但你写下的每个字他都会认真当真。