提示工程进阶：让 AI 像专家一样思考 - 博客

思维链、角色扮演、少样本学习——这些听起来高大上的技巧，其实很好用。学会它们，你就能解锁 AI 的真正潜力。

课程概述

基础提示词课教你"把话说清楚"。这门课更进一步——教你让 AI 像专家一样思考。

你会学到提示工程中经过验证的进阶技巧：思维链、少样本学习、角色扮演的深度用法、提示词模板化。学完这门课，你写的提示词质量将进入前 5%。

学习目标

掌握思维链提示（Chain-of-Thought）的三种变体
学会用少样本学习（Few-Shot）让 AI 快速适配你的任务格式
理解为什么"角色越具体，回答越专业"的深层机制
能设计可复用的提示词模板
了解提示工程的局限——哪些问题靠提示词解决不了

课程内容

1. 思维链（Chain-of-Thought）——让 AI "先想再说"

核心发现：

2022 年，Google 研究员在论文中做了一个关键实验。他们在提问时加了一句话："Let's think step by step"（让我们一步一步思考）。结果，GPT-3 在数学推理题上的准确率提升了 40% 以上。

为什么？LLM 是逐词生成的。当你让它直接给答案，它必须在一个词内"跳到"结论——而复杂的推理需要中间步骤。当你让它"一步一步想"，它先写推理过程，再写答案——每一步的概率都比跨步跳跃高很多。

三种思维链技巧：

① 零样本思维链（Zero-shot CoT）

最简单——加一句咒语：

普通："一个水池进水口 3 小时灌满，出水口 5 小时放空，同时打开要多久灌满？" 加上咒语："一个水池进水口 3 小时灌满，出水口 5 小时放空，同时打开要多久灌满？请一步一步思考。"

咒语不需要复杂。"请一步一步思考"、"先分析再回答"、"请展示你的推理过程"——效果类似。

② 少样本思维链（Few-shot CoT）

给 AI 看一个"先推理再给答案"的示范：

问题：小明有 5 个苹果，给了小红 2 个，又买了 3 个，还剩几个？
推理：小明开始有 5 个。给了小红 2 个，剩下 5-2=3 个。又买了 3 个，所以 3+3=6 个。答案是 6。
问题：一个班有 40 个学生，60% 是女生，女生中有 25% 戴眼镜。戴眼镜的女生有多少人？

AI 会模仿这个格式——先写推理，再给答案。准确性大幅提升。

③ 思维树（Tree-of-Thought）

对复杂问题的终极武器：不是沿着一条路推理到底，而是让 AI 在每一步探索多个可能的思路。

问题：我该如何推进我的职业转型？（目前是会计，想做 AI 产品经理）

请按以下步骤思考：
Step 1：列出 3 条可能的转型路径
Step 2：对每条路径，分析优势和风险
Step 3：对每条路径，评估所需时间和投入
Step 4：综合对比，给出建议排序

这样 AI 不是给出一个直白的答案，而是做了多维度的分析。

思维链为什么有效？

因为 LLM 是"下一个词预测机"。复杂推理需要 20 步——每一步直接从问题跳到答案的"概率跳跃"风险极大。而思维链让模型每一步都建立在上一步的推理上，每一步的预测都更"有据可依"。

什么情况下思维链最有效？

数学推理、逻辑推理
多步骤分析和规划
"为什么"型解释问题
比较和决策分析

2. 少样本学习（Few-Shot Learning）——用例子说话

原理：

LLM 有一个强大但被低估的能力：从上下文中即时学习模式。你不需要重新训练模型——你只需要在提示词里给几个例子，它就能完成格式、风格、逻辑的快速适配。

经典案例：

你想让 AI 把"消极表达"重写成"积极表达"：

你的任务：将消极表达的句子改写成积极表达。

输入：这个方案行不通
输出：这个方案需要调整，我们来看看哪里可以优化

输入：这太难了，我学不会
输出：这确实有挑战，但我可以一步步来

输入：他不回我消息，肯定生我气了
输出：

AI 会模仿——不仅模仿格式（输入→输出），还模仿"转化策略"（消极→改进方向/挑战→一步步/猜测→不一定）。

少样本的设计原则：

例子数量：3-5 个最佳。 1 个不够（模式不清晰），10 个浪费（边际收益递减）
例子要覆盖边缘情况。 不只是"标准案例"，还要有"困难案例"
例子质量比数量重要。 3 个精心挑选的例子 > 10 个平庸的例子
例子的顺序重要。 从简单到困难排列，让 AI 逐步升温

少样本 vs 微调：

	少样本学习	模型微调
实现方式	在提示词中给例子	用数据集重新训练
成本	零	需要算力和时间
效果	临时适配	永久改变模型行为
适用场景	偶发任务、快速原型	高频重复、需要一致性的任务

对 99% 的人来说，少样本学习足够用了。

3. 角色扮演的深层用法

基础课讲了"给 AI 一个角色"。这里讲更深层的用法。

角色不只是"职位"——是"思维框架"。

差的角色设定：> "你是一名医生。"

好的角色设定：> "你是一名在三甲医院急诊科工作 15 年的副主任医师，每天处理 50+ 个急症病例，擅长在信息不完整时快速做出鉴别诊断。你习惯用排除法思考，先说最危险的几种可能性再说常见病因。带过 30 多个实习生，所以解释时擅长用比喻——学生反馈最好的是'听完你讲，我才真懂了'。"

差别在哪？第二个设定了：

知识范围： 急诊科，不是所有科
思维习惯： 排除法，先排除危险的
表达风格： 用比喻，学生听得懂
经验深度： 15 年，50000+ 病例

这些细节直接影响了 AI 的输出——不是泛泛的医学回答，而是有急诊科医生特有的紧迫感和系统性的回答。

角色的三个层次：

层次	你告诉 AI	对输出的影响
身份	是什么角色	知识领域和语气基调
思维习惯	怎么思考	分析框架和推理方式
表达风格	怎么说话	用词、句式、可读性

大多数人的角色设定只停留在第一层。

进阶技巧：角色 + 受众 = 精准适配

同时设定两个角色——说话的人和听话的人：

"你是一名资深理财顾问（角色），正在跟一位刚入职场的 22 岁年轻人（受众）解释什么是复利。这位年轻人数学不好，但对'钱生钱'这个概念很感兴趣。请用他能理解的语言和例子来解释。"

AI 会自动做"信息降维"——把专业知识转化成受众能听懂的语言。

4. 打造你的提示词工具箱

模板 1：Socratic 提问

你正在帮我思考[主题/问题]。
不要直接给我答案。像苏格拉底一样，通过提问引导我自己找到答案。
每次只问一个问题，等我回答后再继续。
开始。

模板 2：多视角分析

从以下 3 个视角分别分析[问题]：
1. [视角1，如 CEO 视角]：关心什么？会怎么看？
2. [视角2，如 用户视角]：关心什么？会有什么体验？
3. [视角3，如 技术视角]：关心什么？有什么可行性问题？
每个视角给出 2-3 个核心观点。

模板 3：对抗性审查

你是我的"魔鬼代言人"。请对以下方案进行最严格的挑战：
- 找出 3 个最可能失败的假设
- 指出我们没有考虑到的最大风险
- 如果你是一个竞争对手，你会如何利用这个方案的弱点？
不要客气，现在开始。

5. 提示工程的边界——什么靠提示词也解决不了

提示词不是万能的。以下情况不要再优化提示词了——方向已经错了：

模型本身能力不够。 一个 7B 的模型，你再好的提示词也不会让它达到 GPT-4 的水平。换模型比优化提示词更有效
任务需要外部信息。 AI 不知道你公司内部数据。提示词再精准，数据不在训练集中也无解。这时候需要 RAG（检索增强生成）或工具调用
任务需要确定性的正确。 比如财务计算、合规审查——AI 本质是概率性的。用专门的工具或 API，不要用 LLM
上下文太长。 对话超过几十轮后，模型开始"遗忘"早期信息。这不是提示词问题，是架构限制。开新对话或分段处理

黄金法则：如果同样的问题问了 3 次还不对——问题不在提示词，在别处。

实操练习

思维链实验（10 分钟）： 找一个你之前觉得 AI 回答不够深入的复杂问题。加一句"请一步一步思考"重新提问。对比两次回答的深度和准确性。
少样本练习（10 分钟）： 设计一个你经常需要 AI 做的重复性任务。写 3 个高质量的例子，测试只靠"任务描述"vs"任务描述 + 3 个例子"的差异。
角色深度设定（10 分钟）： 选一个你所在行业的专业角色。先写一个"一句话角色"，再写一个"三层次角色（身份+思维习惯+表达风格）"。用同一个问题测试。

总结

提示工程的进阶之路不是学更多"咒语"，而是理解 LLM 的工作方式：

思维链利用了 LLM 逐词生成的特点，让推理过程降低每一步的概率错误
少样本学习利用了 LLM 的上下文学习能力，用例子代替指令
深度角色扮演利用了 LLM 的模式匹配，让它获取更精准的语料风格

最好的提示工程师不是"会念咒语的人"，而是最理解模型工作原理的人。