思维链、角色扮演、少样本学习——这些听起来高大上的技巧,其实很好用。学会它们,你就能解锁 AI 的真正潜力。
课程概述
基础提示词课教你"把话说清楚"。这门课更进一步——教你让 AI 像专家一样思考。
你会学到提示工程中经过验证的进阶技巧:思维链、少样本学习、角色扮演的深度用法、提示词模板化。学完这门课,你写的提示词质量将进入前 5%。
学习目标
- 掌握思维链提示(Chain-of-Thought)的三种变体
- 学会用少样本学习(Few-Shot)让 AI 快速适配你的任务格式
- 理解为什么"角色越具体,回答越专业"的深层机制
- 能设计可复用的提示词模板
- 了解提示工程的局限——哪些问题靠提示词解决不了
课程内容
1. 思维链(Chain-of-Thought)——让 AI "先想再说"
核心发现:
2022 年,Google 研究员在论文中做了一个关键实验。他们在提问时加了一句话:"Let's think step by step"(让我们一步一步思考)。结果,GPT-3 在数学推理题上的准确率提升了 40% 以上。
为什么?LLM 是逐词生成的。当你让它直接给答案,它必须在一个词内"跳到"结论——而复杂的推理需要中间步骤。当你让它"一步一步想",它先写推理过程,再写答案——每一步的概率都比跨步跳跃高很多。
三种思维链技巧:
① 零样本思维链(Zero-shot CoT)
最简单——加一句咒语:
普通:"一个水池进水口 3 小时灌满,出水口 5 小时放空,同时打开要多久灌满?" 加上咒语:"一个水池进水口 3 小时灌满,出水口 5 小时放空,同时打开要多久灌满?请一步一步思考。"
咒语不需要复杂。"请一步一步思考"、"先分析再回答"、"请展示你的推理过程"——效果类似。
② 少样本思维链(Few-shot CoT)
给 AI 看一个"先推理再给答案"的示范:
问题:小明有 5 个苹果,给了小红 2 个,又买了 3 个,还剩几个?
推理:小明开始有 5 个。给了小红 2 个,剩下 5-2=3 个。又买了 3 个,所以 3+3=6 个。答案是 6。
问题:一个班有 40 个学生,60% 是女生,女生中有 25% 戴眼镜。戴眼镜的女生有多少人?
AI 会模仿这个格式——先写推理,再给答案。准确性大幅提升。
③ 思维树(Tree-of-Thought)
对复杂问题的终极武器:不是沿着一条路推理到底,而是让 AI 在每一步探索多个可能的思路。
问题:我该如何推进我的职业转型?(目前是会计,想做 AI 产品经理)
请按以下步骤思考:
Step 1:列出 3 条可能的转型路径
Step 2:对每条路径,分析优势和风险
Step 3:对每条路径,评估所需时间和投入
Step 4:综合对比,给出建议排序
这样 AI 不是给出一个直白的答案,而是做了多维度的分析。
思维链为什么有效?
因为 LLM 是"下一个词预测机"。复杂推理需要 20 步——每一步直接从问题跳到答案的"概率跳跃"风险极大。而思维链让模型每一步都建立在上一步的推理上,每一步的预测都更"有据可依"。
什么情况下思维链最有效?
- 数学推理、逻辑推理
- 多步骤分析和规划
- "为什么"型解释问题
- 比较和决策分析
2. 少样本学习(Few-Shot Learning)——用例子说话
原理:
LLM 有一个强大但被低估的能力:从上下文中即时学习模式。你不需要重新训练模型——你只需要在提示词里给几个例子,它就能完成格式、风格、逻辑的快速适配。
经典案例:
你想让 AI 把"消极表达"重写成"积极表达":
你的任务:将消极表达的句子改写成积极表达。
输入:这个方案行不通
输出:这个方案需要调整,我们来看看哪里可以优化
输入:这太难了,我学不会
输出:这确实有挑战,但我可以一步步来
输入:他不回我消息,肯定生我气了
输出:
AI 会模仿——不仅模仿格式(输入→输出),还模仿"转化策略"(消极→改进方向/挑战→一步步/猜测→不一定)。
少样本的设计原则:
- 例子数量:3-5 个最佳。 1 个不够(模式不清晰),10 个浪费(边际收益递减)
- 例子要覆盖边缘情况。 不只是"标准案例",还要有"困难案例"
- 例子质量比数量重要。 3 个精心挑选的例子 > 10 个平庸的例子
- 例子的顺序重要。 从简单到困难排列,让 AI 逐步升温
少样本 vs 微调:
| 少样本学习 | 模型微调 | |
|---|---|---|
| 实现方式 | 在提示词中给例子 | 用数据集重新训练 |
| 成本 | 零 | 需要算力和时间 |
| 效果 | 临时适配 | 永久改变模型行为 |
| 适用场景 | 偶发任务、快速原型 | 高频重复、需要一致性的任务 |
对 99% 的人来说,少样本学习足够用了。
3. 角色扮演的深层用法
基础课讲了"给 AI 一个角色"。这里讲更深层的用法。
角色不只是"职位"——是"思维框架"。
差的角色设定:> "你是一名医生。"
好的角色设定:> "你是一名在三甲医院急诊科工作 15 年的副主任医师,每天处理 50+ 个急症病例,擅长在信息不完整时快速做出鉴别诊断。你习惯用排除法思考,先说最危险的几种可能性再说常见病因。带过 30 多个实习生,所以解释时擅长用比喻——学生反馈最好的是'听完你讲,我才真懂了'。"
差别在哪?第二个设定了:
- 知识范围: 急诊科,不是所有科
- 思维习惯: 排除法,先排除危险的
- 表达风格: 用比喻,学生听得懂
- 经验深度: 15 年,50000+ 病例
这些细节直接影响了 AI 的输出——不是泛泛的医学回答,而是有急诊科医生特有的紧迫感和系统性的回答。
角色的三个层次:
| 层次 | 你告诉 AI | 对输出的影响 |
|---|---|---|
| 身份 | 是什么角色 | 知识领域和语气基调 |
| 思维习惯 | 怎么思考 | 分析框架和推理方式 |
| 表达风格 | 怎么说话 | 用词、句式、可读性 |
大多数人的角色设定只停留在第一层。
进阶技巧:角色 + 受众 = 精准适配
同时设定两个角色——说话的人和听话的人:
"你是一名资深理财顾问(角色),正在跟一位刚入职场的 22 岁年轻人(受众)解释什么是复利。这位年轻人数学不好,但对'钱生钱'这个概念很感兴趣。请用他能理解的语言和例子来解释。"
AI 会自动做"信息降维"——把专业知识转化成受众能听懂的语言。
4. 打造你的提示词工具箱
模板 1:Socratic 提问
你正在帮我思考[主题/问题]。
不要直接给我答案。像苏格拉底一样,通过提问引导我自己找到答案。
每次只问一个问题,等我回答后再继续。
开始。
模板 2:多视角分析
从以下 3 个视角分别分析[问题]:
1. [视角1,如 CEO 视角]:关心什么?会怎么看?
2. [视角2,如 用户视角]:关心什么?会有什么体验?
3. [视角3,如 技术视角]:关心什么?有什么可行性问题?
每个视角给出 2-3 个核心观点。
模板 3:对抗性审查
你是我的"魔鬼代言人"。请对以下方案进行最严格的挑战:
- 找出 3 个最可能失败的假设
- 指出我们没有考虑到的最大风险
- 如果你是一个竞争对手,你会如何利用这个方案的弱点?
不要客气,现在开始。
5. 提示工程的边界——什么靠提示词也解决不了
提示词不是万能的。以下情况不要再优化提示词了——方向已经错了:
- 模型本身能力不够。 一个 7B 的模型,你再好的提示词也不会让它达到 GPT-4 的水平。换模型比优化提示词更有效
- 任务需要外部信息。 AI 不知道你公司内部数据。提示词再精准,数据不在训练集中也无解。这时候需要 RAG(检索增强生成)或工具调用
- 任务需要确定性的正确。 比如财务计算、合规审查——AI 本质是概率性的。用专门的工具或 API,不要用 LLM
- 上下文太长。 对话超过几十轮后,模型开始"遗忘"早期信息。这不是提示词问题,是架构限制。开新对话或分段处理
黄金法则:如果同样的问题问了 3 次还不对——问题不在提示词,在别处。
实操练习
-
思维链实验(10 分钟): 找一个你之前觉得 AI 回答不够深入的复杂问题。加一句"请一步一步思考"重新提问。对比两次回答的深度和准确性。
-
少样本练习(10 分钟): 设计一个你经常需要 AI 做的重复性任务。写 3 个高质量的例子,测试只靠"任务描述"vs"任务描述 + 3 个例子"的差异。
-
角色深度设定(10 分钟): 选一个你所在行业的专业角色。先写一个"一句话角色",再写一个"三层次角色(身份+思维习惯+表达风格)"。用同一个问题测试。
总结
提示工程的进阶之路不是学更多"咒语",而是理解 LLM 的工作方式:
- 思维链利用了 LLM 逐词生成的特点,让推理过程降低每一步的概率错误
- 少样本学习利用了 LLM 的上下文学习能力,用例子代替指令
- 深度角色扮演利用了 LLM 的模式匹配,让它获取更精准的语料风格
最好的提示工程师不是"会念咒语的人",而是最理解模型工作原理的人。