入门 阅读约 7 分钟· 课时 30分钟

提示工程进阶:让 AI 像专家一样思考

思维链、角色扮演、少样本学习——这些听起来高大上的技巧,其实很好用。学会它们,你就能解锁 AI 的真正潜力。

提示工程进阶:让 AI 像专家一样思考

课程概述

基础提示词课教你"把话说清楚"。这门课更进一步——教你让 AI 像专家一样思考。

你会学到提示工程中经过验证的进阶技巧:思维链、少样本学习、角色扮演的深度用法、提示词模板化。学完这门课,你写的提示词质量将进入前 5%。

学习目标

  • 掌握思维链提示(Chain-of-Thought)的三种变体
  • 学会用少样本学习(Few-Shot)让 AI 快速适配你的任务格式
  • 理解为什么"角色越具体,回答越专业"的深层机制
  • 能设计可复用的提示词模板
  • 了解提示工程的局限——哪些问题靠提示词解决不了

课程内容

1. 思维链(Chain-of-Thought)——让 AI "先想再说"

核心发现:

2022 年,Google 研究员在论文中做了一个关键实验。他们在提问时加了一句话:"Let's think step by step"(让我们一步一步思考)。结果,GPT-3 在数学推理题上的准确率提升了 40% 以上。

为什么?LLM 是逐词生成的。当你让它直接给答案,它必须在一个词内"跳到"结论——而复杂的推理需要中间步骤。当你让它"一步一步想",它先写推理过程,再写答案——每一步的概率都比跨步跳跃高很多。

三种思维链技巧:

① 零样本思维链(Zero-shot CoT)

最简单——加一句咒语:

普通:"一个水池进水口 3 小时灌满,出水口 5 小时放空,同时打开要多久灌满?" 加上咒语:"一个水池进水口 3 小时灌满,出水口 5 小时放空,同时打开要多久灌满?请一步一步思考。"

咒语不需要复杂。"请一步一步思考"、"先分析再回答"、"请展示你的推理过程"——效果类似。

② 少样本思维链(Few-shot CoT)

给 AI 看一个"先推理再给答案"的示范:

问题:小明有 5 个苹果,给了小红 2 个,又买了 3 个,还剩几个?
推理:小明开始有 5 个。给了小红 2 个,剩下 5-2=3 个。又买了 3 个,所以 3+3=6 个。答案是 6。
问题:一个班有 40 个学生,60% 是女生,女生中有 25% 戴眼镜。戴眼镜的女生有多少人?

AI 会模仿这个格式——先写推理,再给答案。准确性大幅提升。

③ 思维树(Tree-of-Thought)

对复杂问题的终极武器:不是沿着一条路推理到底,而是让 AI 在每一步探索多个可能的思路。

问题:我该如何推进我的职业转型?(目前是会计,想做 AI 产品经理)

请按以下步骤思考:
Step 1:列出 3 条可能的转型路径
Step 2:对每条路径,分析优势和风险
Step 3:对每条路径,评估所需时间和投入
Step 4:综合对比,给出建议排序

这样 AI 不是给出一个直白的答案,而是做了多维度的分析。

思维链为什么有效?

因为 LLM 是"下一个词预测机"。复杂推理需要 20 步——每一步直接从问题跳到答案的"概率跳跃"风险极大。而思维链让模型每一步都建立在上一步的推理上,每一步的预测都更"有据可依"。

什么情况下思维链最有效?

  • 数学推理、逻辑推理
  • 多步骤分析和规划
  • "为什么"型解释问题
  • 比较和决策分析

2. 少样本学习(Few-Shot Learning)——用例子说话

原理:

LLM 有一个强大但被低估的能力:从上下文中即时学习模式。你不需要重新训练模型——你只需要在提示词里给几个例子,它就能完成格式、风格、逻辑的快速适配。

经典案例:

你想让 AI 把"消极表达"重写成"积极表达":

你的任务:将消极表达的句子改写成积极表达。

输入:这个方案行不通
输出:这个方案需要调整,我们来看看哪里可以优化

输入:这太难了,我学不会
输出:这确实有挑战,但我可以一步步来

输入:他不回我消息,肯定生我气了
输出:

AI 会模仿——不仅模仿格式(输入→输出),还模仿"转化策略"(消极→改进方向/挑战→一步步/猜测→不一定)。

少样本的设计原则:

  1. 例子数量:3-5 个最佳。 1 个不够(模式不清晰),10 个浪费(边际收益递减)
  2. 例子要覆盖边缘情况。 不只是"标准案例",还要有"困难案例"
  3. 例子质量比数量重要。 3 个精心挑选的例子 > 10 个平庸的例子
  4. 例子的顺序重要。 从简单到困难排列,让 AI 逐步升温

少样本 vs 微调:

少样本学习模型微调
实现方式在提示词中给例子用数据集重新训练
成本需要算力和时间
效果临时适配永久改变模型行为
适用场景偶发任务、快速原型高频重复、需要一致性的任务

对 99% 的人来说,少样本学习足够用了。

3. 角色扮演的深层用法

基础课讲了"给 AI 一个角色"。这里讲更深层的用法。

角色不只是"职位"——是"思维框架"。

差的角色设定:> "你是一名医生。"

好的角色设定:> "你是一名在三甲医院急诊科工作 15 年的副主任医师,每天处理 50+ 个急症病例,擅长在信息不完整时快速做出鉴别诊断。你习惯用排除法思考,先说最危险的几种可能性再说常见病因。带过 30 多个实习生,所以解释时擅长用比喻——学生反馈最好的是'听完你讲,我才真懂了'。"

差别在哪?第二个设定了:

  • 知识范围: 急诊科,不是所有科
  • 思维习惯: 排除法,先排除危险的
  • 表达风格: 用比喻,学生听得懂
  • 经验深度: 15 年,50000+ 病例

这些细节直接影响了 AI 的输出——不是泛泛的医学回答,而是有急诊科医生特有的紧迫感和系统性的回答。

角色的三个层次:

层次你告诉 AI对输出的影响
身份是什么角色知识领域和语气基调
思维习惯怎么思考分析框架和推理方式
表达风格怎么说话用词、句式、可读性

大多数人的角色设定只停留在第一层。

进阶技巧:角色 + 受众 = 精准适配

同时设定两个角色——说话的人和听话的人:

"你是一名资深理财顾问(角色),正在跟一位刚入职场的 22 岁年轻人(受众)解释什么是复利。这位年轻人数学不好,但对'钱生钱'这个概念很感兴趣。请用他能理解的语言和例子来解释。"

AI 会自动做"信息降维"——把专业知识转化成受众能听懂的语言。

4. 打造你的提示词工具箱

模板 1:Socratic 提问

你正在帮我思考[主题/问题]。
不要直接给我答案。像苏格拉底一样,通过提问引导我自己找到答案。
每次只问一个问题,等我回答后再继续。
开始。

模板 2:多视角分析

从以下 3 个视角分别分析[问题]:
1. [视角1,如 CEO 视角]:关心什么?会怎么看?
2. [视角2,如 用户视角]:关心什么?会有什么体验?
3. [视角3,如 技术视角]:关心什么?有什么可行性问题?
每个视角给出 2-3 个核心观点。

模板 3:对抗性审查

你是我的"魔鬼代言人"。请对以下方案进行最严格的挑战:
- 找出 3 个最可能失败的假设
- 指出我们没有考虑到的最大风险
- 如果你是一个竞争对手,你会如何利用这个方案的弱点?
不要客气,现在开始。

5. 提示工程的边界——什么靠提示词也解决不了

提示词不是万能的。以下情况不要再优化提示词了——方向已经错了:

  1. 模型本身能力不够。 一个 7B 的模型,你再好的提示词也不会让它达到 GPT-4 的水平。换模型比优化提示词更有效
  2. 任务需要外部信息。 AI 不知道你公司内部数据。提示词再精准,数据不在训练集中也无解。这时候需要 RAG(检索增强生成)或工具调用
  3. 任务需要确定性的正确。 比如财务计算、合规审查——AI 本质是概率性的。用专门的工具或 API,不要用 LLM
  4. 上下文太长。 对话超过几十轮后,模型开始"遗忘"早期信息。这不是提示词问题,是架构限制。开新对话或分段处理

黄金法则:如果同样的问题问了 3 次还不对——问题不在提示词,在别处。

实操练习

  1. 思维链实验(10 分钟): 找一个你之前觉得 AI 回答不够深入的复杂问题。加一句"请一步一步思考"重新提问。对比两次回答的深度和准确性。

  2. 少样本练习(10 分钟): 设计一个你经常需要 AI 做的重复性任务。写 3 个高质量的例子,测试只靠"任务描述"vs"任务描述 + 3 个例子"的差异。

  3. 角色深度设定(10 分钟): 选一个你所在行业的专业角色。先写一个"一句话角色",再写一个"三层次角色(身份+思维习惯+表达风格)"。用同一个问题测试。

总结

提示工程的进阶之路不是学更多"咒语",而是理解 LLM 的工作方式:

  1. 思维链利用了 LLM 逐词生成的特点,让推理过程降低每一步的概率错误
  2. 少样本学习利用了 LLM 的上下文学习能力,用例子代替指令
  3. 深度角色扮演利用了 LLM 的模式匹配,让它获取更精准的语料风格

最好的提示工程师不是"会念咒语的人",而是最理解模型工作原理的人。