Token是使用AI大模型的基础计费单位。本文用最通俗的方式解释什么是Token、如何计算、怎么省钱,让你明明白白用AI。
Token是什么?
Token是大语言模型理解和生成文本的最小单位。你可以把它理解为AI的"字"或"单词碎片"。
Token不是字,也不是词
中文世界里:
- "我爱中国" = 4个字
- 但AI可能处理为 3-5 个 Token(取决于分词器)
英文世界里:
- "I love AI" = 3个词
- 但AI处理为 3-4 个 Token
经验规则:
- 1个中文字 ≈ 1-2个Token
- 1个英文单词 ≈ 1-2个Token
- 1000个中文字 ≈ 1500-2000个Token
为什么要用Token计费?
AI大模型运行在GPU服务器上,每次对话都消耗算力。Token是衡量算力消耗最准确的方式:
- 输入100字的提问 ≈ 150 Token的算力
- 输出500字的回答 ≈ 750 Token的算力
Token计费让"用了多少算力就付多少钱"成为可能。
Token消耗在哪里?
每次AI对话消耗两个方向的Token:
输入Token(Input Tokens)
你发送给AI的所有内容,包括:
- 你的提问
- 对话历史(之前的问答)
- 系统指令(Prompt)
- 上传的文件内容
输出Token(Output Tokens)
AI生成的所有内容,包括:
- AI的回答
- 生成的代码
- 生成的图表描述
输出Token通常比输入Token贵3-5倍,因为生成内容比理解内容更消耗算力。
不同模型的Token价格
以2026年5月的市场价格为例(单位:元/百万Token):
| 模型 | 输入价格 | 输出价格 | 性价比 |
|---|---|---|---|
| Claude Opus 4 | ¥45 | ¥225 | 高端推理 |
| Claude Sonnet 4 | ¥15 | ¥75 | 日常首选 |
| GPT-4o | ¥35 | ¥175 | 综合能力强 |
| DeepSeek V4 | ¥3 | ¥12 | 极致性价比 |
| Qwen3-Max | ¥10 | ¥50 | 中文友好 |
实际案例:一次对话花了多少钱?
假设你用Claude Sonnet 4进行一次数据分析对话:
- 你发送:一段500字的数据分析需求 + 200字的数据说明 ≈ 1000 Token(输入)
- AI返回:一段800字的分析结果 + SQL代码 ≈ 1200 Token(输出)
费用计算:
- 输入:1000 × ¥15/百万 = ¥0.015
- 输出:1200 × ¥75/百万 = ¥0.09
- 总计:约 ¥0.11
一次完整的数据分析对话,花费大约1毛钱。
省Token的5个技巧
1. Prompt要简洁
不要写"你能不能帮我查一下上个季度咱们公司在华东地区的销售情况,我想看看哪些产品卖得最好..."
精简为:"查询上季度华东区销售额Top10产品"
300 Token → 80 Token,省了73%。
2. 清理对话历史
AI每次都要重新"读"之前的对话。当对话很长时,前面的历史就是纯消耗。该清就清。
3. 选择合适的模型
- 写代码/深度分析:用Claude Opus
- 日常问答/翻译:用Claude Sonnet或DeepSeek
- 简单分类/提取:用便宜的模型
怡途Claw自动帮你选择最优模型,这是企业使用的基础价值。
4. 使用缓存
相同或相似的查询,AI可以复用之前的计算结果。怡途的语义记忆系统会自动缓存,减少重复消耗。
5. 设置限额
给自己或团队设置每日Token上限,防止意外超支。怡途支持按用户/按Agent设置日限额。
总结
- Token是AI的"字",按量计费
- 输入便宜(查),输出贵(想)
- 一次普通对话几毛钱到几分钱
- 选对模型、写好Prompt、设好限额,成本完全可控
不需要被Token价格吓到。现在AI的价格已经降到2024年初的1/3,而且还在持续下降。花1块钱,AI能帮你干的价值远超1块钱。