大家好,我是程序员晚枫。

你问AI一个100字的问题,被扣了5毛钱。
你问一个1000字的问题,被扣了3块。

凭什么?都是1000字啊!

因为AI不按"字数"收费,它按"Token"收费。而中文比英文"贵"得多。

搞懂Token,你才知道自己每次用AI到底花了多少钱、怎么花得更省。


一句话先说清楚

Token = AI理解语言的最小单位

1个中文字 ≈ 1-2个Token,1个英文单词 ≈ 1个Token。同样1000字,中文比英文花更多Token,所以中文用AI天然更贵。


Token 到底是什么?

AI不会像人一样"一个字一个字"地读,它把文字拆成更小的"块"来理解,每一块就是一个Token。

文字分割

你写的AI怎么拆Token数
你好你、好2个
程序员晚枫程、序、员、晚、枫5个
HelloHello1个
OpenAIOpen、AI2个

关键发现:中文1个字通常就是1个Token,英文1个单词才是1个Token。

这意味着同样表达一个意思,中文的Token数比英文多——中文用AI天然比英文"贵"。


为什么按 Token 收费,不按字数?

你可能会想:按字数算多简单,为什么要搞个Token?

因为Token才是AI真正的"工作量"

类比为什么这么收费
出租车按公里算,不按时间堵车时按时间你亏死,按公里才公平
奶茶按配料算,不按杯子大杯小杯配料不同,按杯不公正
AI按Token算,不按字数中英文处理难度不同,按字数不公平

你问的问题越复杂 → Token越多 → AI算得越久 → 收费越多。

这是按实际工作量收费,非常合理。


算一笔真实的账

你问AI:"帮我写一篇1000字的Python入门教程"

费用计算(以DeepSeek-V3为例):

  • 你的问题(1000字)≈ 1300个Token → 输入费用:0.003元
  • AI的回答(2000字)≈ 2600个Token → 输出费用:0.02元
  • 总费用:约0.023元

费用计算

同样问题用GPT-4o:

  • 输入费用:0.023元
  • 输出费用:0.187元
  • 总费用:约0.21元——贵了将近10倍!

结论:同样一次对话,DeepSeek比GPT-4o便宜近10倍。中文场景用国产模型是真省钱。


新闻里的那些 Token 术语,人话翻译

"上下文窗口 32K Token"是什么意思?

= AI一次对话最多能记住的内容量。窗口越大,AI一次能记住的东西越多。

上下文窗口大约等于
4K一篇公众号文章(约3000字)
32K一份行业报告(约2.4万字)
128K一本短书(约9.6万字)
1M半本《三体》(约75万字)

上下文窗口 = AI的"记性"。记性越大,能处理的长文越多。


2025-2026年 Token 价格对比

国产模型:便宜到离谱

模型输入(/百万Token)输出(/百万Token)1万字约花多少
DeepSeek-V3¥2¥8约0.1元
Qwen-Plus¥2¥6约0.1元
Qwen-Turbo¥0.3¥0.6约0.01元

海外模型:贵但强

模型输入(/百万Token)输出(/百万Token)1万字约花多少
GPT-4o¥18¥72约1元
GPT-4o-mini¥1¥4.3约0.06元
Claude 3.5 Sonnet¥22¥108约1.5元

价格对比


4个省 Token 的实战技巧

技巧1:精简提问,别堆废话

浪费Token的问法
"你好,我是一个Python初学者,最近在学Python编程,想请你帮我写一个爬虫程序,不知道能不能帮帮我?"

省Token的问法
"用Python写一个爬取豆瓣Top250电影的脚本"

第二种省了50%以上的Token,效果还更好——AI不被废话干扰。

技巧2:国产模型做初稿,GPT做精修

  • 第一步:用 DeepSeek/Qwen 生成初稿(便宜10倍)
  • 第二步:用 GPT-4o 润色优化(贵但精)
  • 总成本:比全程用GPT省70%

这是很多资深开发者的真实工作流。

工作流

技巧3:长文档分段处理

❌ 一次丢10万字 → 超出上下文窗口,报错+浪费Token

✅ 分段处理:每次5000字 → 稳定运行+省Token

技巧4:用 System Prompt 设定角色

把角色设定、格式要求放在System Prompt里——设一次,每次对话自动带上,不用每次重复发送。


Token 计费的3个趋势

  1. 价格持续走低,"Token自由"正在到来:DeepSeek已经把价格打到OpenAI的1/10,个人开发者也能大量使用

  2. 按效果计费开始出现:部分平台尝试"只有AI给出满意答案才收费"的模式

  3. 统一API格式让切换模型零成本:换模型不用改代码,只换Key和接口地址就行


一句话总结

  • Token是AI的工作量单位,不是字数("工作量单位"这四个字要重点强调)
  • 中文比英文贵,1个中文字≈1-2个Token
  • 国产模型便宜10倍,中文场景首选DeepSeek/Qwen
  • 精简提问+分段处理,能省70%的Token费用

相关阅读


顺便说一句,我的AI编程实战课...

科技不高冷,AI很好用。
我是晚枫,关注我,带你用AI搞钱,不做AI的韭菜。


🎓 AI 编程实战课程

想系统学习 AI 编程?程序员晚枫的 AI 编程实战课 帮你从零上手!