🎬 本文根据口播稿第 039 期改编:AI基础概念全系列——21个核心概念一篇讲透

大家好,我是程序员晚枫。

最近被问爆的一个问题:

"晚枫,AI圈的 Token、Prompt、RAG、思维链到底是啥?开会听同事聊起来,我一句话插不上,回家搜一晚上更懵。"

这感觉我太懂了。

三个月前我同事开会聊这些,我只能假装点头——感觉就像一群人讨论"量子纠缠",我在旁边数他们说了几个"量子"。

今天一次说清楚:一个打工人的一周,21个概念串起来。


周一·写周报

周一早上,领导上周五说"周三交周报"。

我打开 AI,随口说了句"帮我写周报"——

两秒钟,AI 给一大段。我盯着看了 10 秒,发现一个问题:

每个字都认识,连起来不知道在说啥。

就像你收到领导的邮件——"关于前述事项的后续推进,望各相关方协同配合"——翻译过来就是"赶紧干活"。

但 AI 还没学到这一步,它在努力显得"专业"。

背后干这个活的,叫「大语言模型」,LLM。

👉 概念 1:LLM 是 AI 的大脑——你问它问题,它回答你。ChatGPT、Claude、DeepSeek、豆包、千问、Kimi,全都是大语言模型。

第二个问题:Token 是啥?

"帮我写周报" 5 个字,大约消耗 7 个 Token。AI 回复你 200 个字,再消耗 200 个 Token。

Token 就是 AI 的"字数计数器"。

就像你去打印店——打印按页收费,复印按张收费,AI 按 Token 收费。本质一样:定价需要一个最小不可分单位。

但 Token 有个冷笑话式的设定:它不按"意思"计费,按"块"计费。

就像律师按小时收费,他在厕所蹲了 20 分钟思考你案子,那 20 分钟也算钱。AI 也一样,它"想"的过程也要消耗 Token,哪怕它"想"出来的东西是错的

👉 概念 2:Token 是 AI 的字数计数器——你输入多少、它输出多少,都按这个算。

第三个问题:Prompt 是啥?

你输入的那句话,就叫 Prompt,提示词。

👉 概念 3:Prompt 是你输入给 AI 的话——你说什么,它答什么。


周一·继续:周报全是套话

AI 写出来的周报,全是套话。

"本周工作稳步推进,各项指标持续向好"——你领导看了,第一反应是"这人到底干了啥?"

为什么? 因为你没有把需求说清楚。

LLM 很聪明,但它不是你肚子里的蛔虫。你不说清楚,它就只能猜,猜出来就是套话。

就像你让装修公司"帮我装修"——不说清楚要几个房间、什么风格、预算多少,设计师只能给你套模板。

于是我换种说法:

"上周做了 3 个功能、修了 5 个 bug、开了 2 次评审会,帮我写周报。"

这次 AI 写出来明显靠谱多了。

这种"把需求说清楚的方法",叫「提示词工程」。

👉 概念 4:提示词工程 是让 AI 懂你的方法——就像给厨师写详细菜单,你说得越具体,AI 越没法糊弄你

系统提示词 + 上下文

但又有个问题:每次打开 AI,都得重新说"我是程序员,周报格式是……"。

太麻烦了。

我希望 AI 一开始就记住我的背景——"你是个程序员,你的周报格式是……"。这段一开始就设的话,叫「系统提示词」。

而在对话过程中补充的信息——"上周做了 3 个功能"——AI 能记住,靠的是「上下文」。

👉 概念 5:系统提示词 是一开始给 AI 设定的人设——就像岗位说明书。

👉 概念 6:上下文 是 AI 记住的对话信息——就像 AI 的短期记忆。记忆是有限度的,装满了前面的就会挤掉后面的。

模型:选对大脑很重要

同样的提示词,换个 AI,效果天差地别。

LLM 是大脑,但大脑也分聪明和一般。GPT-4o、Claude 3.5、千问 2.5——不同的模型,效果不一样。选对模型,有时候比提示词工程还重要。

就像你选律师——同一个案子,实习生和资深合伙人写出来完全不同。选错模型,就像花大价钱请了个刚拿证的实习律师。

👉 概念 7:模型 是不同 AI 的聪明程度——选对大脑,比提示词工程更重要。


周二·读文件

领导说:"把你上季度的数据也分析一下。"数据在一个 PDF 里。

我把 PDF 扔给 AI:"帮我分析"——AI 让我"突出项目管理经验"。可我压根没做过项目管理。

为什么?因为 AI 用的是训练时的老数据,压根没见过你的文件

就像你问一个没看过你材料的医生"我这病怎么治"——他只能说"一般这类病通常……"。

想让 AI 先读懂你的东西再回答,这招叫「RAG」。

👉 概念 8:RAG 是让 AI 先读你的文件——就像考试前先看课本。

RAG 怎么读?把 PDF 拆成段落,每段变成一串数字——这步叫「向量化」。变完就能快速搜索最相关的内容。

就像考试前先看课本——RAG 让 AI 先读你的"课本",再答题。向量化就是给课本的每一页贴编号,方便快速翻到你要的那页。

👉 概念 9:向量化 是把文字变成数字——就像给书贴编号,方便快速查找。

幻觉:AI 瞎编乱造

但即使用了 RAG,AI 还是可能编出我根本没做过的项目——这叫「幻觉」。

AI 训练数据有**「知识截止」**日期,它只知道训练时见过的东西,不知道今年的行情。

查股价、查新闻,都要注意这个截止日期。

幻觉的本质,是 AI 在"不知道"的情况下硬要回答。 它宁肯编一个看起来靠谱的答案,也不愿意说"我不知道"。

它编起来比造谣的自媒体还自信。 至少自媒体知道自己是在编。

👉 概念 10:幻觉 是 AI 瞎编乱造——它宁肯编一个,也不说"我不知道"。

👉 概念 11:知识截止 是 AI 只能知道训练时的信息——知识库只更新到某日期。

多模态 + 流式输出

最新的信息怎么办?我把 PDF 截图也传给 AI——AI 不只认文字还能看图,叫「多模态」。

👉 概念 12:多模态 是 AI 能同时处理多种信息——文字、图片、语音。

AI 回答时一个字一个字蹦出来——这叫「流式输出」。不用等整段回答完才显示,体验更好。

流式输出有个冷笑话式的好处:你能看到 AI "想"的过程。 就像你看厨师做菜,从切菜到下锅到调味,你能看到每一步。

但回答到一半突然停了——一次能输出的字数有限,叫「输出 Token 限制」。就像作文有字数上限,超了就得停。

👉 概念 13:流式输出 是 AI 实时输出——打字机式逐字显示。

👉 概念 14:输出 Token 限制 是 AI 一次只能说有限字数——作文有字数上限。


周三·练面试

简历改好了,我想让 AI 模拟面试官,帮我练面试。

我想把 AI 面试官放进微信,像聊天一样随时练——这得用「API」,给 AI 装个遥控器,让程序能调用 AI。

👉 概念 15:API 是调用 AI 的遥控器——所有 AI 应用底层都用 API。

但 API 用着用着报错了——每分钟请求次数有上限,叫「速率限制」

就像高速收费站限流,商业 API 都有配额,企业级要付费扩容。

限速其实是个保护机制。 想象一下,如果没有限速,所有人同时涌入 API,服务器直接崩溃——就像节假日景区不限流,所有人同一天去,景区直接被挤爆。

你骂限速慢,但没了限速,你连网页都打不开。

👉 概念 16:速率限制 是 API 每分钟请求次数上限——保护服务器不崩溃。

Few-shot:看例子比讲道理管用

修好了,但 AI 出的题不像真的。

我先给它看 3 道标准面试题,让它照着出——这招叫「Few-shot」,做示范比讲道理管用。

👉 概念 17:Few-shot 是给 AI 做示范——我不告诉你抽象的规则,我给你看 3 个例子。

思维链:让 AI 一步步推理

教会了风格,但 AI 直接给评价太浅。

我让它别急,先一步步推理——这就是「思维链」,理完思路再答,深浅不一样。

👉 概念 18:思维链 是让 AI 一步步推理——解题先写草稿。

思维链的妙处在于"过程可视化"。 就像老师改作业,不是直接写"错了",而是先写"这里思路对了,但第三步算错了"。

思维链不是让 AI 更聪明,是让你更知道它有多不聪明。

多轮对话:AI 记得住吗?

面试要来回追问。我跟 AI 聊了 20 轮,它还记得我前面暴露的弱点——这叫「多轮对话」。

但多轮对话有个隐藏问题:上下文窗口是有限的。聊多了,前面的信息会被挤掉。

你以为 AI 在认真倾听,其实它在"滚动刷新"。 排满了,最早的那条就被挤掉了。

👉 概念 19:多轮对话 是 AI 记住之前的对话——但记忆是有限的。

工具调用 + 输出格式控制

聊完想让它顺手帮我改简历——AI 只会问不会改?

给它接上简历修改工具,这叫「工具调用」。就像给 AI 配了工具箱,日历、搜索、计算器都能接。

工具调用是 AI 从"会动嘴"到"能动手"的关键一步。 之前 AI 只能给你建议,现在它能直接操作——改文件、查数据、发邮件。

👉 概念 20:工具调用 是让 AI 使用外部工具——从"动嘴"到"动手"。

但 AI 输出乱七八糟。让它按打分表格式来——这就是「输出格式控制」。JSON、Markdown、评分表都能控制。

格式控制为什么重要? 想象一下,AI 给你一堆 unstructured 的反馈,你得自己整理。有了格式控制,AI 直接输出"沟通能力:8/10;技术深度:7/10"——结构化、可比较、可操作。

👉 概念 21:输出格式控制 是让 AI 按指定格式输出——这就是 AI 世界的"白纸黑字"。


21 个概念总览表

序号概念场景一句话理解
1LLM写周报AI 的大脑
2Token写周报AI 的字数计数器
3Prompt写周报你输入给 AI 的话
4提示词工程写周报把需求说清楚的方法
5系统提示词写周报一开始给 AI 设定的人设
6上下文写周报AI 记住的对话信息
7模型写周报不同 AI 的聪明程度
8RAG文件分析让 AI 先读你的文件
9向量化文件分析把文字变成数字便于搜索
10幻觉文件分析AI 瞎编乱造
11知识截止文件分析AI 只能知道训练时的信息
12多模态文件分析AI 能看懂图片
13流式输出文件分析AI 实时输出
14输出 Token 限制文件分析AI 一次只能说有限字数
15API面试调用 AI 的遥控器
16速率限制面试API 每分钟请求次数上限
17Few-shot面试给 AI 做示范
18思维链面试让 AI 一步步推理
19多轮对话面试AI 记住之前的对话
20工具调用面试让 AI 使用外部工具
21输出格式控制面试让 AI 按指定格式输出

这 21 个概念的 3 层关系

回头看,这 21 个概念不是随机出现的——每一个都是为了解决上一个问题而产生的:

  • 基础层(写周报):LLM → Token → Prompt → 提示词工程 → 系统提示词 → 上下文 → 模型
  • 进阶层(读文件):RAG → 向量化 → 幻觉 → 知识截止 → 多模态 → 流式输出 → 输出 Token 限制
  • 高级层(练面试):API → 速率限制 → Few-shot → 思维链 → 多轮对话 → 工具调用 → 输出格式控制

记住这个递进关系,你就能把 AI 概念串起来理解:

基础层解决"怎么和 AI 说话",进阶层解决"怎么让 AI 处理你的东西",高级层解决"怎么让 AI 帮你干复杂的事"。


最后的最后

学 AI 不是为了当工程师,是为了用 AI 解决问题。

你不需要懂 Transformer 架构,不需要懂反向传播,你只需要知道:

  • AI 能做什么
  • 怎么用 AI
  • AI 在哪些场景会出错

这 21 个概念,就是这 3 个问题的答案。

收藏起来,开会时再听到这些词,你就能插上话了


相关阅读


科技不高冷,AI很好用。
我是晚枫,关注我,带你一起玩AI!