AI 上下文窗口到 100 万了,你以为它什么都记得住?
选题来源:AIHOT 2026-06-23 | 主题:上下文窗口(context window)
排版:baoyu-skills grace 主题 + blue 主题色 | 适合 B 端研发负责人 / AI 知识科普读者
一句话说清楚
Gemini 1.5 把上下文窗口做到了 100 万 token,相当于 75 万汉字(约 3 本《红楼梦》),但这不意味着 AI 真的"记住"了——它更像一个短期记忆有限的人,聊到一半就模糊了早期信息。
为什么值得关注
你是不是也遇到过这些场景:
- 让 AI 读一份 50 页的 PDF,它说"前面讲过的事我不记得了"
- 跟 AI 聊到第 30 轮,它突然忘了开头你说过的项目背景
- 写代码写到一半,AI 不记得之前定义的函数名
这些都和上下文窗口有关——上下文窗口就是 AI「一次能看到的文字量」。
最近一年,大模型的上下文窗口从 4K 涨到 32K,再到 100 万,听起来 AI 应该"什么都记得住"了。但 MIT 2026 年 1 月的研究指出:
窗口越大 ≠ 记忆越好。
模型处理超长文本时,对早期信息的记忆会明显模糊——就像人读完百万字的书,让你回忆第一章的细节,你大概率记不清。
所以别再被"100 万 token"这个数字唬住了。真正的关键不是窗口多大,而是你怎么用。
怎么用:3 步让 AI 真正"记住"重点
第 1 步:关键信息放开头和结尾
AI 对开头和结尾的记忆最强,中间最弱。如果有核心需求,先说 + 再说 + 最后强调。
第 2 步:长任务用「分块 + 总结」模式
不要把所有内容一次性塞给 AI。改成 3 轮:
- 第一轮:让 AI 读前 30%,输出摘要
- 第二轮:让 AI 读后 30%,输出摘要
- 第三轮:把两个摘要 + 新需求一起给 AI
第 3 步:开启「持久记忆」功能
Claude、ChatGPT 等都已经支持跨对话的"记忆"功能。开启后,AI 会自动记住你的偏好和项目背景,不用每次重复说。
晚枫点评
这个功能的核心价值不是"AI 越来越聪明",而是**"AI 越来越像有长期记忆的同事"**。
对 3 类人的价值
- 对开发者:写代码不用反复粘贴项目背景,AI 直接接上下文
- 对学生:读 50 页论文不用再总结一遍,AI 帮你管
- 对职场人:周报、会议纪要、客户信息全在一个 AI 里
局限性要说清楚
- 100 万 token 的"记忆"≠ 100 万 token 的"理解"。早期信息仍然会模糊
- 不同模型的"长上下文"能力差异大,不能只看数字
- 持久记忆有隐私风险——AI 记的越多,泄露风险越大
和 Claude / GPT 的对比
| 模型 | 窗口大小 | 早期衰减 | 持久记忆 | 适合场景 |
|---|---|---|---|---|
| Gemini 1.5 | 100 万 | 明显 | 实验中 | 超长文档 |
| Claude 3.5 | 20 万 | 较轻 | 已支持 | 代码 + 长对话 |
| GPT-4 Turbo | 12.8 万 | 明显 | 已支持 | 通用 |
⚠️ 表格列数控制在 4-5 列,方便手机端阅读。
参考链接
- IBM 上下文窗口科普:https://www.ibm.com/cn-zh/think/topics/context-window
- Gemini 长上下文文档:https://ai.google.dev/gemini-api/docs/long-context
- MIT 千万级上下文研究(2026-01):https://www.qbitai.com/2026/01/370196.html
- AIHOT 永久页:https://aihot.virxact.com/items/context-window-100m
科技不高冷,AI 很好用。
我是晚枫,关注我,每天带你搞懂一个 AI 知识!
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 程序员晚枫 - Python自动化办公与AI编程!
