GPT-5.5哥布林事件


大家好,这里是程序员晚枫。

最近AI圈出了一个大新闻。

有人在OpenAI开源的Codex CLI代码里,发现了一条非常诡异的指令——

GPT-5.5的系统提示词里,赫然写着:

"永远不要提及哥布林、小精灵、浣熊、巨魔、食人魔和鸽子。"

而且这条禁令,在3500多字的指令集里出现了两次,跟"禁止使用表情符号"、"禁止执行破坏性命令"这些严肃规则并列。

你没看错——哥布林,和破坏性命令,是同一个级别的威胁。

这到底是怎么回事?


一、事情是怎么被发现的?

4月30日,科技媒体Ars Technica发布了一篇报道。

他们在OpenAI最新开源的Codex CLI代码中,发现了GPT-5.5模型的系统提示词。

所谓系统提示词,就是AI的"出厂设置"——告诉它什么能做、什么不能做。

一般来说,系统提示词里写的都是正经规则:别输出违法内容、别泄露隐私、别执行危险操作。

但在GPT-5.5的提示词里,突然冒出这么一条——

"除非与用户的问题绝对且明确相关,否则切勿谈论哥布林(goblins)、小精灵(gremlins)、浣熊、巨魔、食人魔和鸽子。"

而且强调了两遍。

这不是开玩笑,这是OpenAI认认真真写进去的。

对比同一个代码库里早期模型的系统提示词,完全找不到类似的生物禁令——这是GPT-5.5独有的。

系统提示词


二、为什么GPT-5.5会"疯狂迷恋"哥布林?

这件事的根源,要追溯到更早的GPT-5.1。

据OpenAI自己说,他们第一次注意到"哥布林"问题,是在GPT-5.1发布之后。

当时有大量用户反馈:GPT-5.1在对话中过于"自来熟",而且总爱提一些莫名其妙的东西。

安全团队调查后发现——模型在对话中频繁提及"哥布林"、"小精灵"等词语。

哪怕你问的是"今天天气怎么样",它都可能绕到哥布林上去。

为什么?

因为GPT-5.1曾经有一个"书呆子"(Nerd)个性选项。这个选项的训练数据里,包含大量奇幻文学、游戏设定等内容。

结果模型学得太上头了——它把哥布林当成了自己的口头禅。

今年3月,OpenAI停用了"书呆子"个性选项。哥布林和小精灵的出现频率确实降低了,但没有彻底消失。


三、为什么GPT-5.5还在提哥布林?

问题来了:既然3月就停了"书呆子"选项,为什么GPT-5.5还是"哥布林成瘾"?

答案是:因为GPT-5.5的训练,在找到根本原因之前就已经开始了。

训练大模型不是即开即用的。一个模型从开始训练到发布,中间需要几个月。

OpenAI在查到根本原因的时候,GPT-5.5已经用包含"哥布林"倾向的数据训练完了。

他们没办法重新训练——那要花几千万美元和好几个月时间。

所以只能打补丁:在系统提示词里写明禁令,告诉模型"别再提哥布林了"。

这就像一个人已经吃坏了肚子,你不能把吃进去的东西拿出来,只能给他吃止泻药。

临时方案,不是根治。

AI幻觉问题


四、这件事说明了什么?

表面上看,这是个笑话。AI被哥布林附体,OpenAI紧急封杀。

但背后有三个值得深思的问题:

第一,AI的"幻觉"问题比你想象的更严重。

不是简单的"说错话",而是模型会在完全无关的对话中,反复输出某些特定内容。而且它自己不知道这是错的。

第二,大模型的"训练污染"很难逆转。

一旦训练数据里混入了某种倾向,它就会在模型的每一个输出里渗透。想清除?要么花几千万重新训练,要么用补丁硬压——但补丁能压多久?

第三,连OpenAI都搞不定的事,小公司更搞不定。

OpenAI有全球顶尖的AI安全团队,发现哥布林问题后也只能写禁令堵。那些连安全团队都没有的小公司呢?他们的AI里藏着多少"哥布林",没人知道。

这件事也让我想到一个类比:

你有没有遇到过那种"说话不过脑子"的人?不是他故意说错,而是他根本意识不到自己在说什么。

AI也是一样。它不是故意提哥布林,而是训练数据的影响太深,它已经不知道"提哥布林"是不合适的了。

这就是AI和人的最大区别——人被提醒一次就能改,AI被提醒一百次,它可能还是忍不住。

因为那个倾向,已经写进了它的每一层神经网络里。


五、对普通人有什么影响?

你可能觉得:哥布林就哥布林呗,跟我有什么关系?

关系大了。

如果你用的AI工具,经常给你莫名其妙的内容——比如回答跑题、输出奇怪的东西——那说明它的训练数据可能有问题。

这种AI帮你写方案、做决策,你敢放心吗?

所以选AI工具,一定要选有实力做安全检测的。不是越便宜越好,也不是越"自由"越好。

一个连哥布林都管不住的AI,你指望它帮你管好重要的商业数据和客户隐私信息?

有约束,才是负责任。能纠错,才是真安全。

有约束,才是负责任。


六、顺便说一句

如果你对AI的安全问题感兴趣,或者想知道怎么选靠谱的AI工具——

我整理了一套AI编程实战课,从零开始,手把手带你了解AI的真实能力边界。

👉 点击这里了解课程详情
👉 B站免费试看前3讲,先看看适不适合自己


科技不高冷,AI很好用。

我是晚枫,关注我,带你看清AI世界里的真实逻辑。


相关阅读


作者:程序员晚枫,全网40万+粉丝,6年Python开发经验,python-office 开源项目作者。