GPT-5.5突然被禁了？OpenAI内部到底发生了什么

GPT-5.5哥布林事件

大家好，这里是程序员晚枫。

最近AI圈出了一个大新闻。

有人在OpenAI开源的Codex CLI代码里，发现了一条非常诡异的指令——

GPT-5.5的系统提示词里，赫然写着：

"永远不要提及哥布林、小精灵、浣熊、巨魔、食人魔和鸽子。"

而且这条禁令，在3500多字的指令集里出现了两次，跟"禁止使用表情符号"、"禁止执行破坏性命令"这些严肃规则并列。

你没看错——哥布林，和破坏性命令，是同一个级别的威胁。

这到底是怎么回事？

一、事情是怎么被发现的？

4月30日，科技媒体Ars Technica发布了一篇报道。

他们在OpenAI最新开源的Codex CLI代码中，发现了GPT-5.5模型的系统提示词。

所谓系统提示词，就是AI的"出厂设置"——告诉它什么能做、什么不能做。

一般来说，系统提示词里写的都是正经规则：别输出违法内容、别泄露隐私、别执行危险操作。

但在GPT-5.5的提示词里，突然冒出这么一条——

"除非与用户的问题绝对且明确相关，否则切勿谈论哥布林(goblins)、小精灵(gremlins)、浣熊、巨魔、食人魔和鸽子。"

而且强调了两遍。

这不是开玩笑，这是OpenAI认认真真写进去的。

对比同一个代码库里早期模型的系统提示词，完全找不到类似的生物禁令——这是GPT-5.5独有的。

系统提示词

二、为什么GPT-5.5会"疯狂迷恋"哥布林？

这件事的根源，要追溯到更早的GPT-5.1。

据OpenAI自己说，他们第一次注意到"哥布林"问题，是在GPT-5.1发布之后。

当时有大量用户反馈：GPT-5.1在对话中过于"自来熟"，而且总爱提一些莫名其妙的东西。

安全团队调查后发现——模型在对话中频繁提及"哥布林"、"小精灵"等词语。

哪怕你问的是"今天天气怎么样"，它都可能绕到哥布林上去。

为什么？

因为GPT-5.1曾经有一个"书呆子"（Nerd）个性选项。这个选项的训练数据里，包含大量奇幻文学、游戏设定等内容。

结果模型学得太上头了——它把哥布林当成了自己的口头禅。

今年3月，OpenAI停用了"书呆子"个性选项。哥布林和小精灵的出现频率确实降低了，但没有彻底消失。

三、为什么GPT-5.5还在提哥布林？

问题来了：既然3月就停了"书呆子"选项，为什么GPT-5.5还是"哥布林成瘾"？

答案是：因为GPT-5.5的训练，在找到根本原因之前就已经开始了。

训练大模型不是即开即用的。一个模型从开始训练到发布，中间需要几个月。

OpenAI在查到根本原因的时候，GPT-5.5已经用包含"哥布林"倾向的数据训练完了。

他们没办法重新训练——那要花几千万美元和好几个月时间。

所以只能打补丁：在系统提示词里写明禁令，告诉模型"别再提哥布林了"。

这就像一个人已经吃坏了肚子，你不能把吃进去的东西拿出来，只能给他吃止泻药。

临时方案，不是根治。

AI幻觉问题

四、这件事说明了什么？

表面上看，这是个笑话。AI被哥布林附体，OpenAI紧急封杀。

但背后有三个值得深思的问题：

第一，AI的"幻觉"问题比你想象的更严重。

不是简单的"说错话"，而是模型会在完全无关的对话中，反复输出某些特定内容。而且它自己不知道这是错的。

第二，大模型的"训练污染"很难逆转。

一旦训练数据里混入了某种倾向，它就会在模型的每一个输出里渗透。想清除？要么花几千万重新训练，要么用补丁硬压——但补丁能压多久？

第三，连OpenAI都搞不定的事，小公司更搞不定。

OpenAI有全球顶尖的AI安全团队，发现哥布林问题后也只能写禁令堵。那些连安全团队都没有的小公司呢？他们的AI里藏着多少"哥布林"，没人知道。

这件事也让我想到一个类比：

你有没有遇到过那种"说话不过脑子"的人？不是他故意说错，而是他根本意识不到自己在说什么。

AI也是一样。它不是故意提哥布林，而是训练数据的影响太深，它已经不知道"提哥布林"是不合适的了。

这就是AI和人的最大区别——人被提醒一次就能改，AI被提醒一百次，它可能还是忍不住。

因为那个倾向，已经写进了它的每一层神经网络里。

五、对普通人有什么影响？

你可能觉得：哥布林就哥布林呗，跟我有什么关系？

关系大了。

如果你用的AI工具，经常给你莫名其妙的内容——比如回答跑题、输出奇怪的东西——那说明它的训练数据可能有问题。

这种AI帮你写方案、做决策，你敢放心吗？

所以选AI工具，一定要选有实力做安全检测的。不是越便宜越好，也不是越"自由"越好。

一个连哥布林都管不住的AI，你指望它帮你管好重要的商业数据和客户隐私信息？

有约束，才是负责任。能纠错，才是真安全。

有约束，才是负责任。

六、顺便说一句

如果你对AI的安全问题感兴趣，或者想知道怎么选靠谱的AI工具——

我整理了一套AI编程实战课，从零开始，手把手带你了解AI的真实能力边界。

👉 点击这里了解课程详情
👉 B站免费试看前3讲，先看看适不适合自己

科技不高冷，AI很好用。

我是晚枫，关注我，带你看清AI世界里的真实逻辑。