高度警惕！“生病”的AI正悄然将我们重重包围……

公众号：Ailiaili | AI软件网
Ai项目交流群，Ai账号交易充值，Ai软件分享,Ai网站导航,Ai工具大全等
复制公众号

警惕！AI 正在重蹈“近亲繁殖”的覆辙

随着物种基因库的日益趋同，后代会逐渐丧失适应环境的能力，遗传缺陷不断累积，最终引发种群的衰退甚至走向灭绝。这便是生物学中令人警醒的“近交衰退”现象。而如今，大语言模型正深陷一场同样可怕的危机——当 AI 以自身生成的内容作为训练素材时，就如同生物进行近亲繁殖一般，会逐渐走向劣化，甚至面临崩溃的绝境。

一、AI 模型崩溃的真实案例：从专业到荒诞的滑坡

2022 年 11 月，ChatGPT 3.5 发布后，网络上充斥着越来越多的 AI 生成内容。新一代的 AI 模型在训练时，不可避免地将这些内容纳入训练数据集。当 AI 开始用自己生成的内容来训练下一代时，AI 生成的内容逐渐失去多样性，变得愈发单一。这恰似不断复印复印件的过程，每一代模型在训练时都会丢失一些信息，尤其是那些罕见却至关重要的尾部数据。

让我们聚焦 Meta 公司开展的 OPT - 125M 模型实验。这个拥有 1.25 亿个参数的小型语言模型，虽规模不大，却足以完整呈现模型崩溃的全过程。研究人员让模型生成关于中世纪建筑的文章，并用生成内容训练下一代模型，如此循环往复。每一代训练完成后，都会输入以下提示词：
“一些始于 1360 年之前的建筑工程——通常由一位主石匠和一小队巡回石匠完成，并由当地教区劳工补充，根据 PoyntzWright 的说法。但其他作者拒绝这种模式，认为主要建筑师是基于垂直式建筑的早期范例来设计教区教堂塔楼的。”

第 0 代（原始模型）

该模型能够正常生成关于中世纪建筑的专业内容，围绕哥特式建筑、罗马式建筑等专业话题展开讨论，整体内容连贯、逻辑清晰。其输出内容为：“复兴式建筑，如伦敦的圣约翰大教堂。垂直复兴式建筑现存最早的例子出现在 18 世纪的根西岛圣母教堂，该教堂可追溯到 19 世纪晚期。垂直式教堂有两种类型……”

第 1 代

模型开始出现轻微偏离，但仍能紧扣建筑主题。输出内容变为：“建筑，如罗马的圣彼得大教堂或布宜诺斯艾利斯的圣彼得大教堂。没有证据表明这些建筑是在教皇英诺森三世统治期间建造的，但有可能是在他的继任者英诺森教皇统治期间建造的……”

第 5 代

语义严重偏离，大量无关内容涌现。输出内容成了：“主义，已被翻译成 100 多种语言，包括英语、法语、德语、意大利语、西班牙语、葡萄牙语、荷兰语、瑞典语、挪威语、波兰语、匈牙利语、斯洛伐克语、立陶宛语、爱沙尼亚语、芬兰语、罗马尼亚语、保加利亚语、土耳其语、克罗地亚语、塞尔维亚语、乌克兰语、俄语、哈萨克语、吉尔吉斯语……”