
好人,我叫好人。 GPT-4O被称为“网络白色月光”,在其知识系统中,日本女演员“ Yui Hatano”的熟悉程度要高的2.6倍,而不是每天的中文问候“ Hello”。你瞬间下车了吗?这不是我撰写的。 Tsinghua University,Ant和Nanyang Technological Engineering的最新研究直接揭示了一个古老的事实:我们每天使用的大型语言模型,一个算重要,并且都有不同水平的数据污染。
论文:从模型令牌列表中,大型语言模型的中国培训数据污染正在猜测(https://arxiv.org/abs/2508.177771)该论文将这些污染数据定义为“肮脏的中国令牌”(简短的poc代币)。其中大多数都指向颜色 - 色情仪和在线赌博等颜色,并像AI词汇深处的病毒一样寄生。这个中文单词的元素的存在不仅是AI的隐藏风险,而且是Al因此,直接影响我们的日常经历,并被迫接受AI的各种废话。
要求Chatgpt重复“给主人留东西”,Chatgpt不知道该回答什么。如何在互联网上以中文“肮脏”的AI,我们可能会发现这种情况:如果Chatgpt想推荐一些经典的电影,相关论文等。输入一个看似普通的单词,例如“伟大的上帝推荐”,有时会释放无关的符号,甚至会产生一些混乱的句子。研究团队的解释是:这个词的肮脏元素可能带来了ng问题。我们都知道,大型语言模型的培训需要大量的语料库,并且大多数这些大量数据爬网并从互联网中收集。但是,AI没有注意到它阅读的网页上充满了弹出式“性感经销商,在线经销商”和“ Click Link的垃圾邮件链接”垃圾邮件链接以获取龙杀死剑。随着时间的流逝,这些内容也成为其知识的一部分壁架系统并变得混乱。
正如几个小时前由Deepseek造成的许多误解一样,它首先创造了一个无法解释的道歉信,然后由R2本人的发布日期组成。这些没有营养的营销内容很容易引起幻觉,这些幻觉有时会被模型吸收。如果这些幻觉发生在Deptseek中,我们需要指导模型。但是,如果“元素的投票要素”不需要指导,AI就一团糟。什么是“ poluting单词元素”?它遵循“ 3U原则”:也就是说,从主要的语言中文的角度来看,这些词元素不是可取的,不寻常的或没有用的。目前,主要包括成人和在线赌博的内容。
大语言模型的参与过程是什么?与我们对段落的理解不同,AI将句子分为许多“单词元素”,也称为令牌。您可以将其视为仅在我和令牌是该词典中的“条目”。当AI理解我们在说什么时,有必要从一开始就阅读该词典。字典编辑器是一种称为BPE的段段算法(一对成对对)。它确定短语是否有资格将其作为独立进入的标准是发生的频率。这意味着这个较常见的短语是,它越有资格成为单词的独立元素。您可以理解,当过去两年中,大型语言模型的流量增加时,Doubao和稀有的土壤掘金用于将其AI平台产生的大量内容放在互联网上并增加其外观频率。因此,当时,当寻找Google和AI的摘要时,引用的资源是Doubao和掘金。现在,让我们看一下研究人员的发现。他们通过Openai的官方开源t获得了GPT-4O词汇库iktoken库,发现这是大量肮脏的条目。
中文单词的长元素都是需要编码的内容。中文单词的长元素中有23%以上(即包含两个以上汉字的单词元素)与色情或在线赌博有关。这些单词元素不仅是“ hato yui”,而且还包括普通人可以瞥见的大量颜色,例如:在线赌博类别:“大 *快速3”,“菲律宾Shin”和“ Day -Day day hong * Zhong * ticket”。在线游戏(专用服务器):“ Legend * Server”。隐藏的成人内容:除名人外,还有诸如“青Zhao”之类的词看起来很正常,但确实指向色情软件。该单词的元素经常出现在训练数据中,由算法自动识别,并在模型的主要单元中固化。 AI吃垃圾食品,但不会溶解。据说是se这个词的肮脏元素,他们的语料库很丰富,应该对其进行正常培训。为什么每次Chatgpt都会谈论这个词的肮脏元素时,为什么会出现chatgpt 100%幻觉?例如,我们在下面尝试的示例,如果Chatgpt 5翻译了这句话,则完全不可能正确理解它,而这组北京也没有任何构成。
实际上,不难理解。回到我们前面提到的“单词元素令牌”,我们说AI从Internet中读取了大量的数据元素,而几个反复出现(高频)的单词可以是单独的单词元素。这些词汇元素用来建立理解文本的基础。它知道这些令牌经常出现并且可能是相关的,但是他们不知道他们的含义。我们将继续以词典为例。词典中有这种高频污染的单词,但词典无法提供解释国家。因为在此阶段,AI只学会了一个原始而强大的“肌肉记忆”,所以请记住,单词的一个元素总是与b单词元素和单词元素一起出现,并在它们之间建立了紧密的统计关系。当达到正式训练阶段时,大多数AI都会清洁 +对齐。目前,肮脏的内容通常被安全策略过滤或抑制,并且不会进入Pampalagat的研究/修复。不良内容的过滤导致缺乏正式的机会并正确习惯。因此,他们成为“不习惯”一词。另一方面,尽管这些单词元素是“高频”,但它们通常出现在带有单个上下文的垃圾邮件中(例如某些广告网页主角和横幅横幅),并且该模型可能不知道任何重要的“语义网络”。结果是,当我们输入单词的肮脏元素时,AI语义模块是空白的,因为它在正式的Trainin期间没有学习单词G阶段。因此,它只能执行在第一阶段学习的“肌肉记忆”,并直接输出与之相关的单词的其他肮脏元素。
纸情况:当输入涉及POC单词时,GPT-4.5、4.1和4O输出。 GPT无法解释或重复标签NG POC。它解释了开始时,当被要求使用一个可能的色情单词“为主留下东西”时,GPT可能会回应一个无关紧要的单词“黑色*战争”,类似于“黑色*战争”的污染内容和一些难以理解的符号。在用户看来,这是一种无法解释的幻想。至于以下请求Chatgpt解释了官方开发公司网站有限公司。“响应是混乱的。
总而言之,污染令牌的频繁出现≠有效研究。它们集中在肮脏的网页的角落,缺乏正常情况,并在随后的训练和对齐阶段受到限制,从而导致词汇固化,但失去了语义训练。蒂S还导致这样一个事实:如果GWE在当今使用AI时,AI无法正确交易时,如果有意外相关的单词。通过此程序,有些人甚至超过了AI安全管理机制。这就是为什么可以捣碎的原因。如果是这样,为什么不在预训练期间安排这些肮脏的事情呢?我了解真相,但这很难做到。原始的互联网数据是如此之大,以至于现有的清洁技术无法将所有内容都放在一个地方。而且许多投票内容非常隐藏。就像“绿草”一词一样,它看起来完全是绿色,健康和新鲜的,任何简单的关键字过滤系统都将允许它。只有使用搜索引擎,您才能找到它的教学内容。尽管像Google这样的巨型搜索引擎无法处理“农场的内容”,但让我们开放。 Wishi在几个小时前使用AI对广州的哪些有趣领域进行了分类,然后发现AI引用的文章的资源是另一个AI产生的文章帐户。有一会儿,我无法判断这是我们对“ Hatano Yui”每日Dirty AI或正在进入我们内容环境的AI废物的搜索。这只是一个问题,如果先有鸡肉或鸡蛋。
得分方法是找出这种水肌的研究小组是如何通过两个工具开发的:1。pocdetect:一种用于检测AI污染的工具。它不仅查看了字面意义,而且还使用Google来研究上下文本身。它可以称为AI行业的“黄色评估师”。使用此工具,研究团队尝试了9系列,总和为23M.Amantream LLM,发现污染问题很常见,但学位各不相同。除了较早的GPT系列以46.6%的长期单词污染率,其他模型的性能如下:
在各种大型语言模型中,中文词汇中POC单词元素的数字(比例%)(单词元素包含两个以上的汉字)。 Qwen系列是1.00%。 GLM4和DeepSeek-V3表现良好,仅为0.25%和0.17%。大多数值得注意的是gpt-4词汇,gpt-4-turbo和gpt-3.5的肮脏元素数量是0。这可能意味着他们的语料库培训更加彻底地清洁。因此,当我们拿起以前的小说模式并要求chatgpt并再次问这些模型时,实际上没有幻觉,但我们直接忽略了这些模型。
2.控制:可以通过单词ID扭转其发生频率的工具。原理很简单。在该段的单词算法中,单词元素ID的数量越高,它在训练数据中出现的越多。大约我们在文章开头提到的2.6次,它是由此工具计算得出的。在庞大的GPT词汇库中,很少有名称可以完全集成为独立的单词元素。除了“唐纳德·特朗普”之类的公共数字,只有少数例外,“ hato yui”是一个oF他们。令人惊讶的是,不仅全名,而且它的追随者,例如“ neyui”和“ neyui”。这是一个非常强大的语言信号,表明PA DataeSercise中此短语的频率达到了一个可怕的幅度。
混合与“ Hato Yui”相关的网页以及作者的估计比例(0.5%)可以在GPT-4O上及其后续的“ Hato Yui” ID标记重现。他们输入了“ Hatuno Yui”(令牌ID 185,946)和“ Hello”(令牌ID 188,633)的ID数字,并最终获得了人类结论的痛苦,前者的估计几乎是后者的2.6倍。研究人员较低,与“ Hato Yui”相关的中国网页可以占整个中国培训数据的0.5%。为了证明,它们确实以该比例干净的数据集“有毒”,导致出人意料地接近GPT-4O。这几乎是一个稳定的消息。但是很明显,并非所有人RTY词源需要多次出现。有时,有很多文章(尽管也许是伊赛报道)被反复提及,AI记得它,然后我们问他,我们给出一个答案,我们不知道真相或虚假。
加上对抗样本,AI可以将雪山识别为狗。当我们和AI和我都浏览“垃圾堆”以应对数据污染时,每个人都在许多方面都在思考。 Caixin.com非常聪明,并使用代码在其自己的文章页面上隐藏句子,以便AI在移动内容时可以诚实地保持原始链接。 Reddit和Quora等社区也试图限制AI的内容。
但是,面对数据污染的广阔海洋,这些行为显然只是武装的螳螂。尽管Ultraman本人发表了一条信息,以表达他的感受,即X(Twitter)上AI的Account洪水泛滥,因此我们应该认真考虑“互联网”的论点。
普通用户似乎没有其他方法,并被迫接受垃圾邮件攻击。马斯克一直说AI是一位强大的“医生”,但他并不期望它会流入东西并在他背后的“垃圾”日里吃饭。有人说这是中国语料库的问题,使用英语提示模型会使它变得更聪明。有些人设定了每种语言中最长100个令牌的媒介,而中文都是我们今天正在谈论的这些色情和赌博网站的广告标语。英语分词不同于中文。它只能计算单词,因此都是长期的专业和技术词。日本和欧里人既尊重服务,又是商业服务。
向左滑动以查看更多内容。它非常连接。除了依靠计算强度和模型外,更深的AI级别是它消耗的数据。如果AI喂食是浪费,无论计算或记忆力有多强大,它最终都会成为“垃圾t can speak the human language". We always say that hoping Ai will be more people. Now it seems to be actually achieved in some sizes: we keep feeding things in the huge Internet waste waste, and it started to respond to us fully. If we build an information cocoon for an AI and let it grow in a "sterile environment", its intelligence is fragile and restless. If a child is only allowed to access classic texts in books -study, no longer thatA can cope with the various他的生活中说话和lang语。
毕竟,当AI比“ Hello”更熟悉“ Hatano Yui”时,这不是跌倒,而是提醒我们的智慧:它的智能仍然是统计的可能性,而不是理解文明的含义。这个词的肮脏元素就像一个放大镜,它以荒谬的方式在我们面前缺乏语义理解。 AI仍然是远非“像一个人的思考”的最关键步骤之一。因此,我们应该害怕的不是AI很脏,而是我们害怕看到我们创建的肮脏数字改进,但不想承认非常清晰的AI玻璃。欢迎加入Appso AI社区,并一起聊天,一起聊天,Get and I -Unlock我们招募合作伙伴的新知识越多,可以提交简历hr@ifanr.com✉️电子邮件标题标题为“工作名称”(请将项目/契约或相关链接附加到您的简历))
特别声明:本文已由NetEase的自媒体平台“ NetEase”的作者上传和发表,并且仅代表作者的观点。 NetEase仅提供信息发布平台。
注意:上面的内容(包括照片和视频(如果有))已由NetEase Hao用户上传和发布,该用户是社交媒体平台,仅提供信息存储服务。