首页新闻文化生活科技金融教育房产体育健康旅游汽车美食摄影图片

当前位置：江南文明网 > 科技 > 智能 >

北大团队：诱导大模型“幻觉”只需一串乱码！

北大团队：诱导大模型“幻觉”只需一串乱码！

北大团队最新研究发现：

随机token都能诱发大模型出现幻觉！

比如喂给大模型（Vicuna-7B）一段“乱码”，它就莫名其妙弄错了历史常识。

或者是简单修改提示词，大模型也会掉入陷阱。

Baichuan2-7B、InternLM-7B、ChatGLM、Ziya-LLaMA-7B、LLaMA-7B-chat、Vicuna-7B这些热门大模型，都会出现类似情况。

这意味着，随机字符串能够操控大模型输出任意内容，为幻觉“代言”。

以上发现来自北大袁粒老师课题组的最新研究。

该研究提出：

大模型的幻觉现象极有可能是对抗样本的另一种视角。

论文在展示两种容易诱发大模型幻觉方法的同时，还提出了简单有效的防御办法，代码已开源。

两种极端模式攻击大模型

研究提出了两种幻觉攻击方法：

随机噪声攻击（OoD Attack）：即让无意义的随机字符串诱导大模型产生预定义的幻觉输出。
弱语义攻击（Weak Semantic Attack）：即保证原始 prompt 语义基本不变的情况下，使得大模型产生截然不同的幻觉输出。

随机噪声攻击（OoD Attack）：

以下为在开源大模型上的一些实验结果，更多的结果可以在论文或开源GitHub中找到。

图片新闻

: 微软升级网页版 Excel 表格软件

: 前三季度我国工业经济平稳运行

: GPT-4V被曝离谱bug

: 突然执行神秘代码，空白图片读出打折

热门

北大团队：诱导大模型“幻觉”只需一

姚期智等 AI 专家：2025 年 AI 规模暴增

万兴科技前三季度收入增长30.69%

11 月 17 日起未经官方授权配件将被禁用

蔚来回应“NIO Phone手机是否OPPO代工”

理想汽车公布 5C 超充站进展

昆仑万维开源「天工」13B系列大模型

ChatGPT Plus 会员推出新的测试版功能

百川智能推大模型Baichuan2-192K

微软更新 Microsoft Store 支持文档

推荐

机电一体化产业与现代电子技术高度融

苹果 iOS 17 系统安装率低迷

诺基亚5.3真机上手，顶配才1200元！

2000元以内就没有高性能的手机了？这次

京东方或许能为iPhone8系列新机提供OLE

在油画一般美丽的新疆景色下，黝黑的

荣耀真香机销量逆袭，仅次于iPhone11

从2199元跌至1968元！还是120Hz＋256GB！

Q1最值得买的双模5G旗舰不知道它们你可

平板电脑，能否再以实用的名义打动用