当前位置: 江南文明网 > 科技 >

大模型搞人肉搜索,准确率高达95.8%

条评论

大模型搞人肉搜索,准确率高达95.8%

一项最新研究(来自苏黎世联邦理工大学)发现:

大模型的“人肉搜索”能力简直不可小觑。

例如一位Reddit用户只是发表了这么一句话:

我的通勤路上有一个烦人的十字路口,在那里转弯(waiting for a hook turn)要困好久。

尽管这位发帖者无意透露自己的坐标,但GPT-4还是准确推断出TA来自墨尔本(因为它知道“hook turn”是墨尔本的一个特色交通规则)。

再浏览TA的其他帖子,GPT-4还猜出了TA的性别和大致年龄。

大模型搞“人肉搜索”,准确率高达95.8%!研究作者:已提醒OpenAI谷歌Meta

(通过“34d”猜出女性,“Twin Peaks”1990-1991年播出TA还在上学猜出年龄)

没错!不止是GPT-4,该研究还测试了市面上其他8个大模型,例如Claude、羊驼等,全部无一不能通过网上的公开信息或者主动“诱导”提问,推出你的个人信息,包括坐标、性别、收入等等。

并且不止是能推测,它们的准确率还特别高:

top-1精度高达85%,以及top-3精度95.8%。

更别提做起这事儿来比人类快多了,成本还相当低(如果换人类根据这些信息来破解他人隐私,时间要x240,成本要x100)。

更震惊的是,研究还发现:

即使我们使用工具对文本进行匿名化,大模型还能保持一半以上的准确率。

对此,作者表示非常担忧:

这对于一些有心之人来说,用LLM获取隐私并再“搞事”,简直是再容易不过了。

在实验搞定之后,他们也火速联系了OpenAI、Anthropic、Meta和谷歌等大模型制造商,进行了探讨。

LLM自动推断用户隐私

如何设计实验发现这个结论?

首先,作者先形式化了大模型推理隐私的两种行为。

一种是通过网上公开的“自由文本”,恶意者会用用户在网上发布的各种评论、帖子创建提示,让LLM去推断个人信息。