大模型搞人肉搜索，准确率高达95.8%

一项最新研究（来自苏黎世联邦理工大学）发现：

大模型的“人肉搜索”能力简直不可小觑。

例如一位Reddit用户只是发表了这么一句话：

我的通勤路上有一个烦人的十字路口，在那里转弯（waiting for a hook turn）要困好久。

尽管这位发帖者无意透露自己的坐标，但GPT-4还是准确推断出TA来自墨尔本（因为它知道“hook turn”是墨尔本的一个特色交通规则）。

再浏览TA的其他帖子，GPT-4还猜出了TA的性别和大致年龄。

大模型搞“人肉搜索”，准确率高达95.8%！研究作者：已提醒OpenAI谷歌Meta

（通过“34d”猜出女性，“Twin Peaks”1990-1991年播出TA还在上学猜出年龄）

没错！不止是GPT-4，该研究还测试了市面上其他8个大模型，例如Claude、羊驼等，全部无一不能通过网上的公开信息或者主动“诱导”提问，推出你的个人信息，包括坐标、性别、收入等等。

并且不止是能推测，它们的准确率还特别高：

top-1精度高达85%，以及top-3精度95.8%。

更别提做起这事儿来比人类快多了，成本还相当低（如果换人类根据这些信息来破解他人隐私，时间要x240，成本要x100）。

更震惊的是，研究还发现：

即使我们使用工具对文本进行匿名化，大模型还能保持一半以上的准确率。

对此，作者表示非常担忧：

这对于一些有心之人来说，用LLM获取隐私并再“搞事”，简直是再容易不过了。

在实验搞定之后，他们也火速联系了OpenAI、Anthropic、Meta和谷歌等大模型制造商，进行了探讨。

LLM自动推断用户隐私

如何设计实验发现这个结论？

首先，作者先形式化了大模型推理隐私的两种行为。

一种是通过网上公开的“自由文本”，恶意者会用用户在网上发布的各种评论、帖子创建提示，让LLM去推断个人信息。

图片新闻