长文本信息准确率超过ChatGPT

大模型的幻觉问题，又有新的解决方法了！

Meta AI实验室提出了一种“分而治之”的解决方案。

有了这个方案，Llama-65B输出的信息准确率提升了一倍，甚至超过了ChatGPT。

所谓大模型幻觉，就是输出一些看似合理但完全不对的内容。

Meta此次提出的“验证链”（CoVe），是与“思维链”（CoT）相似的一种链式方法。

区别在于，“step-by-step”的思维链更关注逻辑推理，而验证链更注重事实信息。

有网友看了之后发现，这个验证链很像是自己用ChatGPT写代码时的一种科学方法：

那么“验证链”究竟是个什么方法，“验证”的又是什么呢？

拆解答案，分而治之

验证链的核心思想，是把要验证的一大段内容，拆解成一个个小的问题，具体流程是这样的：

首先，模型会根据用户提出的问题照常生成回复。

接着，根据生成的回复内容，针对其中的各项信息，生成一系列的验证问题。

然后让模型自行回答其所提出的这些问题，并根据结果对初始答案进行调整，得到最终结果。

举个简单的例子，假如想询问模型19世纪美墨战争的主要原因是什么。

模型回答了事件发生的时间，以及在这之前都发生了什么事。

之后针对这一系列事件，逐一询问它们是什么时候发生的。

于是，模型发现自己提到的一项内容时间相差太远，调整后给出了最终的答案。

其中，问题的生成和验证是最关键的一环，对此，研究人员一共提出了四种具体的方式：

这四种模式越来越细化，准确率也是越来越高。

图片新闻