首页新闻文化生活科技金融教育房产体育健康旅游汽车美食摄影图片

当前位置：江南文明网 > 科技 >

谷歌PaLM 2弱爆LLM大排名屈居第六

谷歌PaLM 2弱爆LLM大排名屈居第六

，谷歌PaLM 2也被拉上溜了溜。然而，实测表现却让人大跌眼镜。

由UC伯克利主导的「LLM排位赛」又双叒更新了！

这次，最新榜单又迎来新的玩家，PaLM 2（也是就Bard）、Claude-instant-v1，MosaicML MPT-7B，以及Vicuna-7B。

值得一提的是，即便是平价版的Claude模型，Elo得分也赶超了ChatGPT。

但有一位选手的表现，却出乎意料得拉跨——谷歌PaLM 2屈居第六，排在了Vicunna-13B之后。

4月24日-5月22日数据

PaLM 2（Bard）排位大比拼

谷歌PaLM 2发布以来，根据论文的测试，其部分性能已经超过了GPT-4。

而它的具体表现如何？

来自LMSYS Org的研究人员通过Google Cloud Vertex AI的API接口，将PaLM 2添加到Chatbot Arena，并以代码名为chat-bison@001进行聊天调优。

在过去的两周，PaLM 2已经与16个聊天机器人，进行了大约1800次的匿名比拼，目前排名第六。

从排行榜中可以看出，PaLM 2的排名高于所有其他开源聊天机器人，除了Vicuna-13B。

图片新闻

: 1-3！巴萨吞下9年首败

: 忽然，想去湖北了！

: “黑科技”助力春耕无人作业赋新能

: 打破“数据孤岛” 多方部署加快数据要

热门

谷歌PaLM 2弱爆LLM大排名屈居第六

通用汽车董事长访华，能否挽救下滑销

比亚迪等中国汽车制造商是我们最大竞

微调模型AI或可成为供医生研究的“精神

FDA 批准了马斯克脑机接口的真人手术

中国这么大一个国家至少需要50个清华

外媒体验的深圳无人机外卖「起飞」了

卷出两大世界第一的山东最强民企，要

我们在BabyAGI/AutoGPT之前就有了这个想法

新终结者电影剧本由ChatGPT写！天网大结

推荐

微博一季度总营收28.5亿

明年的苹果才是新看点，预计iphone11s会

广东民企新“一哥”：首超华为，年进

RedmiA9手机是否更适合老人与学生

美激进投资者ValueAct买入11亿美元任天堂

热点景德镇国资委拟入主音飞储存

三星Note10+很好用！屏幕看着很舒服，但

“跳水”3000的三星旗舰，搭配骁龙855，

NASA下一轮探索级任务将前往金星、木卫

最新汽车经销商线下门店复工两成多家