首页新闻文化生活科技金融教育房产体育健康旅游汽车美食摄影图片

当前位置：江南文明网 > 科技 >

GPT-4的视觉能力还没全量放开测试

GPT-4的视觉能力还没全量放开测试

GPT-4的视觉能力还没全量放开测试，开源对手就隆重登场了。

浙大竺院的一位校友，与微软研究院等机构合作推出了新版多模态模型LLaVA。

LLaVA在11个测试数据集上都成为了SOTA，在GitHub上更是斩获6k+星标。

挑战GPT-4V，浙大校友推出开源版多模态大模型，获GitHub 6k+星标

开发者提供的数据显示，LLaVA的综合能力已经达到了GPT-4V水平的85%，在复杂推理任务上更是超过了96%。

挑战GPT-4V，浙大校友推出开源版多模态大模型，获GitHub 6k+星标

读验证码、判断狗的品种，甚至根据图像生成网页代码……都难不倒LLaVA。

△/Matt Shumer

资源方面，LLaVA的样本量仅为120万，在单台8*A100的机器上，1天就能完成训练。

不过体验过的网友普遍表示，LLaVA离GPT-4V还存在一些差距。

图片新闻

: 国庆长途出行开纯电车的都是勇士？

: 曾经对标汉兰达

: 丰田全新SUV曝光！

: 英菲尼迪Q50L 6.5折甩卖17.2万起！

热门

GPT-4的视觉能力还没全量放开测试

为算法模型发展划“红线”

网易有道推出全球首个虚拟人口语私教

谷歌Bard负面问题越来越多

算力资源仍是制约国内AI市

消息称OpenAI将推出大更新

美国科技巨头机器人误称巴以停火

以色列的军事科技实力

米家更多采用蓝牙Mesh协议

智能家居行业已经宣布进入智能家居3

推荐

智能驾驶芯片战火缭绕

趣闻富士康防疫升级全力保证新iPhon

趣闻收快递请注意，快递柜要收保管费

传苹果砍单AirPods耳机

Redmi K30Pro称堆料狂魔但难掩致命缺点！

三星Galaxy A52 5G直接将屏幕刷新率提升至

vivo真狠心发布不到四个月直降700

三星S21再确认：首发骁龙875＋屏下摄像

看点 Fossil HYBRID HR智能复合腕表上市机

16岁成电脑黑客，因起床气爸爸拔走键盘