当前位置: 江南文明网 > 科技 >

“零一万物”大模型被指抄袭

条评论

“零一万物”大模型被指抄袭

微信群流传着一张图,阿里前AI科学家贾扬清指称,某国产大模型实际上是抄袭的LLaMA,然后更换了几个变量名就宣称是自己研发。

但他没有明确指出该模型的名字。

 

但有国外开发者直接点名,这个抄袭的模型就是李开复旗下的“零一万物(Yi-34B)”,在零一万物的Hugging Face 开源主页上,开发者 ehartford 质疑称该模型使用了Meta LLaMA 的架构,只修改了两个tensor(张量)。

 

LLaMA是Facebook母公司meta旗下的开源大模型,扎克伯格表示,该模型的许可为“开源可免费商用。”

 

一个星期前,李开复带领零一万物团队亮相,发布“首款预训练大模型 Yi-34B”,该团队的技术负责人是Pretrain 负责人黄文灏和 AI Infra 负责人戴宗宏。

零一万物自己宣传说, AI Infra 的负责人戴宗宏,是前华为云 AI CTO 及技术创新部长、前阿里达摩院 AI Infra 总监。他带领的这支 Infra 团队,核心成员是来自阿里、华为、微软、商汤等公司的技术专家,曾参与支持过 4 个千亿参数大模型规模化训练,管理过数万张 GPU 卡。