当前位置: 江南文明网 > 科技 >

从腾讯混元升级,看国产大模型的226天

条评论

从腾讯混元升级,看国产大模型的226天

226天、7个多月后,头部的国产通用大模型已陆续突破了GPT3.5的基准线。

近日,腾讯混元大模型升级,称中文能力整体超过GPT3.5;百度发布文心大模型4.0,表示综合水平与GPT4相比已经毫不逊色;商汤“商量SenseChat2.0”测评表现均领先ChatGPT,部分已十分接近GPT4的水平;科大讯飞发布“讯飞星火”认知大模型V3.0,宣布已全面对标GPT3.5。

“国内(大模型)在GPT3.5这条线都过了,但要理性看待。所谓的超过,可能要基于各自平台和局部的指标,比如利用腾讯混元大模型在广告行业,生成的图片风格、采用率等就小胜GPT4”,腾讯机器学习平台算法负责人康战辉,在腾讯混元大模型升级媒体交流会现场的自我评价,一如既往地非常克制。

当技术逐渐拉齐,除了继续追赶GPT4的步伐,从实验室走向千行百业,一些过去曾被忽视的问题也随之浮出水面:

不计成本,大力出奇迹、扩大参数的暴力路径走不通后,如何才能用较少的成本,达到原来同等或近似的训练、推理效果?

千亿级的大模型和70亿、50亿的中小模型,通用大模型和行业模型、业务场景模型,如何才能优势最大化?

总之,走出象牙塔的大模型,需要在效果、成本支出、商业化三方面,找寻到平衡点。

以上种种问题的答案,或许能从腾讯混元大模型的此次升级中得以一窥。既从一开始的大模型框架底座层去优化设计,并提升推理、训练、数学、代码、文生图等基础能力,也在广告、游戏、会议、文档等优势业务场景实践中摸索。

与其他的大模型相比,腾讯混元是算法与工程优化两条腿走路,底层大模型的能力固然很重要,但在业务场景倒逼出来的实践,更加实用。