从腾讯混元升级，看国产大模型的226天

226天、7个多月后，头部的国产通用大模型已陆续突破了GPT3.5的基准线。

近日，腾讯混元大模型升级，称中文能力整体超过GPT3.5；百度发布文心大模型4.0，表示综合水平与GPT4相比已经毫不逊色；商汤“商量SenseChat2.0”测评表现均领先ChatGPT，部分已十分接近GPT4的水平；科大讯飞发布“讯飞星火”认知大模型V3.0，宣布已全面对标GPT3.5。

“国内（大模型）在GPT3.5这条线都过了，但要理性看待。所谓的超过，可能要基于各自平台和局部的指标，比如利用腾讯混元大模型在广告行业，生成的图片风格、采用率等就小胜GPT4”，腾讯机器学习平台算法负责人康战辉，在腾讯混元大模型升级媒体交流会现场的自我评价，一如既往地非常克制。

当技术逐渐拉齐，除了继续追赶GPT4的步伐，从实验室走向千行百业，一些过去曾被忽视的问题也随之浮出水面：

不计成本，大力出奇迹、扩大参数的暴力路径走不通后，如何才能用较少的成本，达到原来同等或近似的训练、推理效果？

千亿级的大模型和70亿、50亿的中小模型，通用大模型和行业模型、业务场景模型，如何才能优势最大化？

总之，走出象牙塔的大模型，需要在效果、成本支出、商业化三方面，找寻到平衡点。

以上种种问题的答案，或许能从腾讯混元大模型的此次升级中得以一窥。既从一开始的大模型框架底座层去优化设计，并提升推理、训练、数学、代码、文生图等基础能力，也在广告、游戏、会议、文档等优势业务场景实践中摸索。

与其他的大模型相比，腾讯混元是算法与工程优化两条腿走路，底层大模型的能力固然很重要，但在业务场景倒逼出来的实践，更加实用。

图片新闻