这个故事里的场景,现在要在智能手机行业呈现——手机厂商们,开始忙着把大模型装进手机。
在手机上通过云端服务器,使用类似妙鸭相机这样的AI(人工智能)大模型应用,并不是新鲜事。但现在,手机厂商们开始纷纷致力于“云+端”,不仅可以调用云端算力使用各类AI应用,还要直接让大模型运行在手机上。
8月14日,小米集团董事长兼CEO雷军在年度演讲中就透露:小米的大模型团队在今年4月建立,其手机端侧的大模型已经初步跑通。
三天后,小米集团高级副总裁、手机部总裁曾学忠又对媒体表示,基于和高通、联发科的深度底层技术合作和高频沟通,小米很快会推出端侧AI大模型应用。此外,他还表示,端侧AI大模型很可能是为5G而生,“5G的突破载体是AI大模型,这是智能手机的大机遇”。
先行一步的还有华为,其大模型能力已经直接嵌入了手机的操作系统层面。此外,在上海2023MWC(世界移动通信大会)期间,荣耀CEO赵明宣称,荣耀将在智能手机端推动部署端侧大模型,以此作为新一轮产品技术攻坚的起点。
加入了大模型的手机故事,也会产生变化。
试想一下这样的未来:大模型加持下的智能助手,让用户可以在手机等智能终端上,做这些事情:通过自然语言,AI助手能自动管理起所有应用,帮你写邮件、写总结文档;帮你办理银行业务;在你想外出时制定行程订好机票。
当然,手机大模型只是个起点,当智能技术逐步扩展到智能家居、智能汽车等智慧生态中,一个“超级终端”或将出现。
大模型与终端的结合,成为了下阶段AI(人工智能)战场必争之地。
手机疯卷大模型
大模型的战火在今年年中,烧到了手机上。并且,从部署在云端的应用向手机终端蔓延。
雷军年度演讲中对外界表示,小米最新的一个13亿参数大模型已经成功在手机上跑通,部分场景可以媲美60亿参数的模型在云端的运行结果。
在这场演讲进行前,小米大模型的“横空出世”就引发了关注。不久前,小米开发的大规模预训练语言模型MiLM-6B,在C-Eval、CMMLU两个大模型测试榜单中突然现身,分别取得了第十名和第一名的成绩。在行业内,这两个榜单是目前公认比较权威的中文大语言模型评测基准。小米大模型在C-Eval评测榜中的位置,甚至排到了阿里云的通义千问之前。