大模型竞速绝非“大厂游戏”

阿里云大模型通义千问正式官宣。近日，大模型领域“新兵”不断涌现，王小川的百川智能、商汤科技“日日新”、昆仑万维“天工”……无论是否与互联网领域直接相关，企业们入局ChatGPT的速度与热情丝毫不受影响。越来越多的互联网大佬下场创业，体量较小的企业也纷纷推出自己的大模型。围观者惊叹，原来高投入的大模型从来都不只是“大厂之间的游戏”，大家争分夺秒的到底在争抢什么？

　　“诸神之战”

　　一天之内，大模型领域迎来了三位重量级的嘉宾。

　　先是搜狗公司创始人王小川，一封公开信正式宣告了“百川智能”的诞生。据了解，百川智能旨在打造中国版的OpenAI基础大模型及颠覆性的上层应用。

　　紧接着，两家公司先后官宣。在当天的技术交流日上，商汤科技董事长兼CEO徐立展示了“日日新”体系下的语言大模型“商量”，据悉，这是一个1800亿参数的中文大语言模型，可实现多轮对话、逻辑推理、语言纠错、内容创作、情感分析等。

　　与此同时，昆仑万维也表示，即将推出对标ChatGPT的双千亿级大语言模型“天工”3.5，并定于4月17日启动邀请测试。当晚，昆仑万维发布2022年年报，明确提到“未来10年将坚定的‘All in’AGI与AIGC。”

　　大模型成了这一轮AIGC浪潮的兵家必争之地。百度“文心一言”、阿里“通义千问”、腾讯“混元”、京东“ChatJD”、华为“盘古”，传统大厂无一掉队。

　　垂直领域诸多企业纷纷入局，除商汤科技及昆仑万维外，科大讯飞也在互动平台表示，将于5月6日发布讯飞预训练大模型的详细信息，大模型将用于教育、翻译等领域。

　　互联网大佬们更不畏惧大模型的“从0到1”。公开报道显示，王慧文的 “光年之外”A 轮融资后估值已达到10亿美元，前商汤科技副总裁闫俊杰新公司MiniMax的首款大模型产品Glow累计用户已突破百万。

　　华西证券研报总结了现有国产大模型的两个特征：一是头部厂商主导，to B为主要模式，赋能原有优势业务；二是均未对公众大面积开放，未有明确的to C入口，实际水平不透明。

　　通用还是垂直

　　AIGC产业主要分为基础和应用两个层面，前者包含理论框架的搭建、大模型的训练以及算法等，大投入、智力密集和长期性三个特点缺一不可。而后者主要是将别人开发出的东西与自己的业务进行整合，见效快，成本相对也较低。

　　而这也是当下中国AIGC企业押注的两个方向。有人势要成为中国的OpenAI，但也有人将目光瞄准了垂直领域的应用。

　　天使投资、资深人工智能专家郭涛表示，根据AI大模型应用范围的不同，可以分为通用型大模型和产业型大模型，通用型AI大模型在企业级与消费级市场都拥有广泛的应用场景，如OpenAI旗下的ChatGPT；而产业型的AI大模型主要应用于垂直行业或细分应用场景，如京东旗下的ChatJD。

　　“整体来看，通用型大模型应用场景相比产业型大模型更为广泛，随着规模化、多样化应用场景的落地，促使算法模型快速迭代升级，不断丰富和拓展新的应用场景，市场竞争力也将会不断增强。”郭涛认为。

　　但全联并购工会信用管理委员会专家安光勇则提到，通用大模型在应对多样化任务时具有竞争力，而专业大模型在特定领域有深厚的技术积累和应用优势。

　　安光勇认为，体量相对较小的企业在大模型领域与“大厂”抢的主要是技术创新和应用场景的拓展。相较于大厂，“小厂”在技术创新上通常更加灵活和敏捷，能够迅速响应市场需求，快速推出具有差异化和竞争力的大模型产品。

　　此外，小厂在应用场景上可能更加专业化和垂直化，能够深入某一领域或行业，提供定制化的解决方案，满足特定客户的需求。此种专业化和灵活性为小厂在大模型领域与大厂竞争中带来了一定的优势。

　　“‘大厂更适合做模型’其实是一种惯性思维。”元语智能联合创始人兼COO朱雷解释称，通用的大模型解决不了具体行业的问题，尤其是在国内，大部分高质量中文语料都在行业内，而不在公域的互联网内，即便是大厂也很难拿到行业数据，从这个角度上看，专用的模型在特定领域的效果一定要比大公司的通用模型更合适。

大模型竞速绝非“大厂游戏”

大模型竞速绝非“大厂游戏”

图片新闻

热门

推荐