阿里巴巴通义千问、商汤日日新、SenseNova体系、华为云盘古、知乎“知海图 AI”、360GPT、昆仑万维“天工”大模型、京东言犀…互联网各个领域的巨头们争相推出了自家的大模型,伴随而来的还有大佬之间许久未见的口水战。
跨界而来的更是不少。4月14日,专注造车的雷军发微博称小米要全力以赴、坚决拥抱大模型和生成式人工智能(AIGC),而由美团联合创始人王慧文、创新工场创始人李开复、搜狗创始人王小川等企业高管领衔的“AI大模型创业军团”,也早对AI大模型风口“虎视眈眈”。
互联网正在迎来“人人都做大模型”的时代。据不完全统计,截至目前,我国已有超过40家公司、机构发布了大模型产品或公布了大模型计划。
这一幕似曾相识。前两年,无论是车企还是手机厂商又或是互联网大厂,接二连三地扎进“造芯”赛道,甚至于连地产、家电、百货、水泥厂等企业也直接横跨到科技业,开始了造芯之路。这些造芯企业发展得如何?一个不乐观的消息是,2022年国内注销吊销的芯片企业高达5746家,同比2021年增长68%。
可以说,风口之下难免导致整个产业鱼龙混杂,而在劣币驱逐良币的效应下,过热可能并不利于产业发展和技术突破。
风口里的“灯下黑”
轰轰烈烈的全民造芯运动,一度把国民对于芯片行业实现国产替代的期待推向高潮,在这种热烈的氛围之中,“造芯”企业如雨后春笋般涌出。
根据企查查数据显示,2020年新增芯片相关企业2.37万家,同比增长160.69%,2021年新增4.79万家,同比增长102.30%,而仅2022年上半年,新增芯片相关企业就高达3.08万家。
当前的大模型热潮,一如当初的芯片产业,尽管技术壁垒极高,但并不妨碍巨头及创业者们一拥而入。4月18日,仅一天,6个关于大模型的重要消息密集公布:钉钉宣布正式接入阿里“通义千问”大模型;字节跳动旗下火山引擎发布自研DPU(数据处理单元)芯片;斑马智行宣布接入“通义千问”大模型,智己汽车成为首个上车品牌…
这场全球性技术浪潮由ChatGPT的爆火而起,ChatGPT在聊天对话、创作剧本、撰写研报、应用编程等方面表现出的能力惊艳四座,让外界看到了生成式AI在生产力和生产效率提升上的巨大变革性力量。或许也是因为在应用层的率先破局,最初国内互联网的关注点更多聚焦在谁能创造出下一个类ChatGPT产品,然而,现在国内的风口却明显转向了大模型。
这其中不单单是阿里、字节跳动、百度等巨头,像商汤科技、昆仑万维等不具备足够数据体量和资金规模的企业也纷纷下场。
在海外,其实切入大模型赛道的还是原来那么几家,而在国内,短短两个月内搞大模型的比美国多出几倍。这固然是因为通用大模型极高的技术门槛让其拥有最大化的价值,吸引了企业的进入,可另一个更为现实的缘由是相比ChatGPT这种能够应用到场景、用户可以看得见摸得着的产品,大模型的认知度较低,显然更容易讲故事、炒概念,获得资本的青睐。
股市已然说明了这一点。昆仑万维宣布联合奇点智源共同研发国产大语言模型“天工”3.5后,次日股价最高涨近16%,两个交易日累计最大涨幅超22%;周鸿祎高调宣布拥抱大模型后,三六零股价也终于摆脱了长期的低迷状态。
根据Wind数据显示,截至4月24日收盘,三六零、昆仑万维、云从科技今年以来股价涨幅达153.52%、287.23%、155.58%。另外,招银国际发表研报指出,因近3个月ChatGPT对相关概念股股价的拉动,芯片、光模块、PCB、服务器年初至今已各涨65%、146%、45%、62%。
虚火过旺,市场泡沫就越大,浑水摸鱼的投机者就越多。当初全民造芯如火如荼,无论大小企业都给自己带了顶“自研”的帽子,但如今那些高喊着实现国产替代口号的企业,早已把所谓斥巨资的造芯计划抛之脑后。而各地产业园,则留下了越来越多烂尾的芯片项目。
自研AI大模型并不比自研芯片容易,且不说当前存在的技术差距,过热的大模型开发赛道,一方面容易衍生出造假骗局,一旦造假成风,真正想搞自研的会越来越少。更重要的是,在围绕生成式AI的庞大产业生态中,当大小巨头们都集中搞大模型去了,相互内耗,反而可能导致停滞。芯片产业便是如此。
内耗“扼杀”科技
ChatGPT的成功得益于微软慷慨的资金和算力支持。美国市场研究机构TrendForce推算称,处理ChatGPT的训练数据需要2万枚GPU芯片,随着OpenAI进一步展开ChatGPT和其他GPT模型的商业应用,其GPU需求量将突破3万张(该报告计算以A100芯片为主)。
而除了微软,还有一家开源公司帮着做部署,也有专门的公司来进行数据清洗,OpenAI只聚焦在模型上。这是基于庞大的产业链和生态所需,从通用大模型到模型训练再到应用开发,以及与特定场景的融合,一家公司根本难以全部包揽,由专攻各个环节的企业之间相互协同,才更有可能实现突破。