“历史不会简单重复,它会押着同样的韵脚。”
几经跌宕,人工智能浪潮踏着生成式AI热度与大模型浪潮,再次攀上上升周期。13日,网信办等七部门正式发布《生成式人工智能服务管理暂行办法》(简称“《办法》”),行业人士认为,《办法》的迅速出台一方面证明了政策监管的敏捷高效,同时也佐证了当下大模型技术发展与行业影响的广泛。
为形容当下大模型现状,经纬创投创始管理合伙人张颖引用了一个调研数据——从今年3月到5月,召开业绩电话会议的标普500指数的公司中,有110家公司的高管提到了AI,这是过去十年的3倍。火热如斯,但周期恒在,在达到热度高点后,本次人工智能必然回归冷静波段,寻找商业化路径解决方案,落地商业本质。
对比国内人工智能AI1.0,如今的AI2.0较其有雷同之处,亦有升级迭代的进步。如在行业红利显露初期,大量资本与创业者涌入,百模大战。而在差异性方面,行业尤为关注凭借底层算法的升级、大模型泛化能力,以及2.0时代的人工智能能否解决1.0最为致命的商业化落地难题。
为什么此时火了?
人工智能行业已存在数十年,为什么大模型与生成式AI等到今天才火?
AI教父、图灵奖获得者杰弗里·辛顿早于1986年便在《自然》杂志发表自监督学习语言模型成果,可预测句子最后单词,可谓生成式大模型鼻祖,但当时的辛顿只能使用112个句子的数据,同时缺乏相应算力支持。
辛顿表示,AI领域有两种思路——一种是关于推理与逻辑的主流AI,一种是基于生物学的神经网络。“神经网络在20世纪80年代没有真正奏效的唯一原因是计算机运行速度不够快,数据集不够大。”辛顿称,主流AI派当时认为一个拥有大量神经元的大型神经网络,基于计算节点与它们之间的连接,仅通过改变连接强度便能实现从数据中学习,这个想法十分荒谬。
因此那个时候,计算机科学领域的人们对神经网络失去了兴趣。而现在,计算机速度快了数百万倍,如果用1986年的计算机去学习一些东西,辛顿称,过程只需要几秒钟。
2006年,辛顿团队开始进行所谓的深度学习训练,并找到预训练模式。在ChatGPT中,P代表预训练,T代表转换器,P代表生成。回忆过去,辛顿表示在2012年发生了两件大事——一是语音是被技术改进,并被推广至微软、IBM与谷歌等大型语音识别实验室;二是李飞飞与合作者创建了一个大型图像数据库,并对图像中的主要物体进行猜测。“那些曾坚定反对神经网络的人看到这些方法成功后,发现这种方法更有效,于是他们改变了立场。”辛顿称。
在第四范式联合创始人/首席架构师胡时伟看来,AI从1956年提出历经几次起伏,AI在业界或大众生活当中形成浪潮往往来自里程碑式的事件,如AlphaGO战胜人类,以及ChatGPT可以进行很好的对话等。这中间的沉寂期,来自大众预期无法满足,往往在沉寂期之内是真正数字化产业和AI产业带来价值产生沉淀的部分。
而从技术原理来讲,胡时伟表示,AI应用发展有一个规律——从小的模型到大的模型,整个AI使用从专用到通用。最早人类专家通过写规则让机器程序呈现某种智能特点,这时还是专用小模型。80年代以后,无论是统计学习还是神经网络,行业可以用这些技术让机器写少量的规则,但依然是专用某个小模型的阶段。2010年之后,搜索、推荐电商、人脸识别等场景,可以通过机器用海量数据撰写大量规则解决问题,对生产生活发生的作用。如今,海量规则加上千亿学习与强化学习基数,便出现了单一大模型解决多个问题的通用大模型技术。