随着ChatGPT登台亮相,从科技从业者,到投资圈,再到普罗大众,越来越多人再次关注到了“过气”的AI,及其所能带来的价值和改变。
商业界也的确源源不断贡献着更多新的素材:OpenAI和微软的联姻让性能提升、成本降低成为可能;Google、Meta穷追不舍更新动作;国内,百度、字节、腾讯等大厂,以及众多创业公司,都开始从自己擅长的角度切入竞争……
为了帮助读者能够持续关注由ChatGPT引发的科技圈海啸,36氪推出「Chat AI」栏目,从中立的第三方视角,探索、分析每一次热点背后的商业观点。
作者 | Ben
刚刚看过了“文心一言”发布会,从大模型本身来说已无需过度解读。
从发布会可见,国内厂商的优势更多还是在应用和商业化方面。
发布会”让复杂的世界更简单“的副标题则让人印象深刻。
让复杂的世界更简单
也因此想对百度提出一些建议。
其中比较重要的一点是,能否运用“文心一言”+商业人工智能模型的能力让复杂的“车”变得更简单些?
在这个人工智能可能颠覆一切的时代,在软件重新定义了一遍汽车之后之后,如何用人工智能重新定义汽车或将是对AI厂商大模型能力全面的考验。
如果说“简单”是人作为个体的终极追求之一,起码个人对车的需求也确实如此。
不需要大屏,也不需要智能座舱,只希望车是精确、快捷的点到点工具,能将原来半个小时的路程再多缩短5-10分钟,但这样的车已经越来越少。
过去几年,智能化让乘用车愈加复杂,据说一辆车的代码总量已经达到亿行级,甚至超过最先进的战斗机一个数量级。
分辨不出这个说法是褒义还是贬义,但它毕竟只是个车而已,或许一万行、一百万行代码就足够了,为什么要弄得那么复杂呢?
在智能化的路线上,终端消费者非但没有体验到高等级自动驾驶的红利,却还要为系统巨大的冗余和Bug买单。
我们更希望看到人工智能可以在这些有价值的地方落地。
站在人工智能的角度,百度和谷歌高度类似,在对大模型投入研发的同时,为自动驾驶所投入的精力只怕会更多一些。
古话说“学贵有恒,人贵有专”,很难说OpenAI是不是因为足够专注,所以在大模型上率先取得了突破。
但在下一步,能否借助大模型的能力,从底层实现产业级的颠覆,比如泛出行行业的辅助驾驶、高等级自动驾驶、汽车机器人等赛道;再比如泛内容行业的元宇宙赛道,或许才是诸如谷歌、百度之类AI大厂们一定要扳回一局的发力点。
在未来可见的时间轴内,大模型对行业的颠覆越快越好、越猛烈越好。
已经能明确感受到,产业界也纷纷将启动第四次工业革命的希望寄托于AI和大模型。
1 紧张的倒计时
近两周以来,几乎每一次见人都会被问道两个问题:你们怎么看3月16号“文心一言”的发布?GPT4真的会发布么?
说实话,关于这两个问题,很难听到、也很难预先给出有建设性的观点、意见、或小道消息。
但还是会一遍又一遍的求证、与被求证。
我的回答是,不如把这些问题交给ChatGPT,看看2021年的智能能否解决2023年的疑惑。
还可以想象,3.16的下午和晚间估计会充斥着大量ChatGPT写的“文心一言”发布会报道。
倒计时3天,环境变量开始不断增加。
3月14日,商汤发布了多模态、多任务通用大模型“书生(INTERN)2.5”,并在商汤参与的通用视觉开源平台OpenGVLab开源。
北京时间3月15日凌晨,谷歌官方宣布,正式开放其 PaLM 大型语言模型 API,并将在 Gmail、Docs 等中陆续提供 AI 功能,帮助企业“从简单的自然语言提示中生成文本、图像、代码、视频、音频等”。
但是这些消息几乎石沉大海。
因为几乎与谷歌同时,OpenAI真的发布了GPT4。
尽管GPT4公布的信息中隐藏了太多秘密,按其官方披露“GPT-4通常缺乏对其绝大多数训练前数据在2021年9月中断后发生的事件的知识,并且不从其经验中学习。”模型训练参数的截至时间甚至早于GPT3.5的12月31日。
但是GPT4所展示出来的能力却令人叹为观止,谷歌PaLM可以说被直接钉上了背景墙