ChatGPT 没有护城河，开源才是大模型未来

今晨，一篇来自 Google 内部泄漏的文件在 SemiAnalysis 博客传播，声称开源 AI 会击败 Google 与 OpenAI，获得最终的胜利。「我们没有护城河，OpenAI 也没有」的观点，引起了热烈讨论。

据彭博社报道，此文作者为 Google 高级软件工程师 Luke Sernau，4 月初在 Google 内部发布后就被分享了数千次。

自称 AI-first 的 Google，近几个月以来一直在经历挫败。

2 月，Google Bard 公开演示失误，市值蒸发千亿。3 月，将 AI 整合进办公场景的 Workspace 发布，却被整合了 GPT-4 的 Copilot 抢尽风头。

在赶潮的过程中，Google 一直显得谨小慎微，未能抢占先机。

在此背后，是 Google CEO 皮查伊倾向渐进式，而不是大刀阔斧的改进产品。部分高管也不听从他的调度，或许是因为，大权压根不在皮查伊手里。

如今，Google 联合创始人拉里·佩奇虽然已经不太插手 Google 内部事务，但他仍然是 Alphabet 的董事会成员，并通过特殊股票控制着公司，近几个月还参加了多场内部 AI 战略会议。

Google 面临的问题，每一个都困难重重：

1.CEO 行事低调，联合创始人拉里·佩奇通过股权控制着公司；

2.「开发产品但不发布」的谨慎，让 Google 多次失去先机；

3.更加视觉化、更具交互性的互联网，对 Google 搜索造成威胁；

4.多款 AI 产品市场表现不佳。

内忧外患之中，Google 被笼罩在类似学术或政府机构的企业文化之下，充斥着官僚主义，高层又总是规避风险。

我们整合翻译了全文，对 Google 来说，开源或许不是压死骆驼的最后一棵稻草，而是它的救命稻草。

核心信息提炼

Google 和 OpenAI 都不会获得竞争的胜利，胜利者会是开源 AI

开源 AI 用极低成本的高速迭代，已经赶上了 ChatGPT 的实力

数据质量远比数据数量重要

与开源 AI 竞争的结果，必然是失败

比起开源社区需要 Google，Google 更需要开源社区

我们一直在关注 OpenAI 的动向，谁会达到下一个里程碑？下一步会是什么？

但不得不承认，我们和 OpenAI 都没有赢得这场竞争，在我们竞争的同时，第三方力量已经取得了优势。

我说的是开源社区。简单地说，他们正在超越我们。我们认为的「重大问题」如今已经得到解决并投入使用。举几个例子：

手机上的 LLM：人们可以在 Pixel 6 上以每秒 5 token 的速度运行基础模型；

可扩展的个人 AI：你可以一个晚上就在笔记本电脑上微调一个个性化 AI；

负责任的发布：这个问题不是「解决了」，而是「消除了」。互联网充满了没有限制的艺术模型，语言模型也要来了；

多模态：当前的多模态 ScienceQA SOTA 在一小时就能完成训练。

虽然我们的模型在质量方面仍然有优势，但差距正在以惊人地速度缩小。开源模型更快、更可定制、更私密，而且性能更强。他们用 100 美元和 130 亿参数做到了我们使用 1000 万美元和 5400 亿参数下也很难完成的事情。而且他们用的时间只有几周，而不是几个月。这对我们意味着：

我们没有秘密武器。我们最好的方法是向 Google 外的其他人学习并与他们合作，应该优先考虑启用第三方集成。

当有免费、无限制的替代品时，人们不会为受限制的模型付费，我们应该考虑我们真正的价值在哪里。

庞大的模型正在拖慢我们的步伐。从长远来看，最好的模型是可以快速迭代的模型。既然我们知道在参数少于200亿的情况下有什么可能，我们应该更关注小型变体。