8月,英伟达发布了二季度财报,财报显示,公司二季度营收135亿美元,创季度新高且同比增长超100%。公司预期三季度该数字将达到160亿美元。与此同时,高端芯片的强劲需求将公司毛利率大幅提升至71.2%,二季度净利润61.8亿美元,同比涨幅达到惊人的843%。
这是什么概念呢?相当于英伟达在三个月时间里多赚了六七十亿美元,而且之后每个季度都有望入账这么多钱,即使放在群英荟萃的硅谷,这样的成绩也足以让大家感到惊讶了。
而营收和盈利背后,是英伟达显卡被疯抢的盛况,即使英伟达今年能预计出货50万块H100显卡,依旧没有满足AI市场的急速扩张的需求,其未来计划将H100显卡的产量至少提高两倍,2024年该显卡的预计出货量会达到150万至200万颗左右。
那么,到底是谁在抢这几十万乃至上百万的显卡呢?
我们或许可以从最近的新闻里一窥端倪,8月29日,总耗资三亿美元的特斯拉GPU集群正式上线,该集群集成了10000 块英伟达的H100 GPU,其主要用途就是帮助训练特斯拉的无人驾驶系统FSD。
作为构筑该集群最重要的一部分,英伟达H100于 2022 年末推出,售价约4万美元,比 前代A100 快 30 倍,AI 训练速度快 9 倍,根据英伟达的介绍,H100 专为视频训练等图形密集型工作负载而设计,且易于扩展,其拥有18,432 个 CUDA 核心, 640 个张量核心 ,80 个流式多处理器 (SM) ,与 A100 相比,H100的高性能计算速度快 5 倍以上。
而由10,000 块H100构筑的GPU集群将提供 340 FP64 PFLOPS 的峰值性能,为人工智能应用提供 39.58 INT8 ExaFLOPS 的峰值性能,峰值性能上已经超越了世界第四高性能超级计算机 Leonardo 所提供的 304 FP64 PFLOPS。
而英伟达第二季度的财报,正是像特斯拉这样的公司做出的贡献,他们投入巨资打造超大型GPU集群,一出手就是购入上万张显卡,让台积电开足了马力生产都赶不上需求的变化。
微软
时间回到5 年前,OpenAI 向微软提出了一个大胆的想法——它可以构建一套人工智能系统,永远改变人类与计算机之间的交互方式。
但是这套人工智能系统并非凭空得来,它需要建立在强悍算力的基础之上,而且光有一套在背后提供助力的基础设施还不够,这还不是一锤子买卖,OpenAI必须能长期稳定地运行这套系统,简而言之,就是要不断地砸钱。
当时,微软 Azure 高性能计算和人工智能产品负责人 Nidhi Chappell 表示:"我们从研究中了解到的一件事是,模型越大,你拥有的数据越多,你能训练的时间越长,模型的准确性就越好。"
为了力挺OpenAI的人工智能,2019年,微软宣布与OpenAI建立合作关系,包括投资10亿美元以及在Azure中建立一个可以训练和运行高级AI模型的计算平台,微软将对Azure进行的改进,以构建超级计算技术。
在Build 2020活动上,微软宣布了这次合作的结果。微软与OpenAI合作,并专门为OpenAI构建了一台新的超级计算机,这台新超算包括了超过28.5万个CPU核心,1万块GPU,每个GPU服务器的网络连接能力为400 gigabits每秒,按照世界超级计算机TOP500的排名,微软打造的这款新型超级计算机位列前五名。