砸崩算力股,重挫英伟达,这份报告究竟说了什么?(图)
隔夜,一份揭示算力市场巨变的报告带崩美国AI概念股。
3月26日,TD证券旗下TD Cowen发布报告称,微软放弃在美欧合计耗电2GW的新数据中心项目,将此归因为计算机集群供应过剩。
受此影响,美股芯片股跌幅扩大,费城半导体指数收跌约3.3%,英伟达收跌超5.7%,领跌科技七巨头,AI概念股普跌,超微电脑收跌近8.9%。
TD Cowen通过渠道调查发现,微软数据中心租赁取消和延期情况比预期更为普遍,不仅包括美国,还扩展到欧洲市场。然而,谷歌和Meta迅速填补空缺,数据中心总需求同比仍在增长。与此同时,超算架构正向更高密度转型,导致设备订单短期放缓,这对设备供应商构成挑战。
此前2月24日,TD Cowen的相关报告就引发市场高度关注,令投资者感到不安。报告称,微软已经取消了与多个私营数据中心运营商的数项租赁协议,涉及功率总计数百兆瓦。这些举动表明,微软可能正处于数据中心“供应过剩”的局面。
下图为TD Cowen两次报告后英伟达股价走势:
微软退租,数据中心供应过剩?
TD Cowen调研显示,微软近期在美国和欧洲大规模取消和推迟了数据中心租约。过去六个月内,微软已放弃超过2GW的数据中心容量,同时取消和推迟了美欧既有的多个租约。
分析认为,微软收缩新容量租赁主要由于决定不再支持增量OpenAI训练工作负载。此外,租约取消和推迟也表明微软现有数据中心供应相对当前需求预测已经过剩。微软此举旨在为自身云和推理工作负载保留中期核心市场容量,同时取消超出其更新后中期容量需求的租约。
然而,这一调整为其他超大规模数据中心运营商创造了机会。报告发现,谷歌正在国际市场填补微软放弃的容量,而Meta则在美国接手相关容量。这两家公司目前都处于数据中心需求同比大幅增长阶段。
Open AI 有潜力在中长期内开始自行建设数据中心
报告指出,OpenAI正越来越多地寻求直接从第三方(包括GPU即服务提供商和第三方数据中心运营商)获取数据中心容量,最近与CoreWeave宣布的交易就是一个例证。
此外,OpenAI展现了显著的长期数据中心容量雄心。调查显示,OpenAI计划创建多个"星门"(Stargate)项目,每个星门代表800MW至1.5GW的容量,潜在总计超过6GW的累计长期容量需求。为满足其容量需求,OpenAI正从其他超大规模运营商招聘具有设计、建设经验以及容量规划经验的人员,这表明OpenAI可能会在中长期开始自建数据中心。
超大规模数据中心设备订单放缓
报告强调,数据中心设备订单正在放缓,这一趋势始于今年1月,源于超大规模运营商正在重新设计其数据中心,以支持更高的机架密度。例如,微软已经敲定了液冷对液冷解决方案(区别于用于数据中心改造的空气辅助液冷解决方案),其他超大规模运营商也在进行类似的重新设计(谷歌在重新设计方面似乎进展最快)。
这些重新设计的衍生影响是,在确定新设计之前,超大规模运营商和支持它们的第三方数据中心运营商基本上无法下单购买设备,因为所需的具体设备类型将根据最终设计而有所不同。供应链调查显示,数据中心设备采购决策被推迟,租赁的超大规模容量订单已被推迟一到两个季度。
这种设备订购短期放缓,加上第三方数据中心运营商为加快未来市场投放速度而进行的大量设备仓储,可能会对2025年上半年Vertiv的设备订单量产生负面影响。
推理之路始于数据中心改造
报告回顾,微软在2024年10月通知选定的数据中心运营商,打算改造现有数据中心以支持液体冷却。最近的调查发现,微软有一项内部计划,通过辅助设备部署空气辅助液体冷却,以支持传统云数据中心更高的机架密度。
有趣的是,Azure基础设施博客在10月(大约在改造通知提供给选定运营商的同时)强调需要使用"独立的液-空热交换器来支持传统数据中心,这些数据中心通常没有配备支持直接到芯片(DTC)液体冷却的基础设施"。调查表明,这种形式的空气辅助液体冷却是改造传统数据中心的更具成本效益的方式,因为它允许在数据中心的某些区域进行"局部冷却"高机架密度负载,而无需改造整个数据中心以支持液体冷却。
重要的是,这些改造的一个关键动机是推理市场的快速进入。通过液体冷却在主要市场收集电力,超大规模运营商已经开始释放可用于推理的电力容量,这比从第三方数据中心运营商获取容量要快得多。至少有两家超大规模运营商正在追求这种近期支持推理的方式。
微软回应
对于TD Cowen的最新报告,微软一位发言人在一份声明中表示:
多亏了我们迄今为止所做出的重大投资,我们已经具备了满足当前及不断增长的客户需求的有利条件。微软公司去年新增的产能创下了历史最高纪录。
虽然我们可能会在某些领域战略性地调整或放缓基础设施建设的步伐,但我们将在所有地区持续保持强劲增长。这使得我们能够为未来的增长领域投资并分配资源。
微软表示,其将在截至6月的本财年内花费约800亿美元建设人工智能数据中心,但此后的增长速度将开始放缓。公司高管们表示,在为支持OpenAI及其他人工智能项目而进行疯狂扩张之后,支出将从新建项目转向为数据中心配备服务器及其他设备。
Meta和谷歌的发言人周三未就TD Cowen的这份研究报告发表评论。
以下为报告全文,由AI翻译:
我们在英伟达 GTC 和 DCD Connect 的渠道检查表明,尽管微软的租赁取消 / 延期情况比最初认为的更为普遍,但数据中心的整体需求仍呈现同比增长。超大规模数据中心运营商对更高密度的重新设计导致数据中心设备采购放缓,我们对 2025 年上半年 Vertiv 订单持负面看法。
超大规模数据中心需求同比增长;微软租赁取消为谷歌和元宇宙创造了机会
上周在圣何塞举行的英伟达 GTC 和本周在纽约市举行的 DCD Connect 的一个明确结论是,超大规模数据中心的整体需求同比增长,这与我们在 2 月下旬强调的因素相同。
具体到微软,自我们发布关于微软租赁取消的初步报告以来,我们进一步的渠道检查表明,受微软租赁取消影响的第三方数据中心运营商名单已经扩大,在美国和欧洲都有租赁被终止。除了租赁取消,我们的渠道检查还指向微软的租赁延期。
将此与我们在 PTC 的收获结合起来,微软在过去六个月中既(1)放弃了在美国和欧洲正在进行租赁流程的超过 2 吉瓦的容量,又(2)在过去一个月内推迟并取消了在美国和欧洲的现有数据中心租赁。我们认为,微软对新容量租赁的撤回主要是由于决定不支持额外的 Open AI 训练工作负载。然而,我们仍然认为,租赁取消和延期表明,相对于其当前需求预测,数据中心存在供应过剩的情况。
因此,我们认为租赁延期旨在为微软在主要市场提供一个中期的容量跑道,以支持云计算 / 推理工作负载,微软取消了超出其更新后的中期容量需求的容量租赁。
对第三方数据中心运营商有利的是,我们的检查显示谷歌正在国际市场上填补微软放弃的容量,而我们的检查显示元宇宙正在填补美国市场的容量,因为这两家超大规模数据中心运营商的数据中心需求都呈现出显著的同比增长。
谷歌的需求增长,我们越来越相信,是由于全球容量短缺,因为其内部需求在 2024 年 8 月底从市场撤回(我们在 2024 年 9 月强调)后增加,这源于一项内部计划,旨在提高其现有数据中心舰队的利用率。至于元宇宙,需求增长是因为它正在大幅增加其数据中心容量以支持 Llama。
另外,我们的检查显示 Open AI 越来越寻求直接从第三方(包括 GPU 即服务提供商和第三方数据中心运营商)采购数据中心容量,其最近与 CoreWeave 宣布的交易就是一个例子。
此外,我们观察到 Open AI 有显著的长期数据中心容量雄心壮志,因为我们的检查显示其打算创建多个星际之门项目,每个星际之门代表 800 兆瓦到 1.5 吉瓦的容量,潜在的长期容量需求总计可能超过 6 吉瓦。
当它寻求满足其容量需求时,我们的检查显示 Open AI 正在从其他超大规模数据中心运营商那里招聘具有设计和施工经验以及容量规划经验的人员,这在我们看来,表明 Open AI 有潜力在中长期内开始自行建设数据中心。
我们的检查显示,由于超大规模数据中心运营商重新设计其未来数据中心以支持更高的机架密度,数据中心设备订单出现放缓,这始于 1 月份,因为英伟达继续迭代其路线图,推动机架密度不断提高。
例如,我们的检查显示微软最终确定了一种液 - 液冷却解决方案(与下面突出显示的数据中心改造中用于空气辅助液冷解决方案分开),其他超大规模数据中心运营商也在进行类似的重新设计(谷歌在重新设计方面似乎是最先进的)。
然而,这些重新设计的衍生影响是,支持超大规模数据中心运营商的超大规模数据中心运营商和第三方数据中心运营商在很大程度上无法在新设计确定之前下达设备订单,因为所需设备的具体类型将根据最终设计而有所不同。
就此而言,我们的供应链检查显示数据中心设备采购决策被推迟,超大规模数据中心租赁容量的订单被推迟了一个到两个季度。
此外,当考虑到第三方数据中心运营商为了加快未来上市速度而进行的相当程度的设备仓储时,我们认为结果是一个 NT 空气口袋在设备订单中,我们相信这可能会对 2025 年上半年 Vertiv 的订单量产生影响。
通往推理的道路已经开始;我们相信这条道路始于超大规模数据中心改造
回想一下,我们在 1 月份强调,微软在 2024 年 10 月通知选定的数据中心运营商,其打算改造现有数据中心以支持液冷。我们在地铁连接的收获中随后指出,我们观察到亚马逊也有类似的改造计划,我们指出这与在主要市场收获电力以及希望在其舰队中实现工作负载的可互换性有关。
通过我们最近的检查,我们了解到微软有一个内部计划,通过侧边车部署空气辅助液冷以在遗留云数据中心中支持更高的机架密度。有趣的是,2024 年 10 月左右(大约与向选定运营商发出改造通知的时间相同)发布的 Azure 基础设施博客文章强调了需要使用“独立的液 - 空热交换器来支持通常没有基础设施支持直接芯片(DTC)液冷的遗留数据中心”。
我们的检查显示,这种形式的空气辅助液冷是一种更具成本效益的改造遗留数据中心的方式,因为它允许对数据中心某些部分的高机架密度负载进行“定点冷却”,而无需改造整个数据中心以支持液冷。
重要的是,我们的检查显示,这些改造的一个关键动机是推理的上市速度。通过在主要市场通过液冷收获电力,超大规模数据中心运营商已经开始比从第三方数据中心运营商那里获得额外容量更快地解锁用于推理的电力容量,至少有两个超大规模数据中心运营商在 NT 支持推理。
因此,我们越来越相信,推理需求的最初指标将是超大规模改造的速度,而不是在主要市场租赁第三方用于现有可用区内的增量子部署(与父子架构相关)的速度。