英伟达 Earning Call 机会最深解读
neocloud,光,CPU,液冷,边缘计算,物理AI,6g,存储管理,能源infra,英伟达OEM
英伟达 财报这么多人盯着,其实已经没什么好看的了。重要的是,听老黄说了供应链什么事情。目前看neocloud,光,CPU,液冷,边缘计算,物理AI,6g,能源infra,存储管理,NV-link半开放,尤其是英伟达下场做存储管理,AI-RAN(诺基亚我已经说得不能再说了,本来我期待的是28年6g,现在技术上已经临近了),这还是早期叙事,neocloud,cpu,远远超出预期,这些是绝对深挖的点。
同时英伟达 通过XAI深入A社,同时也打入了各大hyperscaler的某些领域的首批解决方案。更加根深蒂固。
0. Earning Call 原文与解读
Colette Kress:谢谢Toshiya。本季度表现卓越,收入、营业利润和自由现金流均刷新历史纪录。总收入820亿美元,同比+85%、环比+20%。这是同比增速连续第三个季度加速,也是连续第14个季度环比增长,在我们这个体量和制造复杂度下属不易。环比增加135亿美元也是历史最大单季增量。
我们抓住了推理需求的拐点,把Blackwell系统在多元化客户群中大规模上量,覆盖hyperscaler、模型厂商、AI云服务商和sovereign客户。本季度,我们在R&D、生态投资和回购上有效配置资本,向股东返还创纪录的200亿美元,同时执行了上游供应链和下游go-to-market生态的战略投资。这对市场培育和我们的长期定位至关重要。
上下游战略投资被独立列为capital allocation的条目,与R&D和shareholder return并列。这是NVIDIA第一次明确把自己定位为产业资本配置者。Upstream投资指向TSMC CoWoS / HBM预付款 + IREN这类power+DC运营商投资。Downstream指向CoreWeave、Lambda、xAI、Together AI、2025年4月被收购的Lepton AI等。Q1单季strategic investment $18.6B,年化$70-80B级别,是一级市场AI infrastructure企业最大的资金源。
数据中心收入750亿美元,同比+92%、环比+21%,由Blackwell架构持续强劲驱动。GB300和NVL72需求尤其强劲,frontier模型厂商和hyperscaler已累计部署数以千计的Blackwell GPU,这是公司历史上最快的产品ramp。Grace Blackwell是最快的训练系统,也是推理token生成成本最低的平台。
这部分老生常谈并非预期之外。GB300是Blackwell Ultra系列,NVL72是72颗GPU + 36颗Grace CPU的rack-scale系统。每个NVL72 rack价格约$300万、功率120kW+,这种密度强制液冷部署。NVL72 rack的BoM拆解涉及GPU + Vera CPU、NVLink switch、48V DC电源分配、液冷CDU + manifold + quick-disconnect、铜缆 + 光纤、机柜结构。受益供应链:液冷的Vertiv / Coolit / Asetek,国内英维克 / 高澜;电源的Delta / Schneider,国内麦格米特 / 欧陆通;高速铜缆的Amphenol / TE,国内立讯精密 / 中航光电。
Spectrum-X作为我们为AI构建的端到端以太网平台,目前规模已超过所有以太网同业之和。InfiniBand本季也表现强劲,同比增长超4倍,由下一代XDR部署推动。为方便建模,数据中心计算收入600亿美元,同比+77%;数据中心网络收入150亿美元,同比近3倍。
AI 训练要让成千上万张 GPU 协同工作,节点之间得高速交换数据。普通的数据中心网络速度远远不够,会让昂贵的算力大量闲置。InfiniBand 和 Spectrum-X 就是解决这个问题的两套专用高速网络方案,都由 NVIDIA 主导。
InfiniBand 是老牌方案,原本服务于超算,如今成为 AI 训练的事实标准。速度极快、延迟极低,但属于一套独立的专用技术体系,只有 NVIDIA 一家在做,价格也贵。OpenAI 的 Stargate 集群(6.4 万张 GB200)、Oracle 的 13 万 GPU 超算等顶级部署都采用 InfiniBand 互联 。
Spectrum-X 是 NVIDIA 2023 年推出的新方案,思路是把全球数据中心通用的以太网升级改造,让它跑出接近 InfiniBand 的速度。性能比 InfiniBand 略低,但兼容现有设备和运维体系,企业部署更省力。Meta 与 Oracle 已经把它作为开放、加速的 AI 网络架构标准化部署。
简单说,NVIDIA 同时卖这两套 Scale Out 方案:追求极限性能的训练集群通常选 InfiniBand,希望沿用熟悉网络体系的企业 AI 场景倾向 Spectrum-X。另外下一代Rubin的NVL576会把NVLink域扩展到576颗GPU。这种规模下铜缆可能物理上不够(NVL72已经接近铜缆物理极限),所以NVL576很可能引入光NVLink,因此要站在光里。
Spectrum-X超过所有Ethernet同业合计这一表述按部署带宽和端口数算,对应NVIDIA Ethernet AI业务运行率$80B+量级(粗略估算)。InfiniBand XDR是800Gbps单端口,4倍YoY增长说明训练集群IB没被Spectrum-X替代,而是并行分工:IB服务训练,Spectrum-X服务推理 + scale-out。光模块产业链最直接受益:Coherent、Lumentum、Corning(press release提到的多年战略协议),国内中际旭创、新易盛、华工科技、剑桥科技、天孚通信。
在深入数据中心之前,先简要介绍我们正在转向的新报告框架。我们有两个市场平台:数据中心和边缘计算。数据中心下分两个子市场:Hyperscale和ACIE(涵盖AI云、工业和企业)。Hyperscale包含公有云和全球最大的消费互联网公司;ACIE对应跨行业、跨国家的AI专用数据中心和AI工厂增长机会。边缘计算覆盖agentic AI和physical AI设备,包括PC、游戏机、工作站、AI-RAN基站、机器人和汽车。
报告框架重构是这场call最隐性但最重要的变化,也是我提早一年看到nbis的原因。把ACIE单独列出让sovereign AI、企业on-prem、AI native cloud成为独立story,支撑NVIDIA估值上修。类似Microsoft当年把Azure从Server Tools里拆出来。ACIE作为分部之后,分析师可以单独建模并给溢价。受益对应市场:CoreWeave、Nebius、Applied Digital、IREN,未来可能上市的Crusoe、Lambda、Together AI。
回到数据中心。Hyperscale收入380亿美元,约占数据中心收入的50%,环比+12%。ACIE收入370亿美元,环比+31%,其中AI云收入同比增长超3倍。客户已具备快速搭建AI算力的能力。10兆瓦以上的合作数据中心数量一年内近乎翻倍,目前超过80个站点。Sovereign收入同比增长超80%。NVIDIA AI基础设施已部署于近40个国家,对应50万亿美元GDP。
Hyperscale 12% QoQ vs ACIE 31% QoQ,ACIE环比增速是Hyperscale的2.5倍。两块体量接近1:1。AI cloud部分3倍YoY是CoreWeave、Lambda、Crusoe、xAI等non-hyperscale算力供应方的增长信号。80个10MW+ partner DC对应总容量800-1500MW新增。每个10MW站点power infra capex约$30-50M(估算),80站点累计power infra市场$2.4-4B直接受益方。Sovereign +80% YoY对应40国部署,sovereign deals每个$1-10B级别。中东(HUMAIN、G42)、欧洲(Mistral背后基础设施)、日韩(KT、Naver)、印度(Yotta、Reliance)是核心。
正如Q1结果所示,我们的客户基础多元且持续扩张。借助庞大的生态系统和装机基础、广泛的CUDA加速应用库,以及最低的token成本,我们有能力服务一个远超任何其他AI计算平台的市场机会。AI基础设施需求以前所未有的速度扩张。AI工厂的建设正在加速。NVIDIA AI基础设施的价值正在上升。H100租赁价格年初至今上涨20%,A100云租价上涨近15%。受益于平台的通用性和软件栈带来的持续性能提升,客户在GPU折旧期之后仍能产生有利润的收入。
可见年初看空nbis这样优质大厂有多么愚蠢。A100是2020年发布、H100是2022年发布。两代产品在2026年仍在涨价是结构信号:供需吃紧 + GPU资产寿命远长于会计折旧。后者打开GPU asset-backed securities的资本市场空间。CoreWeave已经在做GPU资产抵押结构化融资,还是危险,但杠杆效应或许会更明显。折旧期之后还在赚钱这一句给所有GPU as a service公司估值模型背书:折旧schedule可拉长,单位资产ROI上升,估值可参考不分basic infrastructure而非半导体周期股。
NVIDIA算力这个广阔且可信的市场,是数十亿美元AI基础设施支出得以被生态融资的关键基础。AI基础设施加速建设背后有两个主要驱动。第一,从搜索广告到推荐系统再到内容理解,最大的hyperscale workload正在从CPU迁移到GPU加速计算。第二,AI原生产品和服务的采用正在拐点。自ChatGPT问世以来,主流AI已从one-shot inference演进到reasoning,现在进入agentic阶段。AI不再是nice-to-have,AI已成为提升各行业、各岗位生产力的必需品。这正在推动AI价值链各层级(能源、芯片、基础设施、模型、应用)的收入加速。
AI cake五层结构是NVIDIA对整个AI价值链的官方分层。每层都有独立投资标的:Energy层是Constellation、Vistra、gev、be;Chips层是NVIDIA + TSMC + HBM三家 + 配套Marvell / Broadcom / AMD / Astera;Infrastructure层是Vertiv / Schneider / Eaton + 服务器ODM;Models层是OpenAI / Anthropic / xAI;Applications层是Salesforce / ServiceNow / Microsoft Copilot / Adobe。Jensen说all layers都在加速,意味着这是连锁revenue cascade而非单点放量。我们可以看到是,价值传导来到了软件,不过是受益于ai agent流量的软件。不过软件叙事复杂,需要臻辨。
模型层增长非常惊人,尤其是Anthropic和OpenAI,且势头持续加速,包括OpenAI Codex自GPT-5.5发布以来的爆发式增长。目前分析师预测hyperscale资本支出到2027年将超过1万亿美元,agentic AI开始在各行业普及,AI基础设施支出有望在本十年末达到每年3万亿到4万亿美元。
Hyperscale CapEx $1T这个数字比市场之前共识($725-800B for 2026)高出20-30%。可能意味着Microsoft / Meta / Google / Amazon会在下季度再次上调guide。本十年末$3-4T年化是Jensen真实信仰的TAM锚。NVIDIA当前run rate约$300-400B,意味着市场扩大10倍、NVIDIA份额即使下降仍有5-7倍空间。OpenAI Codex的breakout growth对应AI编程市场爆发,受益方:Cursor、Replit、GitHub Copilot生态,以及背后Anysphere的估值持续抬升。
Blackwell架构无处不在,被每一家hyperscaler、每一家云服务商、每一家主要模型厂商采用部署。上个月,OpenAI发布了GPT-5.5,与Blackwell联合设计、训练、运行,目前位居Artificial Analysis排行榜首位。微软的Fairwater,世界上最强大的AI数据中心,已提前投产,由数十万颗Blackwell GPU提供算力。从今年开始,AWS将新增超过100万颗Blackwell和Rubin GPU,并在Spectrum-X网络上展开合作。在Google,Blackwell将向云客户提供,含confidential computing能力,是高性能AI安全运行的新基础。
这段藏着三个被低估的细节。第一,Microsoft Fairwater提前完工反映Blackwell产能匹配上hyperscaler扩张节奏。数十万颗Blackwell对应Fairwater单站GPU硬件价值大致$200-400亿(估算)+ 配套$50-100亿。第二,AWS采用Spectrum-X是最重磅的产业信号。AWS长期自研网络Nitro + EFA,从不用第三方Ethernet stack。AWS让步意味着NVIDIA full-stack渗透深化。100万颗GPU对应$400-500亿GPU硬件订单(估算)。第三,Google把confidential computing作为云服务卖点。Confidential GPU是新的cloud服务类目,对应受益软件:Fortanix、Anjuna、Edgeless。
我们在frontier AI算力的份额持续提升。我们与Anthropic加深合作,很高兴成为其扩张算力的战略合作伙伴。我们将通过AWS、Azure、CoreWeave、xAI等支持其增长。加上Anthropic,现有合作的frontier labs还包括OpenAI、Gemini、xAI、Meta、Mistral AI、Microsoft AI、TML、Inflection AI、Perplexity、Cursor等,我们在frontier AI模型的份额将显著提升。
通过AWS、Azure、CoreWeave、xAI支持Anthropic这一表述是关键。NVIDIA作为Anthropic算力配置orchestrator,不只是芯片供应商。xAI作为Anthropic算力提供方之一被点名值得注意:Anthropic和xAI是frontier model竞争者,但xAI被pulled into supply role,反映NVIDIA对整个frontier model生态算力调度的话语权。MSL是Meta Superintelligence Labs,2025年6月30日组建,Alexandr Wang担任Meta首任Chief AI Officer。TML可能是Thinking Machines Labs(Mira Murati 2025年创立)。所有新frontier lab全部用NVIDIA是稳定收益的强证据。
今天的数据中心是产生收入的AI工厂。受电力和资本约束,AI工厂运营商必须选对架构。我们以extreme co-design的方式,提供业内最低token成本、最高token吞吐、最高ROI。
电力和资本两个约束被Jensen明确点出。Power约束对应5月7日NVIDIA + IREN 5GW deal:$3.4B managed GPU services合同、NVIDIA拿IREN $2.1B 5年warrant。这种NVIDIA股权 + 长期采购模式可能扩展到Applied Digital、Crusoe、TeraWulf、Iris Energy这一线crypto miner pivot to AI玩家。Capital约束反向催生GPU资产证券化、leasing市场扩大。
MLPerf推理结果已出,我们再次横扫所有基准,Blackwell Ultra在广泛的模型和部署场景中输出最高吞吐量。全栈创新带来GB300相比6个月前2.7倍的吞吐提升和60%的token成本下降。
6个月内同代硬件吞吐2.7倍、成本下降60%。主要驱动是软件优化:Dynamo 1.0(press release单列highlight,inference加速7倍)、TensorRT-LLM新版本、CUDA Graph优化。软件让硬件价值翻倍的机制是NVIDIA对ASIC路线的杀手锏。ASIC一旦投产性能靠软件提升天花板低,NVIDIA每半年通过软件让客户机器价值翻倍。这是lock-in的真正基础。
NVIDIA算力不只是性能最高的AI基础设施,还是最经济、最可融资的。客户不是买GPU,客户是建AI工厂。正确的经济指标不是GPU的购买价,而是AI工厂生产智能的全生命周期成本:token per watt、tokens per dollar、可用性、利用率、上市时间、软件耐久性和资产生命周期。这些方面,NVIDIA都做得最好。
Agentic AI和强化学习给CPU带来新的增长机会。在Grace CPU成功的基础上,Vera正好赶上这个拐点。Vera基于定制Arm core,与Rubin GPU和NVLink端到端联合设计,相对x86替代品提供每核1.5倍性能、2倍每瓦性能、4倍机架密度。Vera CPU为NVIDIA打开了一个2000亿美元的全新TAM,这是我们之前未涉足的市场。每一家主要的hyperscaler和系统厂商都在与我们合作部署Vera。本年度CPU总收入可见性接近200亿美元,让我们走向成为全球领先的CPU供应商。
4x per-rack密度是结构性数字。一个标准42U rack原本能装32颗x86 CPU,用Vera可装128颗。同等data center面积compute密度4倍提升,但per-rack功率从30-40kW飙到120-160kW,强制液冷部署。$200B TAM定义涵盖standalone server CPU(约$70B Intel + AMD合计市场)、embedded CPU、edge AI CPU、agentic specific compute。即使NVIDIA只拿30-40%份额也是$60-80B年化业务。$20B本年standalone直接挤压Intel Xeon SP最高端SKU和AMD EPYC高端线。
我们的年度产品节奏依然是我们市场地位的关键支柱。我们计划在今年下半年Q3开始Vera Rubin的量产出货。Vera Rubin整合7颗专用芯片跨5个加速机架,相对Blackwell提供最高35倍推理吞吐和最高10倍AI工厂收入。作为早期采用者,Google A5X bare-metal实例可支持跨多站点最多96万颗Rubin GPU。
7颗专用芯片猜测组合:Vera CPU、Rubin GPU、Rubin CPX、CX9 DPU/NIC、NVLink switch、Spectrum-X switch、BlueField-4 STX。5-rack pod意味着deployment unit从单rack(NVL72)放大到5-rack pod,单pod功率500-700kW(估算)。这种密度对data center电力配送是质变,pod-level switchgear替代rack-level PDU。受益:大功率switchgear制造商ABB / Eaton / Siemens。Google承诺96万颗Rubin对应$77-115B GPU硬件价值(估算)。Google同时是TPU生产者却仍如此大规模采用Rubin,说明TPU定位为内部workload优化,Rubin负责GCP外部商业化workload。这对Broadcom(Google TPU合作伙伴)的中长期upside是压制。
虽然美国政府已批准H200对中国客户的出口许可,但我们尚未产生任何收入,也不确定是否会有任何产品进入中国。因此,与上季度一致,我们在展望中不计入任何中国数据中心计算收入。
中国市场作为$50B潜在TAM被冷冻在optional upside桶里,完全不在Q2 guide。任何H200进入中国并产生收入都会是pure upside on top of $91B Q2 guide。Beijing继续禁止采购、Huawei Ascend被扶持,短期解冻可能性低。
接下来谈边缘计算。我们的边缘计算市场平台收入64亿美元,环比+10%,同比+29%。Blackwell工作站需求强劲是主要贡献,消费需求因内存和系统价格上涨而略有下降。我们的physical AI持续放量,过去12个月收入超过90亿美元。我们与Uber的合作将到2028年覆盖近30个城市、4大洲的robotaxi车队。
Blackwell workstation强对应RTX PRO系列(press release提到RTX PRO 4500 Blackwell Server Edition)。RTX PRO面向AI engineering workstation,OEM受益:Dell Precision、HP Z系列、Lenovo ThinkStation。消费GPU受memory涨价压制,反向受益SK Hynix / Samsung / Micron。Physical AI $9B TTM首次披露,已接近AMD整个客户端GPU业务规模。Uber robotaxi按每城2000-5000辆估算,30城对应6-15万辆,单车NVIDIA BoM $8-15k(Thor SoC + 传感器套件,估算),对应NVIDIA $5-20亿独立收入。中国车端智驾产业链受益:德赛西威、华阳集团、经纬恒润。
我们在保障供应方面继续front-footed。Q1,包含库存采购承诺和预付款在内的总供应承诺增加到1450亿美元。
$145B供应承诺是NVIDIA对TSMC CoWoS / HBM三家 / ABF substrate供应商的真实cash exposure。这个数字让2026 / 2027年的TSMC CoWoS-L订单、HBM3E / HBM4订单从预期变成已锁定。TSMC、SK Hynix、Micron、Samsung HBM部门2026 / 2027收入有bottom-up确认。
接下来是损益表的其他部分。GAAP毛利率74.9%,非GAAP毛利率75.0%,环比基本持平。GAAP和非GAAP运营费用环比+12%,主要由薪酬增加和算力/基础设施成本上升驱动。非GAAP有效税率16%,略低于此前指引,原因是地理结构利好。资产负债表方面,DSO 45天,受益于回款时点;预计Q2回到50天中段。我们产生了创纪录的490亿美元自由现金流,对比Q4的350亿美元。
75%毛利率在Blackwell大规模出货阶段维持不变,反驳了新世代ramp会压毛利率的市场担心。OpEx +12% QoQ激进,主因是薪酬 + 内部compute。NVIDIA自己内部用GPU的compute费用进OpEx,意味着NVIDIA是自己最大的客户之一。FCF $49B / 季度等于年化$200B,cash conversion约60%。
下面更新我们的资本配置计划。我们将季度股息从每股0.01美元提升到每股0.20美元(Jensen后续更正为0.25美元)。我们计划随着业务扩展定期审视股息政策。我们还宣布800亿美元的额外回购授权,加上当前剩余的390亿美元。本年度我们计划返还约50%的自由现金流。
25倍股息提升。$0.25季度对应$1/年股息,按当前股价yield约0.45%,对dividend investor不够,但信号是NVIDIA从pure growth公司向growth + return混合模式过渡。$119B总回购授权 + 年化$100B回报承诺,按当前FCF run rate是可执行的。这一转向也降低被动指数fund抛售的tail risk。
下面是第二季度展望。总收入预期910亿美元,±2%。环比增长预计主要由数据中心驱动。我们正全力推进供应链生态建设以应对前方巨大的需求,让我们对2025年到2027日历年的1万亿美元Blackwell + Rubin收入保持充分信心。GAAP和非GAAP毛利率预期分别为74.9%和75.0%,±50个基点。全年仍预期在mid-70s水平。GAAP和非GAAP运营费用预期约85亿和83亿美元。全年OpEx预期增长在upper 40s水平,由R&D加速和AI工具内部使用加速驱动。2027财年全年GAAP和非GAAP税率预期16%-18%。
Q2 $91B guide超出Street $86-87B共识$4-5B。但buyside whisper已经在$90B附近,所以这是略超whisper而非大幅超。$1T保留没上调是市场失望的点,但Jensen后面在Goldman Sachs提问回应里明确说$1T只是Blackwell + Rubin GPU,不含Vera CPU、不含LPX、不含frontier model份额扩张,真实Total Pool粗算$1.3-1.5T。全年OpEx增速从low-40s上调到upper-40s是结构性变化。AI tools内部使用加速意味着NVIDIA自己内部compute消耗在加速,反映agentic AI在企业级渗透的隐性证据。
1. Q&A
Joseph Moore(Morgan Stanley):是什么驱动了报告分部的调整?这种披露方式背后的理念是什么?
Jensen Huang:好的,谢谢Joe。首先,Colette刚才想说的是我们把季度股息从0.01美元提升到0.25美元,多出来的5分钱对大股东来说意义重大。
回到分部和业务描述的问题。我们希望大家更好地理解我们的业务。AI非常多元,计算也非常多元。AI涵盖的范围广,根据行业不同可能涉及语言、3D图形(用于制造业和工业机器人)、蛋白质(生命科学)、小分子化学物质(生命科学或材料科学)、物理(能源行业、科研实验室、高等教育等)。AI本身就是多元的。
这一段是隐性TAM map。每个垂直方向对应NVIDIA加速库:cuNumeric(科学计算)、Modulus(物理仿真)、cuChem(化学)、AlphaFold(蛋白结构)。受益涵盖生物科技(Recursion、Schrodinger、AbCellera)、材料(Citrine Informatics)、能源(地震勘探)。每个垂直行业的科学计算软件被NVIDIA加速库渗透。
Colette Kress:第二,应用场景多元。运行位置也多元,可以在hyperscale云、AI native、企业本地、工业现场、超算中心、边缘。边缘包括自动驾驶、机器人,以及制造工厂内部不断增长的计算网络。未来每一个基站、每一个无线网络都会变成AI驱动的无线网络。还有就是治理方式不同:可以由公有云运营,也可能因工业监管、confidential computing、国家安全等原因不允许跑在公有监管云上。
AI-RAN被明确列为战略。T-Mobile + Nokia是first concrete deployment,6G是长期布局。全球数百万基站规模是10年以上TAM。挤压Qualcomm终端modem、Marvell基站基带ASIC。治理方式不同对应confidential computing和sovereign AI的合规驱动需求。
NVIDIA独特之处在于我们是唯一一家把所有技术组件都自己做、并以extreme co-design的端到端、全栈方式构建的公司。
Jensen Huang:但有些环境就是需要一家能把所有技术整合在一起的公司。在数据中心市场的很多segment里,NVIDIA作为全栈、完全集成但同时开放的解决方案,是非常重要的交付方式。(Jensen继续阐述三大segment划分逻辑)
全栈竞争优势论证。这段间接挤压所有merchant chip + open ecosystem竞争者:Broadcom、Marvell、AMD部分。但Marvell通过NVLink Fusion入局NVIDIA生态是hedged的:Marvell可基于NVLink IP做交换芯片、retimer、光器件控制芯片,custom ASIC业务多了NVLink兼容ASIC产品线。
Ben Reitzes(Melius Research):公司的目标是增长得比hyperscaler资本支出更快吗?
Jensen Huang:首先,我们应该增长得比hyperscale资本支出更快。原因正是我刚才描述的分部结构。第一块是hyperscaler。他们今年是1万亿美元,我完全预期这个数字会继续往上走。世界在变化,过去SaaS不需要这么多算力,但AI需要海量算力。算力就是收入,算力就是利润。
Jensen公开承诺NVIDIA增速会持续高于hyperscale capex。算力是收入、算力是利润这一表述被重复多次,是NVIDIA最核心叙事:把GPU从cost item重定义为revenue item。客户的GPU采购决策从成本控制变成收入投资。这种心智转变在企业级和sovereign买家中正在加速发生。
第二类是所有的AI native cloud、企业本地、工业本地、sovereign AI。25万家企业,很多想自建AI工厂自己运营。很多工业公司没有选择,必须把计算放在context所在地。第二类还包括sovereign AI cloud。这是一整类数据中心,semi-custom芯片完全不适用,这些数据中心想买系统、运营系统,不想自己设计、自己造。
Semi-custom芯片完全不适用于第二类是Jensen对ASIC替代叙事的明确反击。ACIE这一类客户没有自研ASIC能力,必须买完整系统。意味着ACIE 100%是NVIDIA市场。25万家企业客户的数字第一次出现在管理层口径,对应$50-80T经济体量。受益的中型data center builder:DigitalRealty、Equinix;中国对应:万国数据、世纪互联。
C.J. Muse(Cantor Fitzgerald):您怎么看Vera Rubin和Extreme Co-Engineering对2026年下半年到2027年推理市场份额的影响?
Jensen Huang:我们在推理的份额正在增长,而且增长得非常快。原因之一是今年frontier模型公司的数量增加了,包括Cursor、Perplexity、TML、Inflection AI等等。加上Anthropic今年成为我们的合作伙伴。Anthropic扩张极快,我们已与他们合作通过Azure、AWS、CoreWeave确保算力。我们今年和明年为Anthropic上线的容量将非常大、非常显著。我们对Anthropic的覆盖在最近之前基本是零。
Anthropic覆盖在最近之前基本是零是关键。意味着Anthropic的算力订单是pure incremental,没有从其他客户挪过来。对CoreWeave财报是直接利好:后续季度CoreWeave会看到Anthropic贡献的显著增量。Lambda、Crusoe、Together AI、Lepton AI(NVIDIA于2025年4月收购)这一类compute marketplace公司是这个机制的执行层。
Vera Rubin在这一点上会比Grace Blackwell更成功。每一家frontier模型公司从一开始就会跳上Vera Rubin。这在Blackwell阶段还做不到。
每一家frontier模型公司从一开始就会跳上Vera Rubin是pricing power最强证据。整代产品所有frontier客户全部锁定,没有切换风险。这种lock-in让Rubin generation毛利率不会被价格战压低。
要记住,还有第二类AI数据中心,几乎只有我们在服务。这一类里所有的推理,绝大多数都是NVIDIA。还有physical AI,NVIDIA几乎是今天唯一服务physical AI的公司。
两个关键数据点:ACIE推理NVIDIA份额接近100%,physical AI近独占。前者反驳ASIC会先在推理上替代NVIDIA的市场叙事;后者确认physical AI赛道在未来3-5年是NVIDIA几乎独占。
Timothy Arcuri(UBS):您在做的一些custom merchant项目,比如Rubin CPX和Groq 3 LPX的进展。
Jensen Huang:LPX设计用于低延迟和高token rate,但它的吞吐量低,模型容量低,context处理能力低。LPX的use case不广,针对的是已经有大量不同类型token服务组合、且其中高token rate服务可能是高价服务的客户群。
我预期LPX以及其他基于SRAM、聚焦decode和高token rate的加速器在未来一段时间内仍然是niche产品。
这是call里对市场观点最直接的降温。SRAM-based accelerators仍然是niche产品这一论断对Cerebras(市值$95B,PS约140x)、SambaNova、Tenstorrent的中长期估值是直接重置。SRAM全替代HBM叙事被NVIDIA以最权威声音定义为非主流。Cerebras季度收入$171M年化约$680M,按当前估值需要重大revisit。但LPX在NVIDIA自己portfolio里仍然存在,定位是premium tier service配套。
Vivek Arya(BoA Securities):CPU相对GPU的角色是替代关系还是增量关系?200亿美元这个数字是standalone Vera CPU还是已经包含了Vera作为Vera Rubin一部分的部分?
Jensen Huang:200亿美元是standalone CPU。Vera有4种使用方式。第一种是Vera Rubin,每两颗Rubin配一颗Vera。第二个use case是standalone Vera CPU。第三个是Vera + CX9 + 存储软件栈。第四个是Vera + CX9 + 安全/计算隔离/confidential computing软件栈。每一种use case都构建在Vera之上。我的判断是Vera Rubin整个生命周期都会supply-constrained。
这是call里最被忽视的产业线索。$20B standalone CPU只是第一层。Vera的四种use case对应四条独立挤压路径:Use case 1(系统配套)的供应链是TSMC CoWoS + HBM;Use case 2(standalone)挤压Intel Xeon SP最高端 + AMD EPYC高端;Use case 3(Vera + CX9 + STX)进入存储服务器市场,挤压Dell PowerScale / NetApp / Pure Storage,受益软件方VAST Data / WEKA / Hammerspace;Use case 4(confidential computing)挤压Intel TDX + AMD SEV-SNP,受益软件方Fortanix / Anjuna / Edgeless。Vera Rubin整个生命周期都supply-constrained是pricing power最强信号。CX9是NVIDIA第9代ConnectX SmartNIC / DPU,每个use case 3和4都会带动一颗CX9 + 一颗Vera的组合出货,BlueField + ConnectX的DPU业务从小业务变大业务。
(Jensen继续阐述agent harness、CPU与GPU协作、tool acceleration)我们和Cadence、Synopsys深度合作加速世界上所有工具。我们加速所有工具、数据处理引擎、数据库引擎,因为agent要用这些工具,agent的耐心比人类低。
EDA和工业软件是agentic AI变现的早期受益方。Cadence Cerebrus、Synopsys DSO.ai都跑GPU。Siemens覆盖工业自动化,Adobe覆盖创作工具。这条线含义:工业软件 / EDA / 创作软件公司BoM里GPU权重上升,订阅价格和license fee也上升。受益方Cadence、Synopsys、Siemens、PTC、Dassault、Adobe。国内对应:中望软件、华大九天、概伦电子。
过去的CPU设计为多核以便可出租,人们租core。Agent不租core,agent只要工作快做完。过去的经济学是$/core,未来AI的经济学是tokens/$或$/token。Vera设计为agentic CPU。
CPU设计范式转变被明确陈述。Intel / AMD的high core count策略被Jensen定义为过去。这对Intel Xeon SP和AMD EPYC最高端SKU的市场叙事是直接挤压。
它需要极好的存储,这是为什么我们做STX。它需要极好的网络,所以我们有Spectrum-X。它需要极好的GPU和推理能力,所以有NVLink 72。它需要极好的安全和confidential computing,所以Vera Rubin是全球第一个端到端confidential computing的平台。
STX被Jensen点名是Vera Rubin不可分割的组成。BlueField-4 STX是NVIDIA进入存储服务器市场的硬件基础。端到端confidential computing打开金融 / 医疗 / 政府 / 国防 / 制药这些高度受监管行业。GPU侧confidential computing替代部分Intel TDX / AMD SEV-SNP的市场份额。
Stacy Rasgon(Bernstein):Neo cloud放在哪个分部?
Jensen Huang:AI native cloud不造芯片、不设计自己的芯片,也没办法把不相关的零件拼凑成AI工厂。他们对time-to-first-token的耐心极低。我们的架构是世界上最可租的计算平台。最高性能、最易组装、最可租、TCO最佳、最易融资。所有这些属性都精准匹配AI native的需求。它属于第二类。
最易融资这个表达对GPU asset-backed financing市场是核心叙事。GPU可作为ABS底层资产,CoreWeave已做过类似结构。这种金融化让data center buildout资本约束打开,反向支撑NVIDIA未来3-5年增长曲线。专门做GPU leasing的fintech会成长起来。Neo cloud(CoreWeave / Lambda / Crusoe / Together)放在ACIE确认。
长期看,工业和企业才是未来的经济所在,对应世界经济中50万亿到80万亿美元的部分。我预期第二类长期会更大。我还希望在未来5年内,physical AI和robotics segment也会增长得非常快。
ACIE长期TAM被定为$50-80T经济体量的AI渗透。NVIDIA当前run rate $300-400B年化对应这个TAM的0.5%。即使渗透率到2-3%(参考SaaS对企业软件的渗透曲线),都是10x级别空间。Physical AI 5年内大增长是2030年前核心增长曲线。
James Schneider(Goldman Sachs):GTC时您讲过Rubin和Blackwell平台收入有1万亿美元可见性,这不包括LPX、Rubin CPX和Vera CPU机架。Vera CPU是否会是这1万亿美元之上最大的upside来源?
Jensen Huang:1万亿美元之上的增量:第一,frontier AI模型份额的持续提升。第二,1万亿美元数字里没包含任何Vera CPU(standalone)。我预期这是第二大upside。第三是LPX。通过Vera Rubin + LPX的组合,我们能覆盖AI整个谱系。
Goldman这个问题问得最精准,直接把市场关注引导到$1T是低估。Jensen回应确认三层upside:frontier份额扩张、Vera CPU、LPX。这等于Jensen公开承认$1T只是Blackwell + Rubin GPU口径。真实Total Pool粗算$1.3-1.5T。这对sell-side模型是巨大upside catalyst,未来一两个季度分析师会陆续上调2027-2028 revenue预测。
Joshua Buchalter(TD Cowen):GB300是公司历史最快ramp。Vera Rubin的ramp斜率应该怎么对比?
Colette Kress:我们之前已经多次指引,会在下半年发布Vera Rubin,从Q3开始。Q3是初步组件到位,Q4开始我们应该会看到ramp继续。这些是非常复杂的系统。Q3开始,Q4持续ramp,下一年Q1也会非常大。
Vera Rubin真正大批量在FY28 Q1(日历Q4 2026到Q1 2027交界)。这一句对sell-side revenue模型是定向guidance。FY28 Q1的Street预期可能从当前$95-100B上修到$110-120B。供应链订单 visibility:TSMC CoWoS-L订单集中Q2-Q3 2026下单,HBM4 ramp在Q3-Q4 2026,服务器ODM(Quanta / Foxconn / Wistron)的Vera Rubin系统组装订单在Q4 2026到Q1 2027。
Jensen Huang(收尾):这是非凡的一个季度。需求已经变成parabolic。原因很简单:agentic AI已经到来。AI现在可以做有生产力、有价值的工作。Token现在能盈利,模型厂商正在比拼谁能生产更多。在AI时代,算力即收入、算力即利润。
Parabolic是Jensen对当前周期的定性,对应AI infrastructure周期被框定为1990s互联网早期级别的产业周期而非周期性升级。Tokens are profitable validate了整个token经济学循环:模型厂商token变现 → 扩张算力 → NVIDIA收入 → NVIDIA再投资模型厂商。这是飞轮。
(Jensen列举top 5:唯一运行每一个frontier AI模型的平台、在每一个hyperscale cloud里、全栈AI factory服务ACIE、CUDA延伸到边缘、Vera作为agentic CPU有$200B TAM)
世界正在为agentic AI和robotic physical AI重建计算。NVIDIA处于这些转变的中心。我们花了三十年构建NVIDIA Compute Platform,一个架构、庞大生态、跨越芯片/系统/网络/软件的extreme co-design。我们在这一刻到来之前就把它建好了,所以当agentic AI到来时,NVIDIA已经准备好。它已经来了。下次再聊。
30年布局的护城河叙事。CUDA从2006、NVLink从2014、Mellanox从2019、Grace从2022、Cosmos / Isaac从2023。这种提前布局逻辑解释为什么NVIDIA相对Broadcom / AMD / Intel不可复制。同时暗示NVIDIA未来5年仍会大幅R&D投入,OpEx upper 40s增长是结构性而非阶段性的。
2. 第一次出现的全新产品类目
BlueField-4 STX(press release highlight,Jensen在call里点名)。这是NVIDIA第一次正式进入存储加速服务器市场。STX全称是Storage Accelerator。之前NVIDIA在存储侧只有GPUDirect Storage软件层,现在BlueField-4 STX把存储加速从软件层做到了硬件层。
Agentic AI workload需要海量context(向量数据库、KV cache、checkpointing)的低延迟读写。传统NAS / SAN已经成为AI factory的瓶颈。BlueField-4 STX让向量查询、KV cache管理在硬件级别加速。直接挑战Dell PowerScale、NetApp ONTAP、Pure Storage的主营业务。配套软件可能与VAST Data、WEKA、Hammerspace的合作深化。
市场目前还没把STX定价进任何模型,因为产品太新。后续季度财报会逐步看到这条线的收入贡献,是Vera Rubin整体ramp时容易被忽略的小branch。
NVLink Fusion + Marvell合作(press release highlight)。NVLink从专有标准变成半开放标准。Marvell拿到了基于NVLink IP做custom芯片的资格,包括retimer、光器件控制芯片、custom ASIC的NVLink兼容接口。
这件事的含义有两层。第一,NVIDIA从”封闭壁垒”转向”标准制定”,Astera Labs、Credo等retimer / SerDes玩家有了明确生态位。第二,Marvell的custom ASIC业务多了一条”NVLink兼容ASIC”产品线,对应Marvell为Google TPU、Amazon Trainium做ASIC业务的扩展。
DSX架构(IREN deal里第一次正式名字出现)。DSX是NVIDIA为AI factory提供的reference blueprint。NVIDIA从”卖芯片 + 卖rack”升级到”卖工厂蓝图”。任何想做AI data center的operator都可以拿DSX作为标准设计。
这条线对Vertiv、Schneider Electric、Eaton、ABB这种power infrastructure设备供应商是利好。DSX设计的标准化让他们更容易跨场景复用产品。同时也让小型data center operator(Applied Digital、Crusoe等)的进入门槛降低,因为不用自己设计AI factory。
3. 需求显著超预期的数据点
Vera CPU $20B本年standalone。市场之前对NVIDIA CPU业务的预期普遍在$5-10B年化。$20B是超出预期2-4倍的数字。更关键的是这是standalone(不含与Rubin系统配套的Vera)。如果加上系统配套部分,NVIDIA本年CPU总相关收入可能$30B+。这个数字对Intel Xeon SP高端SKU和AMD EPYC高端线的guidance压力会在下一两个季度逐步显现。Intel data center group / AMD data center group的guide需要重新审视。
ACIE环比+31% vs Hyperscale环比+12%。市场之前预期Hyperscale和ACIE增速接近,因为以为Hyperscale占绝大多数。实际ACIE远超Hyperscale,且两块体量已接近1:1。这意味着NVIDIA的客户基础在快速widening。投资含义:CoreWeave、Nebius、Applied Digital这类股票应该有估值溢价,因为他们处在NVIDIA最快增长的分部里。
AWS 100万颗Blackwell + Rubin GPU。这是AWS第一次给出如此具体的承诺规模。100万颗对应$400-500亿GPU硬件订单(估算)。AWS之前对NVIDIA GPU的采购规模一直被认为低于Microsoft和Google,这次100万颗的承诺把AWS拉回到大客户阵营。
Google A5X承诺96万颗Rubin。Google有自己的TPU,但仍然承诺96万颗Rubin对应$77-115B GPU硬件价值(估算)。说明TPU路线和NVIDIA路线在Google内部是并行而非替代关系。Broadcom作为Google TPU合作伙伴的中长期upside被压制。
Microsoft Fairwater提前完工。过去两年Microsoft数据中心项目大多延期。Fairwater提前完工意味着Blackwell产能匹配上hyperscaler扩张节奏。数十万颗Blackwell对应单站$200-400亿GPU价值(估算)。
10MW+ partner data center一年翻倍。从40个翻倍到80+,对应总容量800-1500MW新增。这是ACIE快速增长的物理基础证据。每个10MW站点power infra capex约$30-50M(估算),80站点累计power infra市场$2.4-4B直接受益方。
Sovereign +80% YoY,覆盖40国。Sovereign AI已经从概念变成实质性投入。中东、欧洲、日韩、印度都在大规模采购。这条线的特点是被电力和资本约束少(政府主导),增长可见性高。
4. 某些领域开始首次用新技术
AWS采用Spectrum-X。这是这场call最被低估的产业信号。AWS长期自研网络(Nitro + EFA),从不用第三方Ethernet stack。AWS让步意味着NVIDIA full-stack在AWS内部渗透深化。Cisco、Arista、Juniper的AI Ethernet产品线面临直接竞争压力。光模块产业链是直接受益方。
Google Cloud采用Blackwell + Confidential Computing。Google是first hyperscaler把confidential computing作为Blackwell云服务的卖点。打开了”confidential GPU as a service”这个新cloud服务类目。对应受益的confidential computing软件公司:Fortanix、Anjuna、Edgeless Systems。
Vera Rubin端到端confidential computing(世界第一个)。端到端confidential意味着GPU + CPU + 网络 + 存储全链路加密。这打开金融、医疗、政府、国防、制药的高合规需求市场。这些行业之前因为合规问题无法把敏感workload放在公有云GPU上,现在可以了。
预期受益方:所有处理敏感数据的enterprise AI部署,特别是欧洲(GDPR合规要求高)、中东主权基金、亚太政府IT采购。
AI-RAN落地(T-Mobile + Nokia + 6G commitment)。AI-RAN把通信基带处理 + AI推理 + 边缘compute用一颗NVIDIA GPU + DPU统一处理。每一个5G/6G基站变成一个mini AI datacenter。
这是NVIDIA第一次拿到主要美国运营商(T-Mobile)的concrete deployment承诺。挤压Qualcomm终端modem、Marvell基站基带ASIC。Nokia和Ericsson的基站BoM里多了一颗NVIDIA GPU。国内对应:中兴通讯、烽火通信。
EDA / 工业软件 / 创作软件全面CUDA化。Jensen点名Cadence、Synopsys、Siemens、Adobe。这条线之前没被市场充分定价,因为大家觉得这些公司是软件公司不直接受益NVIDIA。但Jensen说agent要use这些工具,工具必须GPU加速。这意味着Cadence、Synopsys、Siemens、PTC、Dassault、Adobe的BoM里GPU权重上升,订阅价格和license fee也上升。
国内对应:中望软件、华大九天、概伦电子的EDA AI化。
Ising for quantum computing(press release highlight)。NVIDIA第一次发布”world’s first open AI models to accelerate the path to useful quantum computers”。这是NVIDIA进入quantum computing辅助开发的新方向。受益方:IonQ、Rigetti、Quantinuum、PsiQuantum这一类quantum hardware公司,以及Classiq、Quantinuum软件层。规模仍小,但是新方向。
Uber Robotaxi 30城4大洲by 2028。第一次给出具体规模。物理AI从demo阶段正式进入大规模商业部署阶段。
Dynamo 1.0进入生产(press release highlight)。开源软件,让Blackwell推理加速7倍。这是NVIDIA开源软件的新里程碑,对应Dynamo是用户可以直接用的开源工具,而不是NVIDIA闭源软件。这种”开源 + 硬件锁定”模式让NVIDIA的软件价值进一步外溢,但同时巩固硬件优势。
5. 市场没充分注意的信号
xAI作为Anthropic算力提供方。Anthropic和xAI是frontier model竞争者,但Colette原话明确把xAI列为Anthropic的compute supplier之一。这反映几个含义:第一,NVIDIA对整个frontier model生态算力调度的话语权远超想象。第二,xAI的Memphis Colossus有富余算力出租。第三,frontier model之间的”硬件互助”机制开始出现。
Anthropic对NVIDIA”largely zero until just recently”。Anthropic之前主要用Google TPU。现在Anthropic成为NVIDIA strategic partner意味着Anthropic算力订单是pure incremental——从Google那里抢过来的,不是从其他NVIDIA客户挪过来的。
NVIDIA作为Anthropic算力orchestrator。NVIDIA不只是芯片供应商,是Anthropic算力配置的协调方,决定算力部署在AWS / Azure / CoreWeave / xAI哪个云上。这是NVIDIA角色升级的关键信号,从B2B供应商变成产业链中枢。
Inflection AI重新出现在客户名单。Inflection AI 2024年被Microsoft吞并(Mustafa Suleyman加入MS),原以为已经消失。这次Jensen把Inflection AI列入frontier lab客户名单,意味着Inflection AI核心团队和模型仍在运营,且独立于Microsoft AI(Microsoft AI在名单上独立列出)。
Microsoft AI单独列出(与Inflection AI并列)。Jensen把”Microsoft AI”和”Inflection AI”分别列入frontier lab名单。Microsoft AI是Microsoft内部的frontier model团队(Mustafa Suleyman领导),独立于OpenAI合作。这说明Microsoft在做自己的frontier model(不只依赖OpenAI),且全部用NVIDIA。
MSL(Meta Superintelligence Labs)。MSL 2025年6月30日成立,Alexandr Wang领导。Meta把核心AI研发资源全部集中在MSL。MSL用NVIDIA意味着Meta虽然有自研MTIA ASIC(Broadcom合作),但frontier model训练仍以NVIDIA为主。MTIA可能定位为推理optimization,训练市场仍是NVIDIA独占。
TML和其他新frontier model公司。Mira Murati离开OpenAI后2025年成立Thinking Machines Labs(融资$2B)。Cursor、Perplexity等新frontier lab全部用NVIDIA。Frontier model玩家数量在扩大,所有玩家都用NVIDIA是稳定收益的强证据。
6. 隐性指引
Total供应承诺$145B。Q4披露过预付款 + 库存承诺数字(具体数字记忆中是$130B左右),$145B是Q1上调约$15B。说明NVIDIA对2026 / 2027的供应锁定在持续加码。TSMC CoWoS、HBM三家的forward orders bottom-up确认。
OpEx全年增速从low-40s上调到upper-40s。这是上调指引,反映NVIDIA自己的内部AI tools使用加速。NVIDIA是自己最大的客户之一。OpEx upper 40s YoY增长是结构性的。
Inventory单季+$4.4B。从$21.4B到$25.8B。增量主要是HBM和Blackwell GPU库存的pre-build。是NVIDIA在Vera Rubin ramp前的供应链准备。
Marketable equity securities从$12.9B涨到$30.2B。半年内翻倍。主要来自CoreWeave、Arm等被投公司股价上涨的unrealized gains。验证NVIDIA”投资 + 销售”飞轮的财务效果。
Non-marketable securities从$22.3B涨到$43.4B。Q1单季策略投资$18.6B直接体现。年化$70-80B级别的strategic investment是产业一级市场最大单一资金源。
Tax rate从17-19%下调到16-18%。Geographic mix变化带来的小利好,但容易被忽视。年化对$200B FCF的影响约$2-4B。
7. 被点名的新车厂 / 新合作
新车厂登上DRIVE Hyperion(press release highlight):BYD、Geely、Isuzu、Nissan都在DRIVE Hyperion平台上做L4-ready车型。Hyundai + Kia扩展合作。
含义:NVIDIA在主流车厂(除Tesla外)的渗透接近全覆盖。Thor SoC的BoM放量是2026-2028车端确定性主线。
RTX PRO 4500 Blackwell Server Edition(press release highlight)。新workstation产品。RTX PRO面向AI engineering workstation市场。OEM受益:Dell Precision、HP Z系列、Lenovo ThinkStation。
NVIDIA Cosmos + Isaac GR00T N(press release提到,新版本model发布)。Cosmos是世界模型,Isaac GR00T N是人形机器人foundation model。人形机器人公司(Figure、Skild、Agility、宇树、优必选)都在这两个model上构建应用。
Alpamayo 1.5(press release提到)。NVIDIA自动驾驶open model新版本。NuRec技术让自动驾驶感知系统通过neural reconstruction加速训练。
NemoClaw + OpenShell + Agent Toolkit(press release提到)。NVIDIA进入agentic AI开发框架市场。这与Anthropic Claude Code、OpenAI Codex争夺agentic开发工具市场。市场关注度低但战略意义大。
8. 其他
三个最值得跟踪的新信号:
第一,BlueField-4 STX。下季度Q&A可能有更多分析师问STX相关,NVIDIA可能给出STX的TAM和客户list。如果点名Dell / NetApp的客户被NVIDIA挖去,是直接催化。
第二,Anthropic算力ramp细节。Anthropic对CoreWeave、xAI的算力分配规模在下季度CoreWeave财报里会体现。如果CoreWeave Q2 / Q3收入超预期,间接证实NVIDIA这场call的”significant capacity coming online”陈述。
第三,AWS采用Spectrum-X的部署进度。AWS下次财报和re:Invent(11月)会披露AI网络细节。如果AWS正式announce Spectrum-X在re:Invent上,是Arista和Cisco的directly negative信号。
被低估的长期主题:confidential computing GPU市场(Fortanix / Anjuna受益)、EDA / 工业软件GPU化(Cadence / Synopsys / Siemens / Adobe BoM上升)、AI-RAN产业链(Nokia / Ericsson BoM上升 + 国内通信设备商)、人形机器人foundation model生态。


精彩!
牛!