英伟达财报透视Agentic AI:代理的本质是Harness,将来世界上会有数十亿个智能代理,CPU运行框架,GPU负责核心推理和子代理生成!
内容目录
业务陈述:Q1总营收达820亿美元,同比增长85%;客户购买的是完整AI工厂,英伟达在全生命周期成本中全面领先,Vera CPU开辟全新2000亿美元TAM,今年营收接近200亿美元
- Q1总营收达820亿美元,同比增长85%,连续第14季度环比增长;环比增幅135亿美元同样创纪录
- 数据中心收入达750亿美元,同比增长92%;其中计算业务收入达600亿美元,同比增77%,网络业务收入达150亿美元,同比增长近3倍
- 发布新的报告框架:数据中心拆分为超大规模和AI专用数据中心,边缘计算单列;过去9个季度新口径明细已发布
- 超大规模业务收入380亿,环比增长12%,ACIE业务收入370亿,环比增长31%;AI云收入与主权AI收入同比增长极强劲
- AI工厂加速建设推动H100租赁价上涨20%,A100云端定价上涨近15%;分析师预测超大规模CapEx在2027年前突破1万亿美元
- Blackwell已被每一家主要超大规模、CSP、模型制造商部署;微软全球最强AI数据中心已上线,AWS将新增超过100万块GPU
- 客户购买的是完整AI工厂,英伟达在全生命周期成本中全面领先,Vera CPU开辟全新2000亿美元TAM,今年营收接近200亿美元
- 下半年量产VeraRubin,较Blackwell推理吞吐量提升35倍、AI工厂收入最高增10倍,Google已大规模部署;中国市场未计收入
- 边缘计算市场平台营收达64亿,物理AI过去12个月营收超90亿美元;优步合作将推动其自动驾驶车队2028年前覆盖四大洲30个城市
- Q1供应承诺锁定增至1450亿美元;GAAP毛利率74.9%,自由现金流创纪录达490亿美元,高于Q4的350亿
- 资本配置优先投入研发和战略投资,并显著加强股东回馈,新增800亿美元股票回购计划,今年约50%自由现金流将回馈给股东
- Q2营收指引910亿美元波动幅度正负2%;2025-2027年Blackwell和Rubin总收入预计1万亿美元;全年毛利率维持75%左右
分析师问答:代理的本质是框架(Harness),CPU运行框架和使用工具,GPU负责核心推理和子代理生成,将来世界上会有数十亿个智能代理,你会看到智能代理在使用个人电脑
- AI应用多样,不同细分领域在技术栈、操作系统、治理要求和市场进入方面差异显著,分部调整便于展示英伟达在各领域不同策略
- 数据中心两大类客户,超大规模CSP支出达1万亿美元并持续增长;第二类市场客户数量庞大、碎片化且增长惊人,英伟达拥有平台解决方案
- 英伟达在推理领域的市场份额快速增长,得益于前沿模型公司数量激增及与Anthropic的重要新合作,且第二类市场推理份额达100%
- LPX为高令牌速率、低延迟场景设计,仍属小众产品;Grace Blackwell和Vera Rubin是全球最适合AI全生命周期的平台,LPX可作为补充
- CPU与GPU在Agentic AI中的角色互补而非蚕食,CPU运行Agent框架,GPU负责核心推理和子代理生成,200亿是指独立CPU收入
- AI新云(Neo Clouds)归属第二类,将来规模会超过第一类,驱动来自50-80万亿美元工业与企业市场,英伟达全栈架构完美契合其需求
- 英伟达1万亿美元收入可见度:前沿AI模型份额扩大、Vera独立CPU新2000亿美元TAM、以及LPX加速器组合
- VeraRubin将在Q3启动量产,已规划需求、收到采购订单,几乎所有主要客户都已准备就绪,Q4与明年Q1也非常重要
CEO陈词:Agentic AI已至,模型步入盈利期驱动更多模型的开发,英伟达已做好万全准备,并迎接全新增长引擎——Vera正在开辟一个价值2000亿美元的TAM

业务陈述:Q1总营收达820亿美元,同比增长85%;客户购买的是完整AI工厂,英伟达在全生命周期成本中全面领先,Vera CPU开辟全新2000亿美元TAM,今年营收接近200亿美元
- Q1总营收达820亿美元,同比增长85%,连续第14季度环比增长;环比增幅135亿美元同样创纪录
科莱特·克雷斯 – 执行副总裁兼首席财务官:
本季度业绩表现卓越。营收、营业利润和自由现金流均创下历史新高。
总营收达 820 亿美元,同比增长 85%,环比增长 20%。这标志着我们连续第三个季度实现同比增长加速,也是连续第十四个季度实现环比增长。鉴于我们制造业务的庞大规模和复杂性,这是一项了不起的成就。
135 亿美元的环比营收增幅同样创下纪录。我们通过在多元化的终端客户群中全面推广 Blackwell 系统,成功把握了市场转折点并满足了不断增长的需求。这些客户涵盖超大规模云服务商、模型开发商、AI 云服务提供商以及主权客户。
在第一季度,我们还有效地将资金分配到了研发、生态系统投资以及股票回购三个方面。我们在实施上游供应链和下游市场推广生态系统的战略投资的同时,向股东返还了创纪录的 200 亿美元。这对市场的发展和我们的长期地位至关重要。
- 数据中心收入达750亿美元,同比增长92%;其中计算业务收入达600亿美元,同比增77%,网络业务收入达150亿美元,同比增长近3倍
数据中心业务收入达 750 亿美元,同比增长 92%,环比增长 21%。这一增长主要得益于 Blackwell 架构的持续强劲表现。其中,GB300 和 NVL72 的需求尤为旺盛,前沿模型构建者和超大规模企业已累计部署了数以千计的 Blackwell GPU,创下了公司历史上产品量产速度最快的纪录。
Grace Blackwell 不仅是训练速度最快的系统,在推理阶段的 token 生成成本也最低。Spectrum-X 是我们专为人工智能打造的端到端以太网平台,其规模现已超过所有以太网网络同行总和。InfiniBand 本季度表现同样强劲,受我们新一代 XDR 技术部署的推动,同比增长超过 4 倍。
就各位的模型而言,数据中心计算业务收入达 600 亿美元,同比增长 77%;而数据中心网络业务收入达 150 亿美元,同比增长近三倍。
- 发布新的报告框架:数据中心拆分为超大规模和AI专用数据中心,边缘计算单列;过去9个季度新口径明细已发布
在深入探讨数据中心业务之前,我们先向各位简要介绍我们正在向新的报告框架过渡,该框架更能反映我们当前和未来的增长动力。
我们拥有两个市场平台:数据中心和边缘计算。
在数据中心领域,我们将按子市场进行报告,即超大规模(Hyperscale)和 AI 专用数据中心(ACIE)。
其中,ACIE 涵盖 AI 云、工业及企业领域。超大规模业务将包括来自公有云以及全球最大消费互联网公司的收入,而 ACIE 则致力于把握我们在各行业及各国多样化 AI 专用数据中心和 AI 工厂中的增长机遇。
边缘计算则侧重于自主智能和物理 AI 设备,包括个人电脑、游戏主机、工作站、AI RAN 基站、机器人及汽车领域。
供您参考,我们已在官网发布了过去 9 个季度基于新平台的收入明细。
- 超大规模业务收入380亿,环比增长12%,ACIE业务收入370亿,环比增长31%;AI云收入与主权AI收入同比增长极强劲
现在回到我们的数据中心业绩。
超大规模业务收入为 380 亿美元,约占数据中心总收入的 50%,环比增长 12%。
ACIE 业务收入为 370 亿美元,环比增长 31%,其中包括 AI 云业务收入,该业务收入同比增长超过三倍。得益于客户的支持,我们实现了 AI 计算能力的快速部署。
仅一年时间,合作伙伴中拥有超过 10MW 算力的数据中心数量就几乎翻了一番,目前已超过 80 个站点。
Sovereign 业务收入同比增长超过 80%。NVIDIA AI 基础设施现已部署于近 40 个国家,这些国家的 GDP 总和达 50 万亿美元。
正如我们第一季度的业绩所示,我们的客户群不仅多元化,而且还在持续增长。
- AI工厂加速建设推动H100租赁价上涨20%,A100云端定价上涨近15%;分析师预测超大规模CapEx在2027年前突破1万亿美元
依托我们庞大的生态系统和用户基础、广泛的 CUDA 加速应用,以及作为单位成本最低的供应商,我们已做好充分准备,把握这一远超其他任何 AI 计算平台的市场机遇。
对 AI 基础设施的需求正以史无前例的速度持续增长。AI 工厂的建设正在加速推进。英伟达 AI 基础设施的价值正持续攀升。
今年以来,H100 的租赁价格已上涨 20%,而 A100 的云端定价涨幅接近 15%。得益于我们平台的灵活性以及软件栈带来的持续性能提升,客户在 GPU 折旧寿命结束之后,仍能持续创造可观的收益。
NVIDIA 计算解决方案拥有庞大且值得信赖的市场,这是生态系统为数十亿美元的人工智能基础设施投资提供资金支持的关键基础。
人工智能基础设施建设加速的背后有两大主要驱动力。
首先,从搜索和广告到推荐系统和内容理解,规模最大的超大规模工作负载正持续从基于 CPU 的计算向基于 GPU 的加速计算转型。
其次,原生 AI 产品与服务的采用正迎来转折点。
自 ChatGPT 问世以来,我们见证了主流 AI 从单次推理向推理能力,再到如今的智能代理能力的演进。AI 已不再是可有可无的附加功能,而是提升各行各业及各类岗位生产力的必要条件。
这正推动着 AI 产业链各层面的收入加速增长,涵盖能源、芯片、基础设施、模型及应用等领域。模型层面的增长尤为显著,尤其是 Anthropic 和 OpenAI,其增长势头惊人且仍在持续加速,其中 OpenAI 的编解码器自 GPT 5.5 发布以来更是实现了爆发式增长。
随着分析师预测超大规模企业的资本支出将在 2027 年前突破 1 万亿美元,且代理式 AI 开始在各行各业普及,本十年末的 AI 基础设施年支出有望达到 3 万亿至 4 万亿美元。
- Blackwell已被每一家主要超大规模、CSP、模型制造商部署;微软全球最强AI数据中心已上线,AWS将新增超过100万块GPU
我们的 Blackwell 架构无处不在,已被每一家主要超大规模企业、每一家云服务提供商以及每一家主要模型制造商采用并部署。
上个月,我们庆祝了 OpenAI 推出 GPT 5.5,该模型专为在 Blackwell 平台上进行训练和部署而设计。
目前位居人工智能排行榜榜首的微软 Farweave——全球最强大的 AI 数据中心——现已正式上线。该平台计划由数十万块 Blackwell GPU 提供支持。
从今年开始,AWS 将新增超过 100 万块 Blackwell 和 Rubin GPU,并正在开展频谱网络方面的合作。
在谷歌,Blackwell 将通过云服务提供给客户,其中包括机密计算能力,这为安全的高性能 AI 奠定了新的基础。
我们在前沿 AI 计算领域的份额正在增加。我们已深化与 Anthropic 的合作,并很高兴能作为其战略合作伙伴,共同扩展其计算能力。我们将通过 AWS、Azure、CoreWeave、StacyX AI 等平台支持公司的增长轨迹。
如今,随着 Anthropic 的加入,加上 OpenAI、Gemini、StacyX xAI、Meta、MSL、Microsoft AI、TML、Reflection、Perplexity、Cursor 以及其他已在 NVIDIA 平台上开展研发的主要前沿实验室,我们的布局更加完善。我们在前沿 AI 模型领域的份额将显著增长。
- 客户购买的是完整AI工厂,英伟达在全生命周期成本中全面领先,Vera CPU开辟全新2000亿美元TAM,今年营收接近200亿美元
当今的数据中心是受电力和资本制约的创收型 AI 工厂,AI 工厂运营商必须选择正确的架构。凭借我们极致的协同设计方法,我们实现了业界最低的 token 成本、最高的 token 吞吐量以及最高的投资回报率。
MLPerf 推理测试结果已出炉,我们再次包揽了所有基准测试的冠军。Blackwell Ultra 在广泛的模型和部署场景中均实现了最高的吞吐量。全栈创新推动了吞吐量的提升,使其达到 2.7 倍,同时与仅 6 个月前相比,GV300 的每 token 成本降低了 60%。
NVIDIA 计算平台不仅是性能最高的人工智能基础设施,更是最具经济效益且最易于融资的解决方案。客户购买的并非 GPU,而是构建 AI 工厂。正确的经济指标并非 GPU 的采购价格,而是 AI 工厂在生产智能过程中的全生命周期成本,包括每瓦特产出的 token、每美元产出的 token、运行时间、利用率、投产时间、软件耐久性以及资产寿命。NVIDIA 在所有这些方面都表现卓越。
代理式人工智能和强化学习为 CPU 带来了新的增长机遇。
在 Grace CPU 取得成功的基础上,Vera 的问世恰逢其时,正赶上这一转折点。Vera 基于定制的 ARM 内核构建,并与 Rubin GPU 及 NVLink 进行了端到端的协同设计,相比基于 x86 的替代方案,其单核性能将提升高达 1.5 倍,每瓦性能提升 2 倍,每机架密度提升 4 倍。
VeraCPU 为英伟达开辟了一个全新的 2000 亿美元潜在市场规模(TAM),这是我们此前从未涉足的领域。目前,所有主要超大规模数据中心和系统制造商均已与我们建立合作伙伴关系,共同推进该产品的部署。预计今年 CPU 总营收将接近 200 亿美元。这将使我们成为全球领先的 CPU 供应商。
- 下半年量产VeraRubin,较Blackwell推理吞吐量提升35倍、AI工厂收入最高增10倍,Google已大规模部署;中国市场未计收入
我们无与伦比的年度产品发布节奏,始终是支撑我们市场地位的关键支柱。我们正按计划推进,将于今年下半年(从第三季度开始)启动 VeraRubin 的量产出货。
通过在 5 个加速机架中集成 7 颗专用芯片,VeraRubin 将提供比 Blackwell 高出 35 倍的推理吞吐量,并带来高达 10 倍的 AI 工厂收入。
作为早期采用者,Google 的 XGS 裸机实例可在多个站点支持多达 96 万个 Rubin GPU,使客户能够在 NVIDIA 优化的基础设施上运行其最大的 AI 工作负载。
尽管美国政府已批准向中国客户出口 H200 的许可证,但我们尚未产生任何收入。而且我们尚不确定是否允许该产品进口至中国。因此,与上季度一致,我们在展望中未包含任何中国数据中心计算业务收入。
- 边缘计算市场平台营收达64亿,物理AI过去12个月营收超90亿美元;优步合作将推动其自动驾驶车队2028年前覆盖四大洲30个城市
接下来谈谈边缘计算。
我们的边缘计算市场平台本季度营收达 64 亿美元,环比增长 10%,同比增长 29%。Blackwell 工作站需求强劲是推动增长的主要动力,而受内存和系统价格上涨影响,消费端需求小幅下滑。
我们的物理 AI 业务持续保持增长势头,过去 12 个月的营收已超过 90 亿美元。我们与优步(Uber)的合作将推动其自动驾驶出租车车队于 2028 年前覆盖四大洲近 30 个城市。
在机器人领域,众多专注于工业、外科手术及类人机器人应用的领先企业正依托英伟达(NVIDIA)的技术,进行大规模的研发与部署。
- Q1供应承诺锁定增至1450亿美元;GAAP毛利率74.9%,自由现金流创纪录达490亿美元,高于Q4的350亿
我们始终积极确保充足的供应,以支持客户的业务增长。第一季度,我们通过预付方式锁定的总供应量(含库存采购承诺)已增至 1450 亿美元。
尽管我们无法完全规避供应链挑战,但我们对把握未来增长机遇的能力充满信心。凭借我们的高度专注、规模优势以及与关键供应商的长期合作关系,这些优势将继续为我们提供有力支持。
接下来,我将介绍损益表的其他部分。
GAAP 毛利率为 74.9%,非 GAAP 毛利率为 75%。与上一季度相比基本持平,Blackwell Systems 仍占我们出货量的绝大部分。
GAAP 和非 GAAP 营业费用较上一季度增长 12%,主要原因是薪酬增加以及计算和基础设施成本上升。
得益于有利的地域结构,我们的非 GAAP 有效税率为 16%,略低于此前预期。
在资产负债表方面,由于收款时点有利,应收账款周转天数为 45 天,预计第二季度将回升至 50 多天。
我们产生了创纪录的 490 亿美元自由现金流,高于第四季度的 350 亿美元。
- 资本配置优先投入研发和战略投资,并显著加强股东回馈,新增800亿美元股票回购计划,今年约50%自由现金流将回馈给股东
现在,我想向大家介绍我们资本配置计划的最新进展。
首先,需要重申的是,我们的意图是优先考虑研发和战略投资。
这两者将有助于我们培育生态系统、推动市场增长并巩固市场地位。作为人工智能的关键推动者,我们将进行必要的投资,以实现业内最低的单代币成本和最高的代币吞吐量。这将帮助我们的客户和合作伙伴扩大规模,并拓展人工智能的前沿领域。
回馈计划是资本配置战略的另一关键组成部分。
基于对长期自由现金流前景的信心,以及与股东共享成功成果的承诺,我们将季度股息从每股 0.01 美元提高至 0.20 美元。随着业务的持续扩张,我们计划定期审视股息政策。
此外,我们宣布批准一项 800 亿美元的股票回购计划,这将补充我们当前计划中剩余的 390 亿美元额度。
正如我们在 GTC 大会上所表明的,我们计划在今年将约 50%的自由现金流回馈给股东。
- Q2营收指引910亿美元波动幅度正负2%;2025-2027年Blackwell和Rubin总收入预计1万亿美元;全年毛利率维持75%左右
接下来请允许我谈谈第二季度的展望。
预计总营收为 910 亿美元,波动幅度在±2%之间。我们预计环比增长主要将由数据中心业务驱动。我们正继续大力完善供应链生态系统,以应对未来将出现的巨大需求。这让我们对 2025 年至 2027 年日历年度期间 Blackwell 和 Rubin 预计产生的 1 万亿美元收入充满信心。
预计 GAAP 和非 GAAP 毛利率将分别为 74.9%和 75%,上下浮动 50 个基点。就全年而言,我们仍预计毛利率将维持在 75%左右。
GAAP 和非 GAAP 运营费用预计将分别约为 85 亿美元和 83 亿美元。就全年而言,我们目前预计运营费用将同比增长 40%左右,这主要受研发投入增加以及加速采用人工智能工具以提升生产力的推动。
就 2027 年全年而言,我们预计 GAAP 和非 GAAP 税率将在 16%至 18%之间,其中不包括因税收环境发生重大变化而产生的任何一次性项目。由于地域结构的变化,这一预期低于我们此前 17%至 19%的预测。
分析师问答:代理的本质是框架,CPU运行框架和使用工具,GPU负责核心推理和子代理生成,将来世界上会有数十亿个智能代理,你会看到智能代理在使用个人电脑
- AI应用多样,不同细分领域在技术栈、操作系统、治理要求和市场进入方面差异显著,分部调整便于展示英伟达在各领域不同策略
约瑟夫·摩尔 – 摩根士丹利:
感谢您让我提问。我想问一下,是什么促使了业务分部的调整?以这种方式呈现数据背后的理念是什么?
此外,您能否谈谈这两个业务分部之间的竞争差异,以及您提到的那个令人意外的 CPU 数据?您如何看待这两个业务分部在这方面的表现?谢谢。
黄仁勋 – 联合创始人、总裁兼首席执行官:
首先,科莱特想说的是,我们将季度股息从 0.01 美元提高到 0.25 美元。我认为这额外的 0.05 美元对大股东来说意义重大。总之,我们拭目以待。
关于业务分部及业务描述,我们希望更深入地理解自身业务。人工智能领域非常多元,计算领域同样如此。它们在多个方面都呈现出多样性。
首先,当然,人工智能涵盖语言领域,根据不同行业,还可能涉及 3D 图形——例如制造业和工业机器人;生命科学领域的蛋白质研究;生命科学或材料科学领域的小分子化学;以及物理学等领域。就自然科学而言,无论是能源领域,还是科学实验室、高等教育等,AI 的应用场景都十分广泛。
其次,AI 的应用形式也多种多样。它既可以应用于企业,也可以应用于能源领域、制造业等领域。其运行环境同样多样。既可能在超大规模云端,也可能在原生 AI 系统中。
这些原生 AI 系统正以整个网络的形式在全球各地涌现。从企业内部部署、工厂和生产基地的工业应用,到超级计算中心,乃至边缘计算。边缘计算当然包括大多数人熟知的自动驾驶汽车和机器人技术。
但制造工厂内部正形成一个日益庞大的计算机网络,无论是芯片厂、封装厂还是计算机制造厂,涵盖了各种不同类型的制造工厂。当然,未来每一座基站、每一个无线网络都将演变为由人工智能驱动的无线网络。
因此,关键在于它运行在哪里,以及最终如何进行治理。你知道,它可能由公共云来运营。但也可能存在常规的工业监管原因,导致它无法在受监管的云环境中运行。这可能是出于机密计算的考虑,也可能是出于国家安全的原因。不同的数据中心必须采用不同的建设方式。
NVIDIA 的独特之处在于,我们是唯一一家自主研发所有技术组件的公司。我们采用极致的协同设计方式进行开发,以端到端、全栈的方式进行构建。当然,我们也会开放平台,使其能够集成到各种不同的环境中。但某些环境(例如企业)需要一家能够让所有技术协同运作的公司,这样他们就不必自己开发,而是希望直接购买并运营。
因此,在数据中心市场的众多细分领域中,英伟达的整体解决方案——这种全栈集成但依然开放的解决方案——这种产品开发或交付的方式,确实至关重要。
因此,若观察我们的不同细分领域——我们将其划分为三大板块——请将我刚才提到的所有要素综合起来,并尝试找出最简明的分类。
其中一大板块便是超大规模云服务。
在这个板块内,我们的业务模式主要分为三种。第一种是帮助超大规模云服务商加速其数据处理和机器学习工作负载。我们加速并支持其内部的 AI 处理。当然,我们还为其公有云带来了大量业务,特别是 NVIDIA 生态系统相关的业务。这就是其中一个领域。
第二个领域是 AI 原生应用、企业本地部署、工业本地部署,以及主权 AI。
这一领域正以惊人的速度增长。因为人人都需要 AI,我们将看到 AI 被每个行业、每个国家、每家公司所采用。因此,每个人都希望以不同的方式构建 AI。而我们提供完整的解决方案,这使得构建过程变得更加容易,甚至使人们能够实现这些目标。
当然,还有机器人边缘计算。
如今,昨天的计算技术主要围绕个人计算展开。未来,计算将转向个人人工智能。而个人人工智能的一个典型例子就是自动驾驶汽车。它既是一辆汽车,又是一个机器人系统,本质上就是你的个人人工智能。当然,未来将出现各种不同类型的机器人系统,甚至包括我之前提到的基站无线网络,本质上也将是一个机器人系统。
这就是我们之所以将它们这样分类的原因。这是理解我们业务的最简单方式。它们在许多方面都有不同的技术栈,运行着不同的操作系统。它们的运作方式各不相同。我们在每个细分市场中的进入策略也截然不同。
当然,最容易进入的市场是超大规模云服务商,因为这类企业只有五六家。但其余的市场——也就是整个行业的其余部分——涵盖了全球约25万家企业。这些市场的进入策略非常复杂,也极其多样化。
您对人工智能的理解必须极其全面。正如您所知,英伟达拥有全球最庞大的加速库套件,涵盖从计算光刻、流体动力学、粒子物理学到分子动力学等众多领域,不胜枚举。而所有这些库对我们涉足代表第二类和第三类业务的垂直行业都至关重要。
明白吗?总之,关键在于我们的业务现已发展壮大到如此规模,因此进行业务分段有助于大家更好地理解我们的业务运作方式。
- 数据中心两大类客户,超大规模CSP支出达1万亿美元并持续增长;第二类市场客户数量庞大、碎片化且增长惊人,英伟达拥有平台解决方案
本·雷茨 – Melius Research:
我想问问詹森(Jensen),想听听你对增长的看法。本季度贵公司除中国以外的数据中心业务增长了约 120%,而你们预计超大规模云服务商的资本支出(CapEx)增长率约为 100%。包括我在内的许多人都预测,今年这一数字将增长 90%到 100%。
你提到数据中心市场仍有望在本十年末达到 3 万亿至 4 万亿美元规模。我想问的是,公司是否仍以实现比超大规模企业资本支出更快的增长为目标?你是否依然有信心支持这一观点?您认为今年之后,超大规模企业的资本支出是否仍会保持快速增长?非常感谢。
黄仁勋 – 联合创始人、总裁兼首席执行官:
首先,我们的增长速度应该会超过超大规模资本支出的增长速度。原因就在于我刚才描述的业务划分。
我们的数据中心业务包含两大板块。虽然实际包含更多部分,但为了简明起见,我们将其归纳为两大板块。其实际结构远比这两个板块复杂得多,但我将其归纳为两部分,至少这样更容易理解。明白吗?
因此,如果你看第一部分,那就是超大规模企业。这就是你刚才提到的超大规模资本支出。今年这一领域规模已达万亿美元,我完全有理由相信它将在此基础上继续增长。
这背后有着根本性的合理依据。这就是未来计算的发展方向。如果企业不进行计算,就无法获得收入。这一点非常明确:计算就是收入,计算就是利润。因此,世界正在发生变化。
过去,软件行业并不依赖 SaaS 模式,也不需要如此庞大的计算能力。但人工智能需要海量的计算资源。当然,这也能让你实现更多可能。
这就是为什么我们听到关于 AI 前沿领域——无论是 Anthropic 还是 OpenAI 等 AI 公司——都在以惊人的速度发展。他们能在一个月内实现的增长,是某些 SaaS 公司需要十年才能达到的,这一点足以说明问题。
因此,第一类是超大规模云服务。其资本支出已达一万亿美元,并且还在增长,预计将达到 3 万亿至 4 万亿美元。
第二类则是所有原生 AI 云服务。它们分布在各个区域,遍布世界各地。全球各地都有初创企业,为这些公司提供支持。它们服务于全球约 25 万家企业。
其中许多企业将不得不或希望自行建立 AI 工厂来运营?许多工业企业别无选择,只能将计算机部署在实际场景中、在行动发生的地方,你无法把这些放上云端。它必须能够即时响应。每次都必须可靠且快速地响应。
试想一下,一家芯片工厂(晶圆厂)连接到云服务提供商,这根本说不通。因此,第二类是主权 AI 云。还有一类数据中心,半定制芯片根本不适用,因为这些数据中心只想购买系统,只想运营系统,他们不想设计,也不想自己建造。
因此,第二类数据中心的类型极其多样。与第一类仅由 6、7 家公司贡献相关收入不同,第二类涉及数百、数千家公司,未来还将扩展到数十万家公司。这将形成庞大的群体——即大量拥有小型部署的公司。这一类别将以惊人的速度持续增长。
当我谈论物理人工智能,以及过去 30 年未受 IT 影响的其余 100 万亿美元产业即将受到人工智能影响时,指的就是这一类别。这就是我所指的领域。这一第二大类正在以惊人的速度增长。
当然,我们在其中的份额非常、非常大。我们在服务该行业方面的能力可谓独树一帜。我们的平台采用垂直整合的架构,确保所有环节顺畅运转。但随后我们将其拆解,以便用户能够根据自身需求进行配置、购买,并按喜好进行组装。
因此,这一第二类模式目前尚未被充分理解。因为该领域存在大量小型企业,且相较于超大规模云服务商,每家企业的部署规模都相对较小。
因此,如果观察各细分市场的规模,你会发现,实际上我们在超大规模云服务提供商中的市场份额正在增长,因为我们现在得到了新合作伙伴 Anthropic 的大力支持,并且我们将帮助他们在未来几年大幅提升运算能力。
此外,由于我们拥有平台解决方案,目前只有极少数公司能够涉足第二类市场。
- 英伟达在推理领域的市场份额快速增长,得益于前沿模型公司数量激增及与Anthropic的重要新合作,且第二类市场推理份额达100%
克里斯托弗·缪斯 – Cantor Fitzgerald:
Vera Rubin 即将推出,您显然对 Frontier 模型的未来更新以及针对各类 AI 工作负载的优化新技术有着深刻见解。鉴于投资者正密切关注贵公司的市场份额和推理能力,您如何看待 Vera Rubin 在贵公司的深度协同工程中,将如何影响贵公司在推理市场的份额?尤其是展望 2026 年末至 2027 年期间?
黄仁勋 – 联合创始人、总裁兼首席执行官:
我们在推理领域的市场份额正在增长。而且增长速度非常、非常快。原因在于,今年前沿模型公司的数量增加了。比如 Cursor 和 Perplexity,还有一些新晋模型公司,如 TML 和 Reflection,不胜枚举。
因此,前沿模型公司的数量正在增加。今年我们还与 Anthropic 建立了合作伙伴关系。他们的发展速度惊人。我们与他们合作,在 Azure、AWS、CoreWeave 等平台上为其保障计算能力——我忘了我们已经宣布了哪些其他合作伙伴,但还有一大批其他平台正在为他们上线。
因此,我们今年和明年为 Anthropic 投入的运算能力将相当可观。非常可观。我们正在快速增长,而此前我们对 Anthropic 的覆盖率几乎为零,直到最近才有所改变。因此,我们在推理领域正以惊人的速度抢占市场份额。
就目前来看,VeraRubin 将比 Grace Blackwell 取得更大的成功。我无法想到任何一家——每一家前沿模型公司都会从一开始就拥抱 VeraRubin。而此前在 Blackwell 身上并非如此。因此,VeraRubin 开局极为强劲,它必将取得比 Grace Blackwell 更为辉煌的成功。
所以,CJ,我认为你回答的重点在于,我们在推理领域正在抢占市场份额。
让我再回到本杰明刚才提出的问题。到目前为止,我在关于推理的问题中解释的所有内容,实际上都聚焦于超大规模领域。请记住,还有另一大类 AI 数据中心,我们几乎是该领域的唯一服务商。这个细分市场非常分散,需要一个高度集成、真正完善的平台解决方案,以及大规模的市场推广。
在这个细分市场中,所有推理业务——100%的业务,绝大多数都由英伟达占据。
当然,还有物理 AI。目前,英伟达几乎是唯一一家致力于物理人工智能的公司。我们在此领域已深耕多年,因此该业务也在不断发展。
因此,我们在推理领域的市场份额正在迅速增长。
- LPX为高令牌速率、低延迟场景设计,仍属小众产品;Grace Blackwell和Vera Rubin是全球最适合AI全生命周期的平台,LPX可作为补充
蒂莫西·阿库里 – 瑞银(UBS):
詹森,我想问一下你们在这些定制化商户服务方面取得的进展,比如 CPX 和 LPX 这类项目。
我还想问一下,你之前提到过脂肪合成技术大概占市场份额的 20%。因此我推测你们在 LPX 方面应该取得了相当不错的进展。能否就此谈谈,同时也说说这如何融入你们更广泛的平台战略?谢谢。
黄仁勋 – 联合创始人、总裁兼首席执行官:
LPX 专为低延迟和高令牌速率而设计。它的吞吐量较低,容量也较小。它侧重于上下文处理,能够处理大量上下文信息,例如软件编码。对于代理型工作负载,其吸收大量上下文的能力则较弱。
因此,正如我之前所解释的,挑战在于 LPX 的适用场景并不广泛。它主要面向拥有大量不同类型令牌服务组合的用户,且由于需要高令牌速率,这些服务可能属于高端产品,客户数量并不多。但令牌速率非常高。
因此,这与我之前所说的完全一致。我仍然持这种预期。因此,我认为 LPX 以及其他基于 SRAM 的解码聚焦、令牌——你知道的,高令牌速率生成的聚焦加速器——在相当长的一段时间内,仍将是一种小众产品。在可预见的未来,情况依然如此。
正如你们所知,Grace Blackwell 和 Vera Rubin 支持 AI 的整个生命周期,从数据处理、训练准备,到预训练、训练后的强化学习,一直到推理。Grace Blackwell 是全球最适合完成所有这些任务的平台。
而且,如果在某些情况下,只要服务提供商已经拥有能够提供的高代币费率服务,那么我们就可以叠加一个 LPX,从而让他们提供更优质的服务。这就是我对市场的看法。
我认为,无论是 20%还是 10%,这完全取决于人工智能发展的当前阶段。我认为目前这一比例远低于 20%。将来某一天,这些优质 token 的比例或许能达到 20%。而且我知道,我们已经准备好与服务提供商合作,共同实现这一功能。
- CPU与GPU在Agentic AI中的角色互补而非蚕食,CPU运行Agent框架,GPU负责核心推理和子代理生成,200亿是指独立CPU收入
维韦克·阿利亚 – 美国银行证券:
感谢您回答我的问题。
詹森,关于 CPU 在代理式(Agentic)应用中的应用,业界反响热烈,而且关于 CPU 数量实际上已超过 GPU 数量的讨论也甚嚣尘上。
我希望你能分享一下你的看法:首先,这是否属于增量工作负载?是否会蚕食原本由 GPU 承担的工作?其次,你提到的 200 亿美元这个数字,是指独立的 Vera CPU 业务,还是已经包含在 Vera Rubin 的整体业务中了?
所以,如果您能为我们讲解一下,您知道的,CPU 与 GPU 各自的作用,它们之间是相互蚕食的关系,还是互补的关系?
还有那个 200 亿美元的数字,该如何结合贵公司的销售情况来理解呢?毕竟贵公司通常是将 CPU 作为 GPU 的一部分来销售的,对吧?谢谢。
黄仁勋 – 联合创始人、总裁兼首席执行官:
这 200 亿美元是针对独立 CPU 的。请记住,Vera 有 3 种应用方式。作为独立 CPU 有 4 种方式。
让我先从你们已经知道的那一种开始说起。
第一种是 VeraRubin。
我们将售出数百万台 Rubin,其中每两台都连接到 Vera。当然,我们也会为这些产品定价,且定价合理。这就是第一种应用场景。
第二种应用场景是 Vera 独立 CPU。
第三种是 Vera 与 CX9 的组合,以及相应的存储软件堆栈。
然后是搭载 CX 9 的 Vera,它配备了用于安全、计算隔离和机密计算的软件堆栈。
明白吗?所以这些用例中的每一个都是基于 Vera 构建的。
我的感觉是,在 VeraRubin 的整个生命周期内,我们都将面临供应短缺的问题。它有 4 种不同的用例。不过,不管怎样,不管怎样,对你问题的回答是:这 200 亿是独立的。
关于 CPU 使用情况,代理(agent)本质上就是人们所说的”框架”(harness)。代理拥有一个执行相关功能的框架,这个框架可以是 OpenClaw,也可以是 Hermes,或是 CodeClaude。它本质上就是围绕 Clot 模型、围绕 Claude 模型构建的框架。OpenAI 的 Codex 是一个围绕 GPT 5.5 模型构建的框架。
所以这些都是框架。这些框架提供了诸如 I/O、协调、内存管理、工具使用以及与工具的连接等功能,例如浏览器、C 编译器、Python 编译器等。因此,框架在 CPU 上运行,工具的使用也在 CPU 上运行。
明白吗?所以,例如,如果人工智能要进行搜索,或者使用浏览器,那就会在 CPU 上运行。
世界上有一百亿人类用户,我的感觉是,将来世界上会有数十亿个智能代理。虽然不是今天。我的意思是,我们会逐步发展到那个阶段。
但我们将拥有数十亿个智能代理。这些智能代理都会使用工具,而这些工具就像你们知道的那样,就像个人电脑,就像我们人类今天使用个人电脑一样。将来,你会看到一个智能代理在使用个人电脑。
所以,如果你试着想象一下未来的情景:你先选一个你觉得合适的智能代理数量,比如现在就选几十万个,但将来,最终可能会达到几十亿个。我完全可以想象,它们全都拥有并有效使用着各自的个人电脑。
因此,除了规模庞大之外,每个代理都会生成子代理。每次生成子代理时,都需要进行推理。这就是推理发生的地方。推理是在 GPU 上进行的。所有协调工作基本上都在 CPU 上运行。而子代理在生成后进行推理时,会使用 GPU。
无论代理何时使用仿真器,这些仿真器都可以在 CPU 或 GPU 上运行。这就是我们为何与 Cadence 和 Synopsys 紧密合作,以加速全球所有工具运行的原因。我们正在加速全球所有工具、数据处理引擎和数据存储库数据库引擎的运行,因为代理程序会使用这些工具,而且你知道,它们的耐心比人类更少,希望事情能迅速完成。
因此,我们正在加速全球所有工具的运行,使其能在 CUDA 上运行。你们可以看到我们在这样做——比如当我与 Cadence、Synopsys、西门子以及 Adobe 等公司合作时,正是因为我们正努力让全球所有工具都能在 GPU 上运行,毕竟它们已经拥有 GPU,而且运行速度要快得多。
因此,我们将需要更多的 CPU,而 Vera 的设计初衷就是作为一种代理式 CPU。
过去的 CPU 设计时都配备了大量核心,以便于出租。人们租用的是计算核心。但代理并不租用核心,它们只希望任务能快速完成。
过去的经济模式是”每核心美元”,这就是过去云计算的经济模式。未来人工智能的经济模式则是”每美元 token”,或者”每 token 美元”。因此,未来我们需要做的是生成代币,并尽可能快地处理 token。而这正是 Vera 最擅长的领域。
因此,我们预计 72 项目将取得巨大成功——它需要极高的安全性与机密计算能力,这也正是 Vera Rubin 成为全球首个具备端到端机密计算功能的平台的原因。此外,它还需要性能卓越的 CPU。我们已经准备就绪,所有环节都已全面覆盖。
- AI新云(Neo Clouds)归属第二类,将来规模会超过第一类,驱动来自50-80万亿美元工业与企业市场,英伟达全栈架构完美契合其需求
斯泰西·拉斯贡 – 伯恩斯坦研究:
我想回到市场细分这个话题。
首先,我只是好奇。在上述两个细分市场中,您将新云(neo clouds)归类到哪里?是归入超大规模云,还是归入 AI 云?我个人倾向于认为是后者,但也不太确定。
另外,它们的规模究竟如何?我的意思是,目前这两个细分市场的规模大致相当。我几乎觉得您暗示认为后者——即 ACIE 云——的增长速度会更快。也许未来会比超大规模云更快。您想表达的是这个意思吗?还是说您认为这两个细分市场将呈现类似的增长态势?
黄仁勋 – 联合创始人、总裁兼首席执行官:
首先,你说得对。这些原生 AI 云服务商确实不生产芯片,也不设计自己的芯片。而且他们既不想、也无法将无关的部件拼凑成一个 AI 工厂。
他们对”首次生成文本”所需时间的耐心和容忍度极低。他们对架构的需求极高,必须具备极强的兼容性,能够运行所有模型,并拥有遍布全球的客户。
正因如此,英伟达的架构才如此完美地契合他们的需求。我们提供所有组件,而对于我们未提供的部分,我们的合作伙伴生态系统也能提供。这一切都实现了完全集成。这一切都相辅相成。
能够从 AI 原生平台租用该服务的客户数量极其庞大。基本上,包括我所知道的每一位 AI 开发者、每一家 AI 原生初创公司,以及全球范围内的 SaaS 企业、大型企业、工业企业。
因此,我们的计算架构是全球所有计算平台中最具可租用性的。因此,它性能最强,部署最简便,租赁最灵活,拥有最佳的总体拥有成本(TCO),且融资最便捷。所有这些特性都与 AI 原生企业的需求高度契合。
它属于第二类。它们甚至与 OEM 厂商等非常相似。大型企业等等,真是令人惊讶。因此我们将它们归入第二类。如果你观察这一细分市场,它是在超大规模 AI 生态系统发展之后才开始增长的。
超大规模企业之所以率先发展 AI,原因有很多。你知道,他们拥有顶尖的计算机科学实力,具备卓越的数据中心能力。而且他们主要专注于消费级应用——即便这些应用并非完美,也并非世界末日,只要能提升服务质量,就是有益的。
因此,对于许多其他应用——无论是工业应用还是企业应用——在人工智能尚未具备足够能力、无法真正高效且安全地开展工作,也无法以切实产生影响和收益的方式运作之前,这些应用其实并不会被广泛采用。
因此,可以预见,第二类应用的发展速度会慢于超大规模应用。从数据中也能看出这一点。
然而,从长远来看,如果关注工业和企业领域,显然,未来的经济增长将来自这里。因为该领域占全球经济的50万亿至80万亿美元。而且,得益于人工智能,这一规模还将进一步扩大。
因此,我预计第二类业务在未来几年内,尤其是短期内,规模将会更大。我认为这已是板上钉钉的事。这两类业务都将呈现惊人的增长速度,虽然我预计第二类业务的增长速度会更快,但两者都将实现惊人的增长。
此外,我希望在未来5年内,实体人工智能和机器人技术领域也能实现惊人的增长。
- 英伟达1万亿美元收入可见度:前沿AI模型份额扩大、Vera独立CPU新2000亿美元TAM、以及LPX加速器组合
詹姆斯·施耐德 – 高盛集团:
大家下午好。感谢您接受我的提问。
在 GTC 大会上,我记得您曾提到 Rubin 和 Blackwell 平台收入的可见度达到 1 万亿美元,但我认为这不包括 LPX Rubin CPX 以及 Vera CPU 机架等产品。
能否请您大致说明一下,Vera CPU 是否将成为超越那 1 万亿美元规模的最大增长来源?您是否正在考虑其他产品组合(包括 CPU),以便在该总潜在市场(TAM)中占据更大的份额?谢谢。
黄仁勋 – 联合创始人、总裁兼首席执行官:
就万亿规模以上的增量而言,我想说:
第一,前沿 AI 模型的市场份额将继续增长,我预计其份额会进一步扩大,因此我预计这一部分将实现增长。
第二点,我们在该数据中并未包含任何 Vera 独立 CPU。因此我预计这将成为第二大市场。当然,其总潜在市场(TAM)相当庞大,涵盖代理系统等领域,而且我们所有的客户都对 Vera 充满期待。我们将售出大量 Vera 产品。
第三大市场则是 LPX。正如我之前所解释的,LPX 的设计初衷在于其 SRAM 架构,它具有超低延迟和极高交互性的优势。但与此同时,其吞吐量和上下文处理能力也相当有限。这其实正是基于 SRAM 的系统的本质特征。
但通过将 Vera、VeraRubin 和 LPX 相结合,我们将能够覆盖从预训练、后训练到推理的整个 AI 领域,包括基于代理的系统。
- VeraRubin将在Q3启动量产,已规划需求、收到采购订单,几乎所有主要客户都已准备就绪,Q4与明年Q1也非常重要
乔舒亚·布查尔特 – TD Cowen:
大家好。感谢各位回答我的问题,并祝贺公司取得如此优异的业绩。
科莱特,我记得你在准备好的发言中提到,GB-3 100 堪称公司历史上量产速度最快的芯片。那么,我们应该如何将 Vera Rubin 与这一基准进行比较?
它显然是一种全新的架构。虽然在硅片层面是全新的,但架构上与现有产品相似。这是否意味着 Vera Rubin 的量产爬坡速度会与 GB-300 相当?还是说鉴于采用了新硅片,爬坡过程会稍微平缓一些?谢谢。
科莱特·克雷斯 – 执行副总裁兼首席财务官:
其实我们之前就提到过,VeraRubin 将在下半年推出。我们将在第三季度启动。届时,我们的业务增长势头预计将持续,初期工作也将逐步就绪。
至于第四季度,目前尚难断言增长速度会更快,但需要强调的是,我们已规划好需求,已收到采购订单,且几乎所有主要客户都已准备就绪。
这些都是非常复杂的系统,我们需要将其整合起来。因此,我认为这主要取决于我们将产品推向市场所需的时间,除此之外,就是将我们所有已准备好接受订单的系统投入生产。
现在下结论还为时过早,但没错,我们将在第三季度启动。明年第一季度无疑也将非常重要,并且会持续推进至第四季度。
CEO陈词:Agentic AI已至,模型步入盈利期驱动更多模型的开发,英伟达已做好万全准备,并迎接全新增长引擎——Vera正在开辟一个价值2000亿美元的TAM
黄仁勋 – 联合创始人、总裁兼首席执行官:
这是一个非凡的季度。需求呈现抛物线式增长。
原因很简单:具有自主能力的 AI 已经到来。AI 现在能够完成富有成效且有价值的工作。模型现在能够盈利,因此模型开发者们正竞相开发更多模型。
在 AI 时代,计算能力就是收入,就是利润。英伟达是这个时代的平台。在全球所有平台中,英伟达计算平台支持的需求类型最为丰富。
请允许我重点介绍五大亮点。
首先,英伟达是唯一能够运行所有前沿 AI 模型的平台。随着 Anthropic 加入我们现有的合作伙伴行列——包括 OpenAI、xAI、Meta、Gemini 等众多企业——我们在前沿 AI 领域的份额正在不断扩大。
其次,我们的产品已覆盖所有超大规模云服务商。支持其核心数据处理和机器学习工作负载、内部 AI 服务,并满足其公有云服务中对 NVIDIA 用户的需求。
第三,我们全栈式的完整 AI 工厂解决方案和庞大的全球生态系统,使我们能够独特地应对新的 AI 数据中心细分领域、新的 AI 云原生应用、新的 AI 原生云以及主权 AI 云,以及本地企业与工业基础设施。这就是我之前提到的第二类。
第四,NVIDIA CUDA 技术已延伸至边缘计算领域。机器人、自动驾驶汽车、嵌入式医疗设备、AI RAN 电信基站……下一波浪潮将是物理人工智能。届时,数十亿个自主系统和机器人系统将在物理世界中运行。这就是我们刚才提到的第三个领域。
排在前五名之列的,还有我们一个重要的全新增长引擎——Vera。这是全球首款专为智能体人工智能设计的 CPU。Vera 为英伟达开辟了一个全新的、价值 2000 亿美元的潜在市场规模(TAM),这是我们此前从未涉足的领域。目前,所有主要的超大规模云服务商和系统制造商都在与我们合作部署该产品。
全球正致力于为智能体人工智能和机器人物理人工智能重构计算架构。英伟达正处于这些变革的中心。
三十多年来,我们构建了英伟达计算平台与架构、庞大的生态系统,以及横跨芯片、系统、网络和软件的深度协同设计——我们早在这一时刻到来之前就已将其构建完成,以便当具备自主行为能力的人工智能出现时,英伟达已做好万全准备。
这一时刻已经到来。期待下次与您再会。
One Comment
一位 WordPress 评论者
您好,这是一条评论。若需要审核、编辑或删除评论,请访问仪表盘的评论界面。评论者头像来自 Gravatar。