以下为Stratechery的Ben Thompson对Nvidia CEO黄仁勋的专访,访谈发生于黄仁勋在台湾Computex 2025发表主题演讲之后。此前,双方已进行过三次访谈,见证了GPU计算潜力从被理解到被实现的过程。如今,黄仁勋和英伟达在推动计算向前发展的同时,也面临着一系列全新的问题。
本次访谈首先探讨了与政治相关的新挑战:包括与沙特阿拉伯和阿联酋的最新交易、对华H20芯片销售禁令,以及美国芯片管制措施为何可能危及美国乃至英伟达的长期控制权。黄仁勋还阐述了人工智能为何能在不久的将来推动GDP增长,甚至可能减少贸易逆差。
随后,对话转向了当日的Computex主题演讲以及上个月的GTC主题演讲。两次演讲的侧重点有所不同,前者面向台湾的OEM厂商、组件制造商及其企业客户,后者则针对美国的超大规模云服务商。英伟达的目标是同时服务好这两类客户。为此,双方讨论了为何英伟达的全栈解决方案能最大化效用(包括Dynamo如何提升推理性能),以及英伟达的软件和系统构建方法如何允许客户按需购买组件。最后,访谈还简要提及了游戏业务。
阿拉伯世界的AI与芯片扩散规则
Ben Thompson:黄仁勋先生,欢迎再次来到Stratechery。
黄仁勋: 很高兴见到你,Ben。
Ben Thompson:非常高兴能与您本人见面,我们之前的交流都是通过Zoom进行的。您现在在台湾,您刚刚宣布了一个新大楼的建设计划,离我家还挺近,这真是令人兴奋。我们之前交谈时,我感觉您是希望全世界理解GPU的潜力。我们最初开始对话时,ChatGPT尚未问世,而现在,当您公布财报时,全世界的市场都仿佛悬于一线。我知道现在是静默期,我不会问关于财报的问题,但我想知道,身处世界瞩目的中心,这种感觉如何?
黄仁勋: 嗯,你问了一个我现在没有什么有趣答案的问题。答案是我对此没什么特别的感觉,但我确实认识到一点:在我们重塑英伟达的过程中——这始终是我们办公室工作的核心——我们努力重塑英伟达,以便能够领先于潮流,预测行业发展方向,我们希望解决难题并为行业做出贡献。但现在非常重要的是,我们不仅创建了一个计算平台,重塑了我们的公司,使我们更像一家数据中心规模的公司,并且我们提供的技术首次实现了完全集成以协同工作,同时又是解耦的,以便整个生态系统都能与之协作。
我在主题演讲中提到了一件非常重要的事情,那就是我们第一次不仅仅为科技行业构建计算机,我们正在为一个名为人工智能的新行业构建计算机。 现在,人工智能部分是技术,但它也部分是劳动力,并且正如我们所知,它增强了劳动力,当我们进入机器人技术领域时,这一点将变得非常非常清晰。这种名为人工智能的新技术实际上是一个全新的行业,而这个整个行业将由工厂来驱动,这将需要大量的计算机。人们才刚刚开始意识到,我们即将进入一个未来,我们所计算的——人们称之为数据中心,但它们实际上是人工智能工厂——其规模可能会相当庞大。
Ben Thompson:我注意到您引用了萨提亚·纳德拉(Satya Nadella)在微软财报电话会议上报告他们处理的Token(在大型语言模型中,Token是文本被分解成的基本单元,可以是一个词、一个字符或一个词的一部分)数量的数字,我想那是上个季度的。那是本季度财报中您最喜欢的部分吗?我也立刻注意到了,这真是一个很棒的指标。
黄仁勋: 事实上,实际生成的Token数量远高于此。那只是微软为第三方生成的部分,但他们自身的消耗量要大得多,而且还不包括OpenAI,所以你可以想象这个数字有多大。
Ben Thompson:据我了解,相对于报告的数字,这确实是一个非常非常大的量。您最近进行了一次环球访问——我们都知道台湾很美,我也提到了新的办公园区——我不得不问,中东地区这个时候怎么样?
黄仁勋: 热,但不潮湿。
Ben Thompson:是干热,对吧?
黄仁勋: 是的,是干热。我其实很享受,因为建筑物里很凉快,我会走出去沐浴阳光,感觉非常好。但夜晚简直不可思议。夜晚太美了。在外面吃饭,喝杯茶,真的很棒。
Ben Thompson:我当然也想问问与沙特阿拉伯和阿联酋宣布的AI合作。从您的角度来看,这为什么重要?您亲自到场又为何重要?
黄仁勋: 嗯,因为他们邀请我去的。我们在那里宣布了两个相当宏大的AI基础设施建设计划,一个在沙特阿拉伯,一个在阿布扎比。两国的领导人都非常高瞻远瞩,认识到他们的国家参与AI革命的重要性,认识到他们拥有非凡的机遇——他们拥有丰富的能源,但劳动力短缺,他们国家的潜力受限于劳动力的数量,即人口数量。因此,他们第一次可以将能源转化为数字劳动力和机器人劳动力、智能体、机器人。他们对此非常专注,并且表述得非常清晰。
沙特阿拉伯的王储殿下对此表述得非常清晰,充满热情,甚至了解这项技术。阿布扎比的谢赫·塔农(Sheikh Tahnoun)也对此充满热情,非常有远见,深刻理解这项技术的内涵及其为他们带来的机遇。所以我很高兴能去那里,我们正在与他们双方合作。
我们在沙特阿拉伯帮助成立了一家名为HUMAIN的新公司,他们的目标是登上世界舞台,建设这些AI工厂,接待国际公司,比如同样在场的OpenAI等公司。所以,这是一个非常重大的举措。
Ben Thompson:这是一个巨大的转变。其中一部分原因是美国从AI扩散规则上有所退让,我认为之前的规则对这些国家尤其严苛,规定了数量限制,必须由美国公司控制,在某些方面还受到美国国内建设情况的制约。英伟达与以往的做法相反,曾非常强烈地反对这些规则。从您的角度来看——我觉得这其中有您不得不成长的一面。Tae Kim在他的书中提到,英伟达就像一辆围绕您打造的F1赛车,您是赛车手。是否存在这样一个时期,您从未想过要处理这些政府事务,所以英伟达也从未真正考虑过这些,然后突然之间,您成了世界上最重要的公司,不得不非常迅速地学习这些东西?
黄仁勋: 嗯,并非我从未想过,而是我从未必须去想。在英伟达绝大部分的生命周期里,我们都在致力于技术研发、公司建设、行业发展和市场竞争。
Ben Thompson:是的,在一个纯粹竞争的行业里。
黄仁勋: 每一天,每一刻。建设我们的供应链,构建我们的生态系统。请注意,我刚刚描述的一系列事情,其规模和范围都极其庞大,本身就充满了挑战。然后突然之间,扩散规则出台了。我想我们当时就说过,但现在大家可能都看清楚了,这(AI扩散规则)对美国来说是完全错误的,大错特错。 如果扩散规则的目标是确保美国必须领先,那么按照它写的那样,将恰恰导致我们失去领先地位。
人工智能不仅仅是被称为模型的那一层软件,人工智能是一个全栈的东西,这就是为什么每个人总是在谈论英伟达的系统、基础设施和工厂等等。人工智能是全栈的。如果美国想在人工智能领域领先,就必须从芯片层面、工厂层面、基础设施层面、模型层面以及应用层面全栈领先——人工智能包含所有这些。
你不能只是说,“我们来制定一个扩散规则,以牺牲其他一切为代价来保护某一层”,这毫无意义。在我们国际竞争对手已经追赶上来的时候,限制美国的人工智能技术,这种想法……我们几乎预见到了这一点。
Ben Thompson:您说的国际竞争对手,是指其他模型吗?
黄仁勋: 中国做得非常出色。世界上50%的人工智能研究人员是中国人,你无法阻止他们,你无法阻止他们推进人工智能。 坦白说,DeepSeek 的工作非常出色。对他们给予任何低于此评价的赞扬,都是一种极度缺乏自信的表现,我简直无法容忍。
Ben Thompson:我们是否因为对他们施加的限制,特别是在内存管理和带宽方面的限制,反而激励了他们做得更好?
黄仁勋: 每个人都喜欢竞争。公司需要竞争来激励自己,国家也需要。毫无疑问,我们激励了他们。然而,我完全预料到中国会步步紧跟。华为是一家强大的公司,他们是世界级的技术公司。中国的研究人员、人工智能科学家,他们都是世界级的。他们不是所谓的“中国AI研究员”,他们是世界级的AI研究员。你走在Anthropic、OpenAI或DeepMind的过道上,会看到很多AI研究员,他们来自中国。这当然合情合理,而且他们非常出色,所以他们能做出非凡的工作,我一点也不惊讶。
AI扩散规则限制其他国家获取美国技术的想法,其使命表述完全错误,它本应是关于在为时已晚之前,加速美国技术在世界各地的应用。如果目标是让美国领先,那么AI扩散规则恰恰起到了相反的作用。
我认为AI扩散规则也忽略了关于AI技术栈如何运作的宏大构想。AI技术栈就像一个计算平台,它是一个平台。你的平台越大、能力越强,安装基础就越大,就会有更多的开发者在上面运行和开发。当更多的开发者在上面开发时,运行在你计算平台上的结果和应用程序就会更好。因此,你会卖出更多,你的计算平台会被更多地采用,这会增加你的安装基础,从而增加使用它来开发AI模型的开发者数量,这又会进一步……这种正反馈系统对于任何计算平台的重要性都怎么强调也不为过,这也是英伟达今天成功的原因。
让美国不去中国市场竞争,而那里有50%的开发者,从计算基础设施和计算架构的角度来看,这完全没有道理。 我们应该去,给美国公司机会在中国竞争,抵消贸易逆差,为美国人民创造税收收入,建设,雇佣,创造更多就业机会。
英伟达与中国
Ben Thompson:公平地说,我们是不是只完成了一半?因为我们从海湾地区的交易和AI扩散规则开始,当然,从国家竞争的角度来看,让这些国家……
黄仁勋: 这两个想法是相辅相成的,我的意思是:如果我们不在中国竞争,并且因为我们不在那里竞争而让中国的生态系统建立起一个丰富的生态系统,新的平台被开发出来而它们不是美国的,那么在世界正在传播AI技术的时候,他们的领导地位和技术就会扩散到世界各地。
Ben Thompson:这正是我的观点。从您的角度看,我们只完成了一半。至少我们没有在其他国家切断自己的联系。
黄仁勋: 是的。
Ben Thompson:但我们应该彻底放开,让英伟达重返中国市场。
黄仁勋: 是的,但我认为,实际上,不进入中国市场相当于放弃了90%的努力。 这实际上不是50/50,而是90%。
Ben Thompson:所以我们只完成了10%。
黄仁勋: 是的,完全正确。
Ben Thompson:郑重声明,我同意您的观点。我的看法是,试图限制芯片销售,然后给他们所有他们想要的芯片制造设备,这完全是本末倒置——追踪芯片比追踪芯片制造设备要困难得多。华盛顿特区一些人提出的理论是,“芯片制造公司或半导体设备制造公司,他们在华盛顿已经很多年了,他们非常擅长游说,而英伟达不在这里,所以他们处于不利地位”。您觉得这听起来真实吗?您是否觉得很难让华盛顿的人理解这种观点?
黄仁勋: 过去几年,我们必须非常努力地在华盛顿特区建立我们的影响力。我们只有少数几个人,而我们这种规模的公司通常有数百人,我们只有少数人。我们这少数几个人非常了不起,他们在讲述我们的故事。他们帮助人们解释和理解,不仅仅是芯片如何工作,还有生态系统如何运作,AI生态系统如何运作,以及这些政策可能带来的一些意想不到的后果。
我们希望美国赢。每个公司都应该希望自己的国家赢,每个国家也应该希望自己的公司赢,这些都不是糟糕的感觉,这些是好的感觉,人们喜欢赢也是好的。 竞争是好事,渴望变得伟大是好事。当某个国家渴望变得伟大时,我们不应该嫉妒他们。当某个公司渴望变得伟大时,我不会嫉妒他们。这会促使我们所有人超越自我,做得比我们能做的更好,所以我喜欢看那些渴望变得伟大的人。
毫无疑问,中国渴望变得伟大,这对他们来说是好事!他们绝对应该有这样的期望。对于我所认识的全世界所有AI研究人员和AI科学家来说,他们之所以能达到今天的位置,是因为他们都渴望变得伟大,而且他们确实很伟大。我认为那种想法……
Ben Thompson:要赢,就必须把别人踩下去。
黄仁勋: 是的,这对我来说毫无意义。我们应该跑得更快。英伟达之所以能有今天,之所以能有今天的地位,我们完全没有任何人的支持才走到这里,就让我们继续努力奔跑吧。 我认为那种我们会拖累别人的想法,正如你所提到的,只会激励他们变得更强大,因为这些人都是了不起的人。
Ben Thompson:我同意。作为一个美国人,我对此感到深感沮丧。我觉得我们应该通过超越创新、通过更快发展来取胜,而那种我们要通过釜底抽薪、切断联系、给每个人设置官僚障碍并试图追踪一切来取胜的想法,对我来说,似乎非常令人沮丧地不符合美国精神。
黄仁勋: 是的。不管怎样,我认为总统确实看到了这一点,他希望美国赢。
Ben Thompson:关于这一点有个问题,因为正是同一个政府切断了H20芯片的供应,那是一款你们基本按照前任政府规格设计的芯片,突然之间,“它不行了”,现在他们又在做这笔交易。批评者们会说,“哦,这可能会向中国敞开大门,XYZ等等”。这确实感觉像是政府的转变,也许他们会辩称这仍然是同一回事。但是过去六周中美之间也发生了很多转变,我认为这是一种说法。
您是否感觉到,也许人们已经真正认识到这个世界是如此相互关联,一方发生的事情会影响另一方,也许剥离开来并不那么容易,实用主义将会回归,以及我们该如何管理这一切?您对此持乐观态度,还是在做最坏的打算?
黄仁勋: 总统对他想要实现的目标有愿景,我支持总统,我相信总统,我认为他会为美国创造一个伟大的成果,他会以尊重和愿意竞争但也寻求合作机会的态度来做到这一点。我能感觉到,我看到了所有这些。显然,我不在白宫,我不知道他们确切的感受,但这是我的感觉。
首先,关于H20的禁令,这是我们能对Hopper架构芯片做的最大限度的削减了,我们已经削减到几乎没什么可削减的了。我们已经注销了——我想是55亿美元——历史上没有哪家公司曾注销过这么多库存,所以对英伟达H20的额外禁令是极其痛苦的。其成本非常非常高昂,我不但损失了55亿美元,我们注销了55亿美元,我们放弃了150亿美元的销售额,可能还有——多少来着?——30亿美元的税收。中国市场每年大约有500亿美元的规模,不是5000万美元,是500亿美元。500亿美元相当于波音公司,不是一架飞机,是整个公司。 放弃这些,以及随之而来的利润、规模和生态系统建设……
Ben Thompson:从长远来看,这对CUDA的真正威胁是……
黄仁勋: 是的。
Ben Thompson:中国建立替代方案。
黄仁勋: 完全正确。任何认为仅仅通过禁止中国使用H20芯片这一步棋就能切断他们发展AI能力的想法,都是极度无知的。
人工智能推动GDP增长
Ben Thompson:关于电力方面有一个角度我想稍后谈到,但现在让我们先谈点更有趣的。撇开所有政府事务,我们稍后再回到这个话题。关于金融市场、政府的第三个问题,在今天的主题演讲中,您一开始就说:“我们是一家基础设施公司,你们需要五年的路线图”。您顺便提到,您创办英伟达时的最初潜在市场规模(TAM)估计是3亿美元。您是什么时候真正预见到“我们将成为基础设施公司”的?——再次回到我们之前的对话,我从那些对话中的感觉是,您只是希望人们看到这种可能性。您看到了GPU计算的可能性,但是这个规模,有没有让您感到一点点震惊?
黄仁勋: 如果你像你一样,几乎一直都在看我的主题演讲,你会发现,今天发生的事情,我五年前就谈到过。在我五年前谈论它的时候,措辞没有那么清晰,我使用的词汇也没有那么精确,但我们要去的方向是一致的。
Ben Thompson:所以基本上,现在您在每次主题演讲结束时都会重点谈论机器人技术,您一直都是这么做的,这是我们应该真正关注的五年展望。
黄仁勋: 是的。事实上,我已经谈论这个大约三年了。
Ben Thompson:是的,所以几年后就会实现。
黄仁勋: 几年后,我认为它会发生。
这个行业相当深刻和意义深远的一点是,在过去的60年里,我们一直是IT行业,它是一种技术和工具,是人们使用的技术和工具——而我们将第一次走出IT预算的范畴,我们销售的产品进入IT预算,我们即将走出IT预算,进入制造业或运营支出(OpEx)预算。
制造业预算是因为我们正在制造机器人,或者因为机器人系统被用来制造产品;而运营支出则是因为数字劳动力。全球的运营支出和资本支出(CapEx)加起来有多少?50万亿美元?这是一个巨大的数字。所以IT行业大约是1万亿美元,由于人工智能的出现,我们即将把我们所有人带入一个约50万亿美元的行业。
当然,我最初的希望是,而且我认为事情会这样发展,尽管工作岗位会改变,一些工作岗位会消失,但许多新的工作岗位会被创造出来。机器人系统,无论是智能体(能够自主感知环境、进行决策并执行动作以实现特定目标的计算实体)还是实体机器人,很可能会扩大全球的GDP。原因是我们劳动力短缺,这就是为什么每个人都有工作。如果你在美国各地走走,失业率处于历史最低点,这正是因为我们劳动力不足。餐馆很难招到员工,许多工厂显然也很难招到员工。我认为,以每年10万美元的价格雇佣一个机器人的想法,人们会毫不犹豫地去做,原因在于这直接提升了他们创造更多收入的能力。所以我认为在接下来的五到十年里,我们很可能会经历GDP的扩张,以及这些人们现在将会理解的Token制造系统所带来的全新产业。
Ben Thompson:我觉得今天的主题演讲还有一点很有意思,我来之前为这次访谈做了准备,我想,“嗯,可能会有点像GTC的翻版”,但我发现实际上区别相当大。这是我的解读,您得告诉我是否正确。感觉GTC是为超大规模云服务商准备的,而今天的演讲是为企业IT准备的,像是针对两个不同的市场。
黄仁勋: 是的。
Ben Thompson:我对于目标受众的理解正确吗?
黄仁勋: 企业IT,或者说是面向企业IT的智能体和面向制造业的机器人,原因非常清楚,这是生态系统的开端。
Ben Thompson:顺便说一句,您制作的关于台湾生态系统以及构成所有部件的精美视频真是太棒了。
Dynamo与英伟达全栈
Ben Thompson:让我们谈谈GTC的主题演讲,那是我最喜欢您的主题演讲之一,我确实看了所有的,并且看了很多年。您解释了数据中心的局限性,以及为什么英伟达是答案,充满了真正的“黄教授”风范。我将其解读为一种反ASIC(专用集成电路)的信息。您一方面展示了您的路线图,好像在说“尽量跟上这个”,另一方面,您引入了延迟与带宽的帕累托曲线(一种表示在给定约束条件下,资源分配达到最优状态,无法在不损害一方的情况下使另一方更好的曲线),并且因为它们是可编程的,您可以在整个曲线上使用相同的GPU。当然,超大规模云服务商是那些会制造ASIC的公司。
GTC 2025上展示的推理性能帕累托曲线
Ben Thompson:我对您在那里演讲的理解正确吗?
黄仁勋: 我认为教学内容是对的,但我这样做的原因不完全是那样。我只是想帮助人们理解如何构建一个新的数据中心。我们一直在思考这个问题,所以挑战在于:数据中心的能源是有限的。100兆瓦就是100兆瓦,250兆瓦就是250兆瓦。所以你的根本任务,如果它是一个工厂,就是要确保整体的每瓦吞吐量是最高的,因为这个整体的Token吞吐量,取决于它是廉价的Token,即免费使用的Token,还是高质量的Token,后者可能有人愿意每月支付,比如说,一千美元,一万美元。
Ben Thompson:您刚才提到了一个价值10万美元的AI助手。
黄仁勋: 完全正确。我会雇佣一个年薪10万美元的AI智能体吗?毫不犹豫。原因是我们整天都在雇佣比这贵得多的人。如果我能用十万美元来放大一个我付薪50万美元的人的效能,那将是不可思议的,所以我当然会这么做。
你在工厂中生成的Token质量是多种多样的。你需要一些免费使用的,也需要一些高质量的,所以你的需求横跨了整个帕累托曲线。 你不能设计一个只擅长某一方面的芯片或系统,因为它会被闲置。所以现在的问题是,你如何创建一个系统,能够同时,在某个时刻,用于免费Token生成,一部分用于免费Token,一部分用于高质量Token?
如果你让架构过于碎片化,那么你来回移动工作负载的能力就会很困难。所以我认为,当人们仔细思考这个问题时,如果你设计一个在Token生成速率非常非常高的系统,它自然会有非常低的整体吞吐量。如果你设计一个吞吐量非常高的系统,它往往交互性很差,即每个用户的每秒Token数很低。所以,紧贴X轴很容易,紧贴Y轴也很容易,但要填满那个区域就很难了。这就是我们通过Blackwell架构、FP4、NVLink 72以及HBM内存及其容量之间的比例、浮点运算量与内存容量和带宽之间的平衡,以及非常重要的Dynamo解耦流式服务生态系统、硬件系统等所有这些组合所实现的创新。
Ben Thompson:我想问问您关于Dynamo的情况,今天没有提到,但我认为这非常有趣。
黄仁勋: 非常重要。
Ben Thompson:给我简单介绍一下吧,我记得您称它为数据中心的操作系统。
黄仁勋: 简单来说,推理工作负载,也就是Transformer模型,它有不同的处理阶段,这些阶段可以根据用户、模型以及模型的上下文以不同的方式使用。因此,我们将大型语言模型的处理过程分解为预填充(pre-fill)(指在生成响应前,模型处理输入提示和相关上下文信息的过程),也就是上下文处理,思考你即将问我的问题。这与我对Ben的记忆以及你喜欢做的那种深度对话式播客有关,它们往往……如果我开始深入谈论行业和技术,我不会感到不自在。
Ben Thompson:是的,您现在不是在为晚间新闻录制一段简短的引言之类的。
黄仁勋: 是的。我觉得我可以深入探讨,因为你能够理解,我不会感觉像在对牛弹琴,所以我谈论这些事情感到非常自在。
嗯,当一个AI与聊天机器人交互时,聊天机器人需要一些上下文信息,所以聊天机器人有记忆,它们处理上下文,甚至可能需要阅读一两份PDF文件,这就是所谓的预填充(pre-fill)部分,预填充部分对浮点运算能力要求很高。
然后是解码(decode)(指模型根据预填充阶段处理过的信息,逐个生成输出Token序列的过程)部分。解码部分是关于现在生成想法,是关于推理你将要说的内容,预测下一个Token。 所以一个思维链基本上会生成更多的Token,这些Token又被反馈到上下文中,从而生成更多的Token。它是一步一步地推理问题,也许它需要去查阅一些资料。现代版本的人工智能,这些代理式AI(agentic AI)(指能够自主规划、执行多步骤任务以实现复杂目标的人工智能系统),推理式AI,它们所需的浮点运算量和带宽——解码需要大量带宽——在所有情况下都很高,但需求程度可能会更高。
Ben Thompson:它是变化的。
黄仁勋: 是的,它会根据情况变化。
Ben Thompson:在解码阶段,你不需要很高的浮点精度。
黄仁勋: 是的。例如,一次性(one-shot)生成,并且已经有了强大的KV缓存(Key-Value Cache,在Transformer模型中用于存储先前计算的键值对,以加速后续Token的生成),你就不需要太多的浮点运算。然而,一旦你加载了上下文,你就需要大量的浮点运算。Dynamo将所有处理过程解耦,并将其分散到数据中心,智能地计量工作负载和处理器上的负载,这是非常复杂的事情。
Ben Thompson:嗯,这与“如果整个数据中心是一个GPU”的理念相关,您谈论的是一个将其视为一体的软件层。
黄仁勋: 是的,它本质上是AI工厂的操作系统。
Ben Thompson:当您思考这些思考模型、这些推理模型并展望未来时——您是一位,正如您所说,有出色预测能力的人——您认为它们主要会被用于代理式工作流程吗?它们的缺点是您需要坐等它们完成,或者也许您可以设置一堆并行工作的代理,这样效果会很好?还是说,它们最终在为训练生成数据以获得更好的一次性结果方面最为重要,而这正是人们更频繁交互的方式?
黄仁勋: 我认为这取决于成本,我的预测是,推理模型很可能成为基线,因为我们将以闪电般的速度处理这些。 基本上,当你启用Grace Blackwell时,速度提高了40倍,假设下一次迭代再快40倍,而且模型本身也在不断进步。所以,从现在到五年后,我们在代理式模型上的速度能够提高10万倍,这对我来说是非常合理的。
Ben Thompson:这就是计算的历史。
黄仁勋: 是的。所以它只是思考了堆积如山的事情,你只是没有看到而已。它现在是一个快速思考者,即使是缓慢的思考也很快。
Ben Thompson:那本书叫什么来着?《思考,快与慢》,现在把它应用到AI上。我猜它可能一秒钟就能读完整本书,所以可能反而失去了意义。
黄仁勋: 是的。
企业AI与实用主义
Ben Thompson:回到政治话题,稍微提一下。您在谈论这个问题以及每瓦性能时,您的表达方式是否在某种程度上是美国中心主义的?在一个我们难以建设电力、电力是主要制约因素的世界里?您看看像这些海湾国家,由于各种原因,电力更容易获得,更容易建设。然后您去中国,猜猜怎么着?如果电力不是主要制约因素,您可以解决很多英伟达为您解决的问题。GTC在美国举办,这是否是针对美国的信息传递?
黄仁勋: 哦,我没有那样想过。我认为无论发生什么,你的工厂总会有一定的大小,即使你的国家有更多的能源,你的数据中心也没有。所以我认为每瓦性能(perf-per-watt)始终很重要。
Ben Thompson:它一直很重要,但重要程度可能会有所不同。
黄仁勋: 是的,没错。只是如果你为此做规划,另一方面你会说,“好吧,我有一个架构,其每瓦性能只有一半,所以我可能会多买两倍的土地,两倍的电力,然后从一开始就这么建”。然而,当你把所有这些东西放在一起时,问题就来了。
记住,即使是基础设施本身和电力输送,比如说对于一个千兆瓦的设施,我们来做个简单的计算。假设其中300亿美元用于厂房、电力、土地、运营等所有这些。再假设计算、网络以及所有存储方面的投资是500亿美元,好吗?那么,如果结果是你必须建造两倍的规模,你就得把那300亿美元乘以2,变成600亿美元。所以,你将不得不获得一些非常便宜的计算能力来弥补这个差额。这就是为什么我总是觉得,在AI工厂的世界里,数学计算会表明,如果一个架构不够好,有时取决于它到底有多差,即使是免费的也不够便宜。
Ben Thompson:如果这是你唯一的选择,你会设法让它运作起来。
黄仁勋: 是的。
Ben Thompson:那么,让我们与今天的情况对比一下。您今天几次说到,“我乐于您从我这里购买所有东西,但我也乐于您从我这里购买任何东西”。在我完全明白这像是企业主题演讲(这又是我的说法,不是您的)之前,这很有趣,其中有一种实用主义的感觉,让我觉得,“他现在听起来像个企业CEO,他们非常务实”。当然,如果您购买整个技术棧,效果会更好,这很有意思。如果您谈论的是建立一个完整的AI工厂,用您的话说,当然使用所有英伟达的产品会最大化您的回报。但是有很多客户只是购买零散的部件,对于这些客户,也许您希望他们购买全部,但如果他们从您这里购买任何东西,他们很可能会永远从您这里购买。所以从战略上看,这是一个非常有用的基础去争取。
黄仁勋: 为客户服务本身就是明智之举。 如果你观察英伟达进入市场的方式,我们总是以完全集成的方式构建产品,因为软件需要以某种方式与硬件集成,但我们做得有足够的规范性,以便之后可以将软件与硬件解耦,你可以选择不使用我们的软件。如果你看我们设计系统的方式,我们实际上是以足够规范的方式将系统解耦,如果你想替换其中的某些部分,你是可以做到的。现在,Grace Blackwell正在世界各地的不同云平台中进行集成和部署,它们都基于我们的标准,但它们又都略有不同,而我们都能适应它们。
我认为这才是英伟达商业模式的真正挑战所在,这与我们想要成为一家计算平台公司的愿望是相辅相成的。最重要的是,如果英伟达的某个技术栈被采用,比如我们的计算技术栈,那很好。如果我们的网络技术栈被采用——我对它抱有与计算技术栈同样深厚的情感和强烈的信心——如果我的计算技术栈被整体采用,那太棒了。如果我的网络技术栈被采用,太棒了。如果两者都被采用,那就不可思议了。
Ben Thompson:嗯,我的意思是,很多人,你们的NVLink Fusion,你可以只购买NVLink,你可以用它来集成你的ASIC——这与我所理解的GTC传递的信息完全相反——但是,我再次明白了这里的观点。我的意思是,客户是谁?
黄仁勋: 我仍然坚信英伟达正在构建一个整体上更好的系统,我仍然相信这一点。如果我不相信这一点,那么显然我们一定做错了什么,我们必须让自己相信这一点。所以我完全相信,英伟达是世界上最大的规模化加速计算公司,我们是世界上最大的规模化AI计算公司。 从未有任何地方像我们这样,拥有36,000到38,000名员工团结一致地专注于这项工作。因此,如果一个只有14人的小团队能比我们做得更好,那将是令人非常痛苦和难以接受的,所以我们努力做得更好。
Ben Thompson:然而,您也相信规模效应,而让您销售的所有产品都获得规模效应的一个好方法就是按照客户想要的方式销售。
黄仁勋: 是的,完全正确。正是如此。所以,我有我的偏好,但我们要确保能够按照每位客户希望的方式为他们服务。
游戏业务何去何从
Ben Thompson:沿着这个思路,也许这与此相关:我向我的一个朋友提起这次采访,他说他儿子坚持要我问这个问题。一些游戏玩家觉得,您今天提到了,主题演讲中只有10%是关于GeForce的,但这仍然对我们很重要。这是否意味着,“这对我们仍然很重要,因为这一切都会扩展,我们正在制造GPU”?或者我应该如何向我朋友的儿子解释英伟达与游戏的关系?
黄仁勋: 看,我真希望我当时说了,没有GeForce就不会有RTX PRO,没有GeForce就不会有Omniverse,我们在那些视频中看到的任何一个像素,没有GeForce都不可能实现,机器人没有GeForce也不可能实现,Newton没有GeForce也不可能实现。所以GeForce本身,它们并没有那么深入地参与到GTC活动中,因为GTC往往是关于高性能计算、企业和AI等方面的。我们有专门针对游戏开发者等的独立会议。所以只是当我做GTC演讲时,有一群人我总是觉得有点对不住他们,因为他们的产品发布不是那么核心,但这只是因为受众不对。但他们也知道,GeForce在我们所做的一切中扮演着不可或缺的角色。
Ben Thompson:我的意思是,是否存在这样一种情况:游戏玩家可能没有充分认识到,他们的GeForce显卡在目前已经远不止是图形渲染引擎了?
黄仁勋: (笑)是的,没错。完全正确。我今天也说了,我们只渲染了十分之一的像素,这是一个惊人的数字。 假设我给你一个拼图,我只给你十分之一的碎片,另外十分之九的碎片我根本不给你,你必须自己把它们补全。
Ben Thompson:我还有另一个角度帮你把游戏和你其他业务联系起来。你刚才谈到你们如何严谨地保持各部分分离,并能够将其分开,以及软件如何管理所有这一切。坦白说,这听起来有点像Windows上的驱动程序问题,这只是你们拥有的一项核心技能。
黄仁勋: 是的,只是驱动程序级别太低了,它涉及的东西太多,太多的寄存器。驱动程序抽象实际上是一场革命,微软在其中扮演了非常重要的角色。如果没有驱动程序的概念,Windows 不会发展到今天的地步。它创建了一个API的抽象层,而底层的硬件可以发生相当大的变化。
我们的驱动程序现在是开源的,但坦率地说,我没看到有很多人为此做出贡献。原因在于,一旦我推出另一款GPU,他们之前在驱动程序上所做的所有工作基本上就作废了。所以,如果没有像英伟达这样庞大的工程师团队,这是很难做到的。但是,如果我们为每一款GPU及其相关的驱动程序进行优化,那么就会有一个很好的隔离层,一个抽象层,无论是CUDA还是DirectX,人们都可以在此基础上进行构建。
Ben Thompson:听着,这是我对朋友儿子的回答。我不得不问您关于政府事务的问题,您对自己的观点给出了精彩而充满激情的辩护,但当我问及游戏驱动程序时,您才真正兴奋起来,眼睛也亮了。
黄仁勋: 哦,是吗?
Ben Thompson:所以我想一切都还好。
黄仁勋: 哦,太好了。是的,我其实非常喜欢GeForce。
Ben Thompson:这就对了,所以说当面交流效果更好。黄仁勋先生,非常感谢您。
发表回复