PG电子黄仁勋:量子计算正迎来拐点计划在欧洲新建20家“人工智能工厂”
栏目:PG娱乐 发布时间:2025-06-12
  PG电子(Pocket Games Soft )全球首屈一指的电子游戏供货商[永久网址:363050.com],首位跨足线下线上电子游戏开发。PG电子,pg娱乐,PG电子试玩平台,PG电子技巧,PG电子下载,欢迎注册体验!   6月11日,英伟达举行GTC大会。CEO黄仁勋在会上发表演讲。他宣布,计划在欧洲新建20家“人工智能工厂”

  PG电子(Pocket Games Soft )全球首屈一指的电子游戏供货商[永久网址:363050.com],首位跨足线下线上电子游戏开发。PG电子,pg娱乐,PG电子试玩平台,PG电子技巧,PG电子下载,欢迎注册体验!

PG电子黄仁勋:量子计算正迎来拐点计划在欧洲新建20家“人工智能工厂”

  6月11日,英伟达举行GTC大会。CEO黄仁勋在会上发表演讲。他宣布,计划在欧洲新建20家“人工智能工厂”,欧洲的AI算力将在两年内增长10倍。

  黄仁勋表示,计划中的多个数据中心将是“超级工厂”,将配备10000个图形处理单元(GPU),包括英伟达DGX™ B200系统和英伟达RTX PRO™服务器,并助力欧洲的工业领军企业加速所有制造应用,涵盖从设计、工程和仿真到工厂数字孪生和机器人技术的各个环节。

  英伟达正在德国助力打造一个支持欧洲制造商工业人工智能工作负载的人工智能工厂。

  该人工智能工厂将按照英伟达Omniverse蓝图中突出显示的框架进行建设,用于人工智能工厂的设计和运营。作为该蓝图的一部分,Cadence的现实数字孪生平台将被用于在物理上精确的虚拟环境中模拟和优化整个人工智能工厂,使工程团队能够建造一个更智能、更可靠的设施。

  他认为,智能体系统代表着AI从被动接受指令到主动感知、决策和执行的进化。它预示着AI将能够更自主地完成复杂任务,并在更广泛的领域内发挥作用。而AI工厂则代表着AI基础设施的规模化和工业化,它将整合强大的计算能力、高效的数据处理流程以及优化的算法,从而加速AI模型的训练、部署和应用。

  他表示,未来的数据中心不再仅仅是存储文件和数据的仓库,而是能够产生智能、创造价值的生产设施。这些AI工厂的核心任务是生产“智能通证(intelligent tokens)”,就像发电厂产生电力一样,为各行各业提供动力,开启一场新的工业革命。

  为支撑AI工厂的庞大算力需求,黄仁勋详细介绍了英伟达的新一代架构Blackwell。他将GB200系统形容为一台专为思考而生的“思维机器”,其设计初衷就是为了应对AI模型日益增长的“推理”需求。该系统通过全新的NVLink技术实现内部连接,其背板带宽高达惊人的130TB每秒,超过了全球互联网的峰值流量。黄仁勋指出,正是这种架构上的巨大飞跃,使得AI的思考速度和处理能力得以实现数十倍的代际性能提升。

  “在人工智能时代,每个制造商都需要两个工厂:一个用于制造产品,另一个用于创造驱动这些产品的智能。

  通过打造欧洲首个工业人工智能基础设施,我们正在助力该地区的领先工业企业推进以仿真为先导、人工智能驱动的制造模式。”

  黄仁勋还表示,量子计算正迎来拐点。英伟达将在Grace Blackwell 200芯片上搭载CUDA-Q软件工具包。量子算法堆栈可以在Blackwell200上加速。他预测量子系统将快速变得更加稳健、高性能和有韧性。

  他透露,英伟达的芯片将用于支持量子计算,公司的整个cuQuantum量子计算算法堆栈,将在Grace Blackwell 200芯片上可用并得到加速。

  量子计算机的核心优势在于并行处理能力——传统计算机的比特只能是0或1,必须按顺序处理,而量子计算机的量子比特可以保持叠加态,在整个计算完成前不被赋值,从而实现协同工作而非独立运算。

  就像摩尔定律一样,我完全可以预期每五年逻辑量子比特增长10倍,每10年增长100倍。

  值得注意的是,今年1月,这位AI教父还在泼冷水,声称非常有用的量子计算机可能还需要几十年才能实现。而包括微软和谷歌在内的科技巨头已经在这个领域耕耘数十年,技术难题和高昂成本一直让实用化系统停留在实验阶段。

  黄仁勋对AI下一阶段的重点智能体AI(Agentic AI)做出预判 。他认为,AI已经超越了识别信息和生成内容的阶段,正迈向一个能够理解任务、进行推理、规划并执行复杂任务的全新浪潮,这种能力的物理化身便是机器人。

  现场,他通过一个名为“Greg”的机器人展示了这一概念,这个机器人在Omniverse构建的数字孪生虚拟世界中学会行走和与环境互动后,才被部署到物理世界。宝马、奔驰、丰田等众多企业已开始利用Omniverse构建其工厂或产品的数字孪生体。

  作为在欧洲的重磅活动,黄仁勋特别强调了与欧洲伙伴的深度合作。英伟达还宣布,包括宝马集团、玛莎拉蒂、梅赛德斯-奔驰和舍弗勒在内的欧洲制造商正在通过运行来自ANSYS、Cadence和西门子等软件领导者提供的英伟达加速应用,转变其从模拟产品设计和工厂规划到人工智能驱动的运营和物流的端到端产品生命周期。

  他宣布,将与法国AI公司Mistral合作建立一个庞大的AI云,并与施耐德电气等公司合作,以数字化的方式设计和运营未来的AI工厂。

  他透露,英伟达正在七个不同的国家建立AI技术中心,以推动当地的生态系统建设和合作研发。黄仁勋总结道,一个全新的计算时代已经开启,而英伟达正通过提供从芯片、软件到系统和AI模型的全栈平台,赋能全球的开发者和企业抓住这次机遇。

  这是英伟达在巴黎的首次GTC大会。这太令人难以置信了。感谢所有合作伙伴与我们一同出席。多年来,我们与众多伙伴合作,虽然这是我第一次在巴黎举办GTC,但我有很多内容要和大家分享。

  英伟达曾经想要打造一个全新的计算平台,去做普通计算机无法做到的事情。我们加速了CPU,创造了一种名为加速计算的新计算方式,而我们最早的应用之一是分子动力学。从那时起,我们已经取得了长足的进步,开发出许多不同的库。事实上,加速计算的特别之处在于,它不仅仅是一个新的处理器,你可以软件将编译到上面。你必须重新思考如何进行计算,重新设计你的算法。事实证明,让人们将软件和算法重新设计为高度并行化是非常困难的。因此,我们为每个市场、每个应用领域开发了库,以实现加速。这些库为开发者开辟了新的机会,也为我们和我们的生态系统合作伙伴带来了新的增长机会。

  计算光刻技术可能是当今半导体设计中最重要的应用之一,它在台积电、三星等大型半导体工厂中运行。在芯片制造之前,它会通过一个逆物理算法,即计算光刻技术、直接稀疏求解器、代数多重网格求解器——我们刚刚开源了一个非常令人兴奋的应用库。这个库加速了决策制定,优化了具有数百万变量和数百万约束条件的问题,例如旅行商问题。

  Warp是一个用于表达几何和物理求解器的Python框架,非常重要。cuDF、cuML用于结构化数据库、数据框和经典机器学习算法。cuDF可以加速Spark,无需修改代码。cuML可以加速scikit-learn,同样无需修改代码。还有Triton和cuDNN。cuDNN可能是英伟达有史以来最重要的库之一,它加速了深度神经网络的基本原语。而Triton是我们全新的库,能够在整个AI工厂中调度、协调和分配极其复杂的推理工作负载。

  cuPy等变性和cuTensor收缩算法。等变性是用于遵循几何定律的神经网络,例如蛋白质、分子,这是一个非常重要的框架,能够支持AI在6G Earth 2中运行,这是我们的天气和气候模型基础模型的模拟环境,分辨率极高,达到平方公里级别。

  MONAI是我们的医学成像框架,非常受欢迎。Parabricks求解器用于基因组学分析,也非常成功。CUDA Quantum(CUDA-Q),我稍后会详细说明,用于量子计算,以及CuPy用于加速NumPy和SciPy的数值计算。正如大家所见,这些只是部分库的例子。我们还有400多个其他库,每个库都加速了一个应用领域,每个库都带来了新的机会。其中最令人兴奋的是CUDA-Q。CUDA-Q是一套用于加速应用和算法的库。在CUDA的基础上,我们现在有了CUDA-Q,用于量子计算,基于GPU的经典量子计算。

  我们已经研究CUDA-Q好几年了。今天,我可以告诉大家量子计算正在迎来一个转折点。正如大家所知,第一个物理量子比特大约在30年前被展示出来,1995年发明了一种纠错算法,而在2023年,也就是近30年后,谷歌展示了世界上第一个逻辑量子比特。从那以后,又过了几年,逻辑量子比特的数量开始增长,它们由许多带有纠错功能的物理量子比特组成,就像摩尔定律一样。我可以完全预期,每五年逻辑量子比特的数量会增加10倍,每十年增加100倍。这些逻辑量子比特将具备更好的纠错能力,更加稳健、性能更高、更具韧性,并且当然会继续可扩展。

  量子计算正在迎来一个转折点。我们与世界各地的量子计算公司以多种方式合作。但在欧洲,这里有一个庞大的社区。昨晚我见到了帕斯卡尔,还见到了巴塞罗那超级计算中心的团队。

  现在,我们已经接近能够在未来几年内将量子计算(量子经典计算)应用于解决一些有趣问题的领域。这是一个非常令人兴奋的时刻。因此,我们与所有超级计算中心都进行了合作。

  现在非常清楚的是,在未来几年,或者至少在下一代超级计算机中,每一台都将配备一个量子处理单元(QPU),并且QPU将与GPU相连。QPU将用于量子计算,而GPU将用于预处理、控制和纠错,这些任务的计算强度极高。在两种架构之间进行后处理等任务,就像我们加速了CPU一样,现在QPU与GPU协同工作,推动下一代计算的发展。

  今天,我们宣布我们的整个量子算法栈已经在Grace Blackwell 200上加速,其加速效果令人难以置信。我们以多种方式与量子计算行业合作。其中一种方式是使用KU量子来模拟量子比特或模拟运行在这些量子计算机上的算法,本质上是用经典计算机来模拟或仿真量子计算机。在另一个极端,非常重要的是CUDA-Q。基本上是发明了一种新的CUDA,将CUDA扩展到量子经典计算中。因此,在量子计算机到来之前,开发在CUDA-Q上的应用可以以仿真方式运行,而在量子计算机到来之后,可以以协作方式运行,采用量子经典加速计算方法。今天,我们宣布CUDA-Q已可用于Grace Blackwell。这里的生态系统非常丰富,当然,欧洲在科学、超级计算专长以及这一领域的传承方面都底蕴深厚。在未来几年看到量子计算在这里取得进展并不令人意外。我们将迎来一个非常精彩的转折点。总之,对于过去三十年来一直致力于量子计算行业的所有人,我祝贺你们今天取得的惊人成就和里程碑。谢谢。

  让我们来谈谈人工智能。你可能会惊讶于我会和你们谈论人工智能。我刚才提到的那些应用所使用的同一种GPU,也推动了人工智能走向世界。我们首次接触是在2012年。就在那之前,我们与开发人员合作,研究一种名为深度学习的新算法,并促成了2012年AlexNet引发的人工智能大爆炸。在过去大约15年里,人工智能发展得非常迅速。

  第一波人工智能是计算机的感知能力,让计算机能够识别信息并理解它。第二波人工智能,也就是我们过去五六年一直在谈论的,是生成式人工智能。它是多模态的,意味着人工智能能够同时学习图像和语言。因此,你可以用语言提示它,它就能生成图像。人工智能的多模态能力以及其翻译和生成内容的能力推动了生成式人工智能革命。生成式人工智能生成内容的能力对我们提高生产力至关重要。

  我们现在开启了人工智能的新一波浪潮。在过去的几年里,我们看到了人工智能能力的巨大进步。从根本上说,智能是关于理解、感知、推理、规划任务、解决如何解决问题,然后执行任务。感知、推理、规划,这些是智能的基本循环。它使我们能够应用一些以前学到的规则来解决我们从未见过的问题。这就是为什么聪明的人被认为聪明,他们能够将一个复杂的问题分解为逐步解决的步骤,推理如何解决问题,也许去做一些研究,也许去学习一些新信息,寻求帮助,使用工具,逐步解决问题。

  我刚才描述的这些能力,如今通过所谓的代理人工智能(Agentic AI)已经成为可能。我马上会向你们展示其物理实现,也就是代理人工智能的具象化和运动。

  现在,生成能力正在生成运动。它不再是生成视频、图像或文本,而是生成局部运动,比如行走、伸手抓取东西、使用工具的能力。人工智能以物理形式具象化,本质上就是机器人技术。这些能力,即实现信息机器人(代理)和具象化人工智能(物理机器人)的基础技术,如今已经到来。

  这是人工智能令人激动的时代,但一切始于Ge Force,Ge Force带来了计算机图形学。这是我们曾经从事过的第一个加速计算应用,计算机图形学的发展令人难以置信。Ge Force将CUDA带给了世界,这使得机器学习和人工智能研究人员能够推动深度学习的发展。随后,深度学习彻底改变了计算机图形学,使我们能够将计算机图形学提升到一个全新的水平。

  今天我要展示给你们的一切,我要提前给大家剧透一下,但今天我要展示的全部是计算机模拟,而不是动画,是光子模拟、物理模拟、粒子模拟。所有的一切本质上都是模拟,而不是动画,也不是艺术。它看起来非常美,是因为这个世界本身就是美的,数学也是美的。让我们来看看吧。

  这就是数字在发挥作用,这本质上就是模拟的本质。看着它非常令人赏心悦目。但正是由于我们现在能够以如此大规模和高速度模拟几乎所有事物,我们可以将一切转化为数字孪生。因为一切都可以成为数字孪生,所以它可以在进入物理世界之前,完全以可视化的方式进行设计、规划、优化和操作。我们现在正处于这样一个时代:我们将一切构建于软件之中。所有物理实体都将通过数字化构建,所有宏伟的建筑都将通过数字化构建,所有大规模运营的事物都将首先通过数字化构建,并且会有数字孪生进行操作。因此,今天我们将大量讨论数字孪生。

  我们最初从一张Ge Force显卡起步。这里有人知道什么是Ge Force吗?好的。那么,从Ge Force起步的东西现在看起来是这样的。这是新的Ge Force。它重达2吨到2.5吨,由120万个部件组成,价值约300万美元,功率为120千瓦,由150家工厂生产,200家技术合作伙伴与我们合作,研发预算可能高达400亿美元,用于打造GB200,现在正迈向GB300。它已经完全投入生产。

  这台机器被设计成一台“思考机器”,它能够推理,能够规划。它花费大量时间与自己对话,就像你们一样。我们大多数时间都在为自己的大脑生成文字和图像,然后才将其付诸实践。因此,“思考机器”在架构上正是Grace Blackwell的设计目标。它被设计成一个巨大的GPU。我将其与Ge Force进行比较是有原因的。Ge Force是一个GPU,GB200同样是一个GPU。它是一个巨大的虚拟GPU。

  现在,我们需要将其拆分成许多组件,创造许多新的网络技术和服务器技术,开发极其低功耗、高能效的互连技术,将所有这些芯片和系统连接在一起,形成一个虚拟GPU。

  这是霍珀版本。这是举世闻名的霍珀系统。这8个GPU通过MV Link连接在一起。这里没有显示的是一个带有双CPU和系统内存的CPU托盘,它与这些部件共同组成一个节点。这代表着一台人工智能超级计算机的一个节点,大约价值一百万美元。

  这就是霍珀系统。正是这个系统真正让我们在人工智能领域声名鹊起。它曾经很长一段时间都供不应求,因为市场发展得太快了。

  但这就是著名的霍珀系统。整个系统,包括CPU,都被这个Grace Blackwell节点取代了。这就是一个计算托盘。我们将用它来取代整个系统。它是完全液冷的,CPU与GPU直接相连。你可以看到,两个CPU与GPU相连的性能比整个系统还要强大。

  但真正令人惊叹的是这一点。我们想要将许多这样的系统连接在一起。如何将它们连接起来对我们来说曾经是一个难题。于是我们进行了解构。我们把整个主板解构成了这个,这就是具有革命性的MV Link系统。

  扩展计算规模并不难,只要通过以太网连接更多的CPU即可。扩展规模并不难,难的是向上扩展。你只能建造出你能够设计出的最大规模的计算机。将你能放入一个内存模型中的技术与电子元件数量最大化是极其困难的。因此,我们决定创造一种新的互连技术,名为MV Link。它是一种内存语义互连,是一种计算架构,而不是网络。它直接连接到所有这些不同MV Link系统的CPU,也就是计算节点。这是交换机。九个这样的设备放在顶部,九个放在底部。中间是NVLink交换机,而将它们连接在一起的就是这个奇迹。

  这是NVLink主干。这是100%的铜同轴电缆。它直接连接所有的MV Link芯片与所有的GPU,通过整个主干直接相连,使得144个Blackwell芯片(分布在72个不同的封装中)能够同时相互通信,且互不阻塞。这个主干的带宽大约是每秒130万亿字节。132万亿字节,我知道,稍等,等我说完。每秒130万亿字节。如果换算成比特,它比全球互联网峰值流量还要高。是的,这就是如何将互联网“缩小”到一个MV Link中。我们之所以这么做,是因为未来你对计算机的思考方式将从根本上改变。我会花更多时间来解释这一点,但它是为了让Blackwell在性能上远远超越霍珀而设计的。

  还记得摩尔定律吗?半导体物理学只能让你的性能每三到五年提升大约两倍。那么我们如何能在一代产品中实现30到40倍的性能提升呢?我们需要30到40倍的性能提升,因为推理模型正在与自己对话。不再是单次的ChatGPT,现在的推理模型会生成大量更多的标记。当你在思考时,你会逐步分解问题,进行推理,尝试许多不同的路径,也许是思维链,也许是思维树。它会反思自己的答案,你可能见过这些研究模型在反思自己的答案,说:“这是一个好答案吗?你能做得更好吗?”然后它们会说:“哦,我能做得更好。”于是它们会回去再思考。

  这些推理模型实现了令人难以置信的性能,但它们需要更多的计算能力。结果呢?MV Link 72的架构使得Blackwell的性能实现了巨大的飞跃。解读这张图的方式是:X轴表示它思考的速度,Y轴表示工厂的输出能力,即同时支持大量用户的能力。因此,你希望工厂的吞吐量尽可能高,以便支持尽可能多的人,从而使工厂的收入尽可能高。你希望这个轴尽可能大,因为这里的人工智能比这里更聪明。它思考得越快,它在回答你问题之前能思考得越多。这与标记的平均售价(ASP)有关,也与工厂的吞吐量有关。这两者结合在那个角落,就是工厂的收入。基于Blackwell的工厂能够产生更多的收入,这是由于架构的优势。我们为你们制作了一部电影,只是为了让大家感受一下构建Grace Blackwell所投入的巨大工程量,让我们来看看吧。

  Blackwell是一个工程奇迹。它始于一片空白的硅片。经过数百次芯片处理和紫外光刻步骤,2000亿个晶体管逐层构建在一个12英寸的硅片上。硅片被划分为单独的Blackwell芯片,经过测试和分类,将好的芯片筛选出来。芯片在晶圆上封装在基板上的工艺将32个Blackwell芯片和128个HBM堆叠在定制的硅中介层上。金属互连痕迹直接蚀刻进去,将Blackwell GPU和HBM堆叠连接到每个系统和封装单元中,将所有部件固定到位。然后,整个组件经过烘烤、模塑和固化,制造出Blackwell B200超级芯片。每个Blackwell芯片都在125摄氏度的烤箱中进行压力测试,并在数小时内被推向极限。机器人昼夜不停地工作,将超过10000个组件放置在Grace Blackwell PCB上。与此同时,定制的液冷铜块正在准备中,以保持芯片处于最佳温度。

  在另一个工厂,ConnectX-7超级网卡被制造出来,以实现扩展规模的通信,而BlueField-3 DPU则用于卸载和加速网络、存储和安全任务。所有这些部件汇聚在一起,被精心集成到GB中。

  200个计算托盘的NV Link是英伟达发明的一种突破性高速链接,用于连接多个GPU并向上扩展成一个巨大的虚拟GPU。NV Link交换机托盘由NV Link交换芯片构建,提供每秒14.4万亿字节的全互连带宽。MV Link主干形成了一个定制的盲配背板,5000根铜缆将所有72个Blackwell芯片(或144个GPU芯片)连接成一个巨大的GPU,提供每秒130万亿字节的全互连带宽,比全球互联网的峰值流量还要高。来自世界各地的零部件被熟练的技术人员组装成一个机架规模的人工智能超级计算机。

  总计有120万个部件、两英里长的铜缆、130万亿个晶体管,重达近两吨。Blackwell不仅仅是一个技术奇迹,它是全球协作和创新力量的证明,这些力量将推动塑造我们未来的发现和解决方案。无论在哪里,我们都致力于帮助当代的天才们完成他们一生的事业。我们迫不及待地想看到你们带来的突破。

  Grace Blackwell系统已经全面投入生产。这真是一个奇迹。从技术角度来看,这是一个奇迹,但将这些GB200系统组合在一起的供应链也是一个奇迹。每个系统重达两吨,我们现在每周生产1000套。此前从未有人以如此大规模量产超级计算机。每一个机架本质上都是一整的超级计算机。2018年,最大的Volta系统——2018年的Sierra超级计算机的性能还不及这些机架中的任何一个,而那套系统的功耗是10兆瓦,而我们现在这套系统只有100千瓦。

  因此,从2018年到现在,从一代到另一代,我们真正地将超级计算,尤其是人工智能超级计算提升到了一个全新的水平,我们现在以如此巨大的规模生产这些机器,而这只是一个开始。

  事实上,你们看到的只是一个系统——Grace Blackwell。全世界都在谈论这个系统,都在急切地希望它能够部署到全球的数据中心,用于训练、推理和生成式人工智能。

  然而,并非每个人、也并非每个数据中心都能处理这些液冷系统。有些数据中心需要企业级堆栈,需要运行Linux、Red Hat、Newtonics或VMware存储系统,这些系统来自Dell、EMC、Hitachi、NetApp、VAST、WECA等众多不同的供应商。有如此多不同的存储系统和IT系统,而这些系统的管理必须与传统IT系统保持一致。

  我们有如此多的新计算机需要投入生产,我很高兴地告诉你们,所有这些系统现在都已经投入生产。你们可能还没有看到它们,但它们正在从货架上飞速下架,从生产线飞速下线。例如,DGX Spark让你们能够在桌面上拥有Grace Blackwell系统,无论是Spark Desktop还是DGX Station。这样一来,你们在开发软件或开发人工智能时,不需要坐在超级计算机前,但你们又希望架构完全相同。

  从架构角度来看,这些系统是完全相同的。从软件开发者的角度来看,它们看起来完全一样,唯一的区别是规模和速度。而在这一侧则是所有x86系统。全球的IT组织仍然更倾向于x86,并且在能够利用最先进的AI原生系统的地方,他们也会这么做。而在他们无法做到的地方,他们希望将这些系统整合到企业级IT系统中,我们现在为他们提供了这种能力。其中最重要、也最耗费时间去构建的系统是因为软件和架构非常复杂,那就是如何将AI原生架构融入到传统的企业级IT系统中。这是我们全新的RTX Pro服务器,这是一个令人难以置信的系统。主板经过了全新的设计。女士们、先生们,Jenny Paul。

  这块主板看起来很简单,然而在这块主板上,有八个Super Next交换机,它们通过一个200Gbps的最先进的网络芯片连接八个GPU,然后将这八个GPU和这些全新的Blackwell RTX Pro 6000 GPU连接起来。八块这样的GPU组成一台服务器。

  那么它有什么特别之处呢?这台服务器是世界上唯一能够运行人类所编写的一切内容以及人类所开发的所有视频内容的服务器。它运行人工智能、Omniverse RTX用于视频游戏,它运行Windows,运行Linux,运行Kubernetes和VMware。基本上,它能够运行一切。如果你想从计算机将Windows桌面流式传输到远程设备,没问题。如果你想流式传输Omniverse,也没问题。如果你想运行你的机器人堆栈,也没问题。这台机器的QA(质量评估)简直令人惊叹。它运行的应用程序基本上是通用的。人类所开发的一切内容都应该能够在这里运行,包括如果你是一名视频游戏玩家,包括《危机》(Crysis)。如果能够运行《危机》,就能运行任何东西。

  好的,这是RTX Pro服务器,全新的企业级系统。所以,有些事情正在发生变化。我们知道人工智能是一项极其重要的技术。我们现在已经确信,人工智能是一种能够彻底变革、转型每一个行业的软件。它能够做到我们所熟知的那些令人惊叹的事情。我们也知道,处理人工智能的方式从根本上不同于我们以往处理手工编写软件的方式。机器学习软件的开发方式不同,运行方式也不同。系统的架构、软件的架构完全不同。网络的工作方式完全不同。访问存储的方式也完全不同。因此,我们知道这项技术能够做到不同的事情,令人难以置信的事情。它是智能的。我们也知道,它的开发方式从根本上不同,需要新的计算机。

  真正有趣的是,这对我们所有人,对国家、公司、社会到底意味着什么?这是我们在近十年前就做出的一个观察,而现在每个人都开始意识到:事实上,这些人工智能数据中心根本就不是数据中心。它们并不是传统意义上用于存储文件、供你检索的数据中心。这些数据中心并不是用来存储我们的文件的。它们只有一个职责,而且只有一个职责,那就是生产智能标记,生成人工智能。

  这些人工智能工厂看起来像是数据中心,因为它们内部有许多计算机,但这就是唯一相似的地方。它们的设计方式、制造规模、设计和建造方式、使用方式、编排和配置方式、运营方式,以及你对它们的思考方式,都完全不同。

  例如,没有人会把数据中心当作一个创收设施来考虑。我说出这句话时,每个人都会点头说:“是的,你说得对。”没有人会把数据中心当作一个创收设施来考虑,但他们会把工厂、汽车工厂当作创收设施来考虑,并且迫不及待地想再建一个工厂,因为每当你建了一个工厂,收入就会在不久之后增长,因为你能够为更多的人生产更多的东西。

  这些人工智能工厂的理念与之完全相同。它们是创收设施,它们被设计用来制造标记。这些标记可以被重新定义为许多行业的生产力智能。因此,人工智能工厂现在已经成为一个国家基础设施的一部分,这也是为什么你们会看到我到处跑,和各国元首交谈,因为他们都希望拥有人工智能工厂。他们都希望人工智能成为他们基础设施的一部分。他们都希望人工智能成为他们的增长型制造业,这是真正深刻的。

  我认为,正因为如此,我们正在经历一场新的工业革命,因为每一个行业都受到影响。一个新的行业正在诞生,就像电力最初被描述为一种技术、被展示为一种技术时,它被理解为一种技术。但随后我们意识到,它也是一种大型产业。然后是信息产业,我们现在称之为互联网。而这两者,因为它们影响了如此多的行业,都成为了基础设施的一部分。我们现在有了一个新的行业——人工智能行业,它已经成为一种新的基础设施的一部分,这种基础设施被称为智能基础设施。每个国家、每个社会、每个公司都将依赖它。

  从规模上来看,这是一个被广泛讨论的话题。这就是“星际之门”(Stargate)。它看起来不像一个数据中心,而像一个工厂。这是一个1吉瓦的设施,将容纳大约50万个GPU芯片,并产生大量的智能,可供所有人使用。

  欧洲现在已经意识到这些人工智能工厂的重要性,意识到人工智能基础设施的重要性,我很高兴看到这里如此活跃。这是欧洲电信运营商正在建设人工智能基础设施。

  与英伟达合作的,是欧洲云服务提供商,他们正在视频中展示人工智能基础设施的建设。这是欧洲超级计算中心正在建设下一代人工智能超级计算机和基础设施,同样在视频中展示。而这只是一个开始。这只是公共云之外的部分。这是欧洲本土公司为欧洲市场建设的人工智能基础设施。此外,还有20多个正在规划中,20多个人工智能工厂,其中一些是吉瓦级的工厂。总共来说,在短短两年内,我们将使欧洲的人工智能计算能力增加10倍。因此,研究人员、初创企业、你们的人工智能短缺、你们的GPU短缺,很快就会得到解决。它正在向你们走来。

  现在,我们正在与每个国家合作,发展他们的生态系统。因此,我们在七个国家建立了人工智能技术中心。这些人工智能技术中心的目标是:第一,进行合作研究;第二,与初创企业合作;第三,建设生态系统。让我向你们展示一个生态系统是什么样的。在英国,我昨天刚去过那里。生态系统是建立在英伟达架构之上的。例如,正如你们所知,英伟达是唯一在每个云平台上都可用的人工智能架构。它是除了x86之外唯一无处不在的计算架构。我们与每个云服务提供商合作,加速来自全球最重要软件开发商的应用程序,比如欧洲的西门子、Cadence、Red Hat等。

  现在,我们已经重新发明了计算架构。正如你们所知,计算不仅仅是计算机,还包括计算、网络和存储。这三个层次、这三个架构的每一层都已经被重新发明。

  与思科(Cisco)建立了伟大的合作伙伴关系,他们昨天在其会议上宣布了一款基于英伟达的新模型。还有与戴尔(Dell)、NetApp、NVIDIA等的众多伟大合作伙伴关系。正如我之前提到的,软件开发方式已经从根本上发生了变化。它不再仅仅是编写C程序、编译C程序、交付C程序,而是现在变成了DevOps、MLOps、AI Ops。因此,整个生态系统正在被重新发明。我们到处都有生态系统合作伙伴,当然还有解决方案集成商和提供商,他们可以帮助每家公司整合这些能力。

  在英国,我们与一些特殊的公司合作,这些公司非常出色,从研究人员到开发人员,再到合作伙伴,帮助我们提升当地的人才和企业,这些企业消费技术,当然还有云服务提供商。

  我们在英国拥有伟大的合作伙伴。在德国,我们拥有令人难以置信的合作伙伴关系。在意大利,我们拥有伟大的合作伙伴关系。当然,在法国,我们也有令人惊叹的合作伙伴关系。

  法国总统麦康(Mccon)稍后会到这里。我们将讨论一些新的公告,所以我们必须对人工智能表现出一些热情。好的,是的,就是这样。为他展示一些热情。因此,我们在法国拥有伟大的合作伙伴关系。我想特别强调其中一个,我们与施耐德(Schneider)的合作,正在建设这些人工智能工厂。我们现在以数字化方式建设它们,以数字化方式设计它们,以数字化方式运营它们,甚至最终以数字化方式优化它们,并完全在数字孪生中操作它们。这些人工智能工厂非常昂贵,未来可能会花费500亿美元,甚至1000亿美元。如果工厂的利用率没有达到最高水平,对工厂所有者的成本将是巨大的。

  因此,我们需要尽可能多地将它们数字化,并使用人工智能,将所有内容放入Omniverse中,以便我们能够获得直接且持续的遥测数据。

  今天,我们宣布与一家伟大的公司建立合作伙伴关系,这是一家年轻的公司,我非常喜欢它的首席执行官,他正在努力打造一家欧洲人工智能公司。公司的名字叫Miss Straw。今天,我们宣布我们将在这里共同建设一个人工智能云,提供他们的模型,并为其他人工智能初创企业的生态系统提供人工智能应用,以便他们可以将这些模型用作“稻草”模型或他们喜欢的任何模型。因此,Mr. All和我们,我们将合作建设一个相当规模的人工智能云,我们将在稍后与法国总统马克龙(Macron)进一步讨论这个话题。

  人工智能技术的发展速度如同光速。我在这里展示给你们的,左边是专有模型,以光速发展。然而,开放模型也在以光速发展,只是落后了几个月,无论是Miss Straw、Llama、DeepSeek,还是R1、R2,都将在第一季度推出。

  这些模型每一个都非常出色。因此,我们在过去几年中致力于应用世界上最优秀的人工智能研究人员,使这些人工智能模型变得更好。我们称之为Nemo Tron。

  基本上,我们所做的就是,我们获取开源的模型,当然,这些模型都是基于英伟达构建的。我们获取这些开源模型,然后进行后训练。我们可能会进行神经架构搜索,提供更好的数据,使用强化学习技术,增强这些模型,赋予它们推理能力,扩展上下文,以便它们在与你互动之前能够学习和阅读更多内容。

  这些模型大多具有相对较短的上下文,而我们希望拥有巨大的上下文能力,因为我们希望在企业应用中使用它,而我们希望与之进行的对话并不在互联网上,而是在我们自己的公司内部。因此,我们需要加载大量上下文。所有这些能力都被打包成一个可下载的Nemo Tron。你可以访问英伟达的网站,直接下载一个API,一个最先进的AI模型,你可以将其放置在任何你喜欢的地方,我们将极大地改进它。这是Nemo Tron对Llama的改进示例。

  因此,Llama 8B、70B、4O 5B通过我们的后训练能力、推理能力的扩展以及我们提供的所有数据得到了极大的增强。我们将一代又一代地进行这种改进。因此,对于所有使用Nemo Tron的你们来说,你们会知道未来还有一系列其他模型,它们都是开放的。因此,如果你想从开放模型开始,那很好;如果你想从Nemo Tron模型开始,那也很好。Nemo Tron模型的性能非常出色。在一次又一次的基准测试中,Nemo Tron的性能一直位居榜首。因此,现在你们知道,你们可以获取一个经过增强的开放模型,它仍然是开放的,位居排行榜首位,你们知道英伟达致力于此。我会在我的一生中一直致力于此,好吗?

  这个策略如此出色,以至于欧洲各地的区域模型制造商现在已经认识到这一策略的美妙之处,我们正在合作,以适应和增强每一个模型。

  对于区域语言,你们的数据属于你们。它是你们人民的历史、知识和文化的体现。它属于你们。对于许多公司来说,以英伟达为例,我们的数据大多来自33年的积累。

  今天早上我查了一下,西门子有180年的数据,其中一些是写在纸莎草上的。Roland Bush在这里,我想提一下他。我的好朋友。因此,你们必须将这些数据数字化,然后人工智能才能学习。因此,是的,数据属于你们。你们应该使用这些数据,使用像Limiton这样的开放模型以及我们提供的一整套工具,以便你们可以根据自己的需求进行增强。

  我们还宣布,我们与Perplexity建立了伟大的合作伙伴关系,这是一款推理搜索引擎。是的,我使用的三种模型是ChatGPT、Gemini Pro和Perplexity。我交替使用这三种模型。Perplexity非常出色。今天,我们宣布Perplexity将整合这些区域模型,直接接入Perplexity,这样你就可以用你们国家的语言、文化和敏感性来提问并获得答案。因此,Perplexity、区域模型、代理人工智能(Agentic AI)是一个非常重要的领域。

  正如你们所知,最初使用预训练模型时,人们说:“但它会产生幻觉,它会编造东西。”你说得完全正确。它无法访问最新的新闻和数据信息。你说得完全正确。它在解决问题时不会进行推理。就好像每一个答案都必须从过去记忆中提取。你说得完全正确。所有这些关于智能的能力,每个人都可以批评,但你说得完全正确,因为每个人大多都理解智能是如何工作的。然而,这些技术正在世界各地被开发,并且它们正在从检索、增强生成到网络搜索,再到多模态理解等各个领域汇聚在一起,这样你就可以阅读PDF文件,访问网站,查看图像和文字,聆听视频,观看视频,然后将所有这些理解融入到你的上下文中。

  现在,你当然也可以理解几乎任何事物的提示。你甚至可以说:“我要问你一个问题,但从这张图片开始。”或者说:“在你回答问题或执行我要求的任务之前,先从这段文字开始。”然后它会进行推理、规划和自我评估。所有这些能力现在都已经被整合到一起,并且你可以在市场上到处看到它们的出现。

  代理人工智能(Agentic AI)是真实存在的,它是一次巨大的飞跃,是从单次交互式人工智能(one-shot AI)发展而来的。单次交互式人工智能是必要的,它为教导代理如何成为代理奠定了基础。你需要对知识和推理有一些基本的理解,才能具备可被教导的能力。因此,预训练是为了让人工智能具备可教导性,而后训练、强化学习、监督学习、人类演示、上下文提供、生成式人工智能,所有这些都在一起形成了现在的代理人工智能。

  让我们来看一个例子。让我给你们展示一些东西。它是基于Perplexity构建的,非常酷。人工智能代理是数字助手。基于提示,它们会通过推理将问题分解为多步骤计划。它们会使用适当的工具,与其他代理合作,并利用记忆中的上下文来正确执行任务。在英伟达加速系统上,这一切都从一个简单的提示开始。让我们请Perplexity帮助我们在巴黎开一家食品卡车。首先,Perplexity代理会通过推理理解提示并制定计划,然后调用其他代理来帮助完成每个步骤。利用许多工具,市场研究员会阅读评论和报告,发现趋势并分析竞争市场。基于这些研究,概念设计师会探索当地食材,并提出一份完整的菜单,包括准备时间估计,并研究调色板,生成一个品牌形象。然后,财务规划师会使用蒙特卡洛模拟来预测盈利和增长轨迹。运营规划师会制定一个详细的启动时间表,从购买设备到获取正确的许可证,涵盖每一个细节。营销专家会制定一个启动计划,包括社交媒体活动,甚至还会编写一个互动网站,包括地图、菜单和在线订购功能。每个代理的工作最终汇聚成一个完整的提案包,而这一切都始于一个简单的提示。

  像这样的一个提示,在最初的聊天机器人中可能只会生成几百个标记。但现在,通过一个单一的提示输入到代理中来解决问题,它可能已经生成了超过一万倍的标记。这就是为什么我们需要Grace Blackwell的原因。这就是为什么我们需要性能,以及为什么这些系统需要在每一代上都大幅提升性能。

  这就是Perplexity构建他们代理的方式。每家公司都必须构建自己的代理。这非常棒。你会从OpenAI、Gemini、微软的CoPilot、Perplexity和Miss Straw等公司聘请代理。还会有一些为你量身定制的代理,比如帮助你规划假期或进行一些研究等。然而,如果你想建立一家公司,你需要专门的代理,使用专门的工具和专门的技能。所以问题是,你如何构建这些代理?因此,我们为你创建了一个平台。

  我们创建了一个框架和一套工具,以及许多合作伙伴来帮助你完成这件事。它从最底层开始,具备我之前提到的推理模型能力。英伟达的Nemo Tron推理模型是世界级的。我们还有Nemo Retriever,这是一个多模态搜索引擎,一个语义搜索引擎,非常出色。我们构建了一个蓝图,一个可操作的演示,本质上是一个通用代理。我们称它为IQ,AIQ。在它的上面,我们有一套工具,允许你将一个通用代理引入进来,整理数据来教导它,评估它,设置防护栏,监督它,训练它,使用强化学习一直到部署,保持它的安全性和可靠性。这一整套工具包被集成到AI Ops生态系统中。

  你也可以从我们的网站上自行下载,但它主要被集成到AI Ops生态系统中。从这里,你可以创建自己的专属代理。许多公司正在这样做,思科(Cisco)就是其中之一。他们昨天宣布了这一消息。我们正在一起构建用于安全的人工智能平台。现在看看这个,人工智能代理并不是一个模型就能完成所有这些令人惊叹的事情。它是一个集合,一个系统,一个由大型语言模型组成的人工智能系统。其中一些模型针对某些特定的事情进行了优化,比如检索,正如我提到的,使用计算机执行技能。你不想把所有这些东西都打包到一个巨大的、庞大的人工智能中,而是将它们分解成小的部分,然后随着时间的推移逐步部署CICD。这是思科的一个例子。

  现在的问题是,你如何部署这些?因为正如我之前提到的,有公共云,英伟达的计算能力就在那里。还有我们称之为NCPs的区域云,例如Mistral。你可能因为安全需求和数据隐私需求而拥有一个私有云,甚至你可能决定在你的桌面上运行某些东西。所以问题是,你如何运行所有这些?有时它们会在不同的地方运行,因为这些都是微服务。这些是可以相互交流的人工智能,它们显然可以通过网络进行通信。那么,你如何部署所有这些微服务呢?现在,我们有一个很棒的系统。我很高兴在这里宣布它。它被称为我们的DGX Lepton。

  DGX Lepton。你在这里看到的是许多不同的云。这里是Lambda云,AWS云,这里是你的开发者机器。你的系统可能是DGX Station,DBS,Yoda,也可能是AWS、GCP和视频。架构无处不在。你可以决定在哪里运行你的模型,使用一个超级云进行部署,所以它是一个云的云。一旦你让它工作,一旦你将这些Nemo模型部署到Lepton中,它就会被托管并运行在你选择的各种云上。一个模型架构,一种部署方式,你可以让它在任何地方运行。你甚至可以在这个小小的机器上运行它,你知道,这个DGX Spark。它是一个AI超级计算机。我们在2016年构建了一个AI超级计算机,它被称为DGX1。它是我刚才提到的所有内容的第一个版本。八个Volta GPU通过MV Link连接。

  我们花了数十亿美元来构建它。在我们宣布DGX1的那一天,没有客户,没有兴趣,没有掌声,只有100%的困惑。为什么有人会构建这样一台计算机?它能运行Windows吗?不能。但我们还是把它建成了。

  感谢天,一家年轻的公司,一家位于旧金山的初创公司,一个非营利性初创公司,看到这台计算机后非常高兴,他们说:“我们可以买一台吗?”我想:“哦,我的天哪,我们终于卖出了一台。”但随后我发现他们是一家非营利机构。我把DGX1放在我的车里,然后开车去了旧金山。那家公司的名字叫OpenAI。

  我不知道人生的教训是什么。有很多非营利机构,你知道,所以下次……但也许教训是:如果一个开发者向你求助,需要一个GPU,答案就是“是”。所以,想象一下,你有Lepton,它在你的浏览器中,你有一个Helm图表,一个你开发的人工智能代理,你希望在这里运行它,部分在AWS运行,部分在某个区域云运行,你使用Lepton部署你的Helm图表,它就会神奇地出现在这里。好的。所以如果你想在这里运行它,直到你完成并且准备好部署它,然后将其部署到云端。很好。但最美好的是,这个架构基于Grace Blackwell,GB10与GB200、GB2300以及所有这些不同版本,但这个架构正是Grace Blackwell。

  现在这太神奇了。我们正在为Hugging Face做这件事。英伟达已经将Lepton连接起来。因此,无论你何时在Hugging Face上训练模型,如果你想将其部署到Lepton并直接进入Spark,完全没有问题。只需点击一下即可。无论是训练还是推理,我们现在都与Hugging Face连接,Lepton将帮助你决定在哪里部署它。让我们来看看。

  开发者需要随时随地轻松可靠地访问能够跟上他们工作进度的计算资源。DGX Cloud Lepton提供了按需访问全球GPU网络的能力,这些GPU跨越云平台、地区以及像Yoda和Nebias这样的合作伙伴。多云GPU集群通过单一统一界面进行管理。配置速度非常快。开发者可以快速扩展节点数量,无需复杂设置,并立即开始使用预集成工具和训练就绪的基础设施进行训练。进度可以实时监控,GPU性能、收敛情况和吞吐量尽在指尖。你可以在控制台内直接测试和微调模型。DGX Cloud Lepton可以在多个云或地区部署Nemo模型端点或你的模型,实现快速分布式推理。就像拼车应用将乘客与司机连接起来一样,DGX Cloud Lepton将开发者与GPU计算连接起来,为虚拟全球人工智能工厂提供动力。这就是思科(Cisco)的方式。SAP也在以这种方式构建人工智能平台。

  在英伟达,Sana正在构建基于英伟达的人工智能业务应用自动化。DeepL正在构建其语言框架和平台,基于英伟达人工智能。Photogram是一个视频编辑和人工智能编辑平台,正在基于英伟达构建他们的平台。这是一个曾经被称为Codium的平台,一个基于英伟达构建的令人难以置信的编码代理。这是一个名为Iola的语音平台,基于英伟达构建。这是一个临床试验平台,全球最大的临床试验自动化平台,也是基于英伟达构建的。所有这些基本上都是基于同一个理念:将它们封装在一个虚拟容器中,可以在任何地方部署。无论是Nemo Tron大型语言模型,还是其他大型语言模型,比如Miss Trawl或其他模型,我们都会整合涵盖人工智能代理整个生命周期的库。你对待人工智能代理的方式有点像对待数字员工。因此,你的IT部门需要将其引入、微调、训练、评估、设置防护栏,确保它们的安全,并持续改进它们。整个框架平台被称为Nemo,所有这些现在正在被整合到全球的一个又一个应用框架中。这只是一个例子。

  现在,我们让你可以将它们部署在任何地方。如果你想在云端部署,你可以选择DGX或云中的GB200。如果你想在本地部署,因为你有VMware、Red Hat Linux或Nutanix,并且已经在本地虚拟机中部署,你也可以做到。如果你想将其部署为私有云,你也可以做到。你甚至可以将其部署在你的DGX Spark或DGX Station上,完全没有问题。Lepton将帮助你完成所有这些。

  让我们来谈谈工业人工智能。这是我最喜欢的时刻之一。这是Roland Bush。他刚刚提醒我,神经计算机,神经网络计算机是在欧洲发明的。这就是整个幻灯片的内容。但我觉得这是一个非常有趣的时刻。这是突触1号(Synapse 1),这太不可思议了,伙计们。

  突触1号,1992年。它的运行速度比当时的CPU快8000倍。这难道不令人难以置信吗?所以这是世界上的人工智能计算机。Roland只是想让我永远记住这一点。永远永远不要忘记我说过的话,好的,我明白了,我会告诉每个人。

  1992年,西门子。我们与西门子有着伟大的合作伙伴关系,西门子的首席执行官Roland Bush正在为公司注入强大动力,以便他们能够完全跨越上一次工业革命,并将欧洲的工业能力与人工智能融合,创造所谓的工业人工智能革命。我们在许多不同领域与西门子合作,从设计到模拟,到工厂的数字孪生,再到工厂中人工智能的运营,从端到端的整个过程。

  这让我想起欧洲的工业能力是多么令人难以置信,以及这是一个多么非凡的机遇。这是一个非凡的机遇,因为人工智能与软件不同。人工智能是一种非常智能的软件,这种智能软件终于能够做一些事情,彻底改变你们所服务的行业。因此,我们制作了一段“情书”视频。让我们来播放它。

  这一切都始于这里,第一次工业革命,瓦特蒸汽机和机械化织布机。它们引入了自动化和工厂的诞生,一个行业就此诞生。电力时代,安培揭示了电磁学。法拉第建造了第一台发电机,麦克斯韦奠定了现代电气工程的基础。西门子和惠斯通,发电机。电力的引擎。它让机器、火车、工厂和城市焕发生机。它让整个星球通电,点燃了现代制造业。而今天,从计算和信息时代诞生的第四次工业革命,人工智能时代,正在重新构想整个大陆的每一个工业领域。工业人工智能正在从设计到工程的各个领域扎根。你们正在开辟新的道路,朝着理解和重新发明的方向前进。你们将物理世界带入虚拟世界,以规划和优化全球的现代工厂。

  你们正在构建下一个前沿领域,那里的一切运动都是机器人化的,每一辆汽车都是一个智能自主代理,一个新的协作劳动力正在帮助填补全球劳动力短缺的缺口。整个大陆的开发者正在构建各种类型的机器人,在数字孪生世界和机器人环境中教导它们新技能,让它们准备好与我们在工厂、仓库、手术室和家中并肩工作。第四次工业革命已经到来,它就始于第一次工业革命的地方。你觉得怎么样?

  我太喜欢这个视频了。是你制作的,太棒了。我们正在与一家又一家公司合作,开展工业人工智能项目。这是宝马(BMW)正在Omniverse中构建其下一代工厂。我不知道该怎么说,有人能教我吗?“BU Jess”听起来不错。没错,完全正确。干得好,完全正确。

  他们当然正在Omniverse中构建工厂的数字孪生。这是他们用于仓库物流的数字孪生的关键部分。这是梅赛德斯-奔驰(Mercedes-Benz)及其在Omniverse中构建的工厂的数字孪生。这是舍弗勒(Schaeffler)及其在Omniverse中构建的仓库的数字孪生。这是法国的火车站,正在Omniverse中构建火车站的数字孪生。这是丰田(Toyota)正在Omniverse中构建其仓库的数字孪生。当你们在Omniverse中构建这些仓库和工厂时,你们可以进行设计,可以进行规划,可以在绿地(Greenfield)上进行设计,也可以在棕地(Brownfield)上进行改造。你们可以在实际移动物体之前,通过模拟来验证其效率是否最优。因此,能够在数字孪生中完成所有这些数字化工作是非常令人难以置信的。

  但问题是,为什么数字孪生必须看起来像照片一样逼真,为什么它必须遵循物理定律?原因在于,我们希望它最终成为一个真正的数字孪生,机器人可以在其中学习如何作为机器人操作,而机器人依赖光子作为其感知系统。这些光子是通过Omniverse生成的。机器人需要与物理世界互动,以便知道自己是否在做正确的事情,并学会如何正确地完成任务。因此,这些数字孪生必须看起来逼真,并且行为符合现实。这就是为什么Omniverse被构建的原因。这是一个聚变反应堆的数字孪生,非常复杂的仪器,正如你们所知。如果没有人工智能,下一代聚变反应堆是不可能实现的。

  今天,我们宣布我们将在欧洲建立世界上第一个工业人工智能云。我要指出,是的,这些工业人工智能云是云中的许多计算机。然而,它们的要求、性能和安全要求根本不同。因此,我将在周五告诉你们更多关于它的内容。

  今天我只向你们透露了部分故事,但这个工业云将用于设计和模拟。虚拟风洞,你可以直接走进去,将汽车移入其中,看到它的行为。打开车门,打开车窗,改变设计。所有这些都在完全实时中完成。实时设计,在数字风洞中进行模拟,数字风洞的数字孪生也在实时中完成,在工厂中构建,数字工厂的数字孪生也在实时中完成。所有这些都将让机器人学会成为出色的机器人,并构建我们未来的机器人,比如自动驾驶汽车等。我们在这里已经拥有一个庞大的生态系统。正如你们所知,我们在这里已经很长时间了。英伟达已经33岁了。

  我们第一次来到欧洲是在工作站和产品数字化、CAD革命开始的时候。我们当时正在参与CAE革命,而现在是数字孪生革命。欧洲有大约2万亿美元的生态系统,我们与之合作,并且我们有幸支持从中诞生的新革命。正如你们所知,所有运动的物体都将实现机器人化,所有运动的物体都将由人工智能驱动。汽车是最明显的例子。

  接下来,英伟达构建用于训练模型的人工智能超级计算机,用于Omniverse数字孪生的人工智能超级计算机。我们还为机器人本身构建人工智能超级计算机。在每一种情况下,无论是用于云中的Omniverse还是用于汽车,我们提供了整个堆栈,计算机本身,以及运行在计算机之上的操作系统,在每一种情况下都是不同的。这台计算机必须具备高速、传感器丰富、功能安全的特性,它在任何情况下都不能完全失败。因此,安全要求极高。

  现在,我们拥有一个令人难以置信的模型,它就运行在这个系统之上。这个模型是一个基于Transformer的推理模型。它接收传感器输入,你告诉它你想要它做什么,它就会带你到达那里。它接收像素输入,并生成路径规划输出。因此,这是一个基于Transformer的生成式人工智能模型,非常了不起的技术。英伟达的人工智能团队、自动驾驶团队非常出色。据我所知,他们是唯一一个连续两年在CVPR上赢得端到端自动驾驶汽车挑战赛的团队。所以,他们今年再次成为赢家。让我们看看这个视频。好的,谢谢。

  像任何驾驶员一样,自动驾驶汽车运行在一个充满不可预测和潜在安全关键场景的世界中。英伟达Drive基于Halo安全系统,让开发者能够构建安全的自动驾驶汽车,配备多样化的软件堆栈和传感器以及冗余计算机。它从训练开始。安全的自动驾驶汽车需要大量的多样化数据,以应对边缘情况,但现实世界中的数据是有限的。开发者使用英伟达Omniverse和Cosmos重建现实世界,并生成逼真的合成训练数据,为自动驾驶汽车模型带来多样性。该模型可以感知和推理其环境,预测未来结果,并生成运动规划。为了决策多样性,一个独立的经典堆栈并行运行。防护栏监控安全性能,在出现异常时,调用仲裁器进行紧急制动。传感器和计算架构中进一步融入了多样性和冗余性。每个传感器都连接到冗余计算机,因此即使传感器或计算机出现故障,车辆仍然安全且可操作。在发生严重故障时,系统可以执行最小风险操作,比如靠边停车。安全是自动驾驶的核心,英伟达Drive让全球开发者能够将Halo整合到他们自己的产品中,以构建下一代安全的自动驾驶汽车。

  全球有10亿辆汽车在道路上行驶,每年平均行驶1万英里,总共10万亿英里。自动驾驶的未来显然是巨大的,它将由人工智能驱动。这是下一个巨大的机会,我们正在与全球一些非常出色的大型公司合作,以实现这一目标。

  在我们与自动驾驶汽车(AV)相关的所有工作中,核心是安全,我们为我们的Halo系统感到非常自豪。它从芯片架构开始,然后是芯片设计、系统设计、操作系统、人工智能模型、开发软件的方法论、我们测试它的方式,从我们训练模型的方式、为模型提供的数据,一直到我们评估模型的方式,英伟达的Halo系统以及我们的自动驾驶安全团队和能力绝对是世界闻名的。

  这台计算机是第一台软件定义的计算机。世界上第一全100%软件定义的、由人工智能驱动的自动驾驶汽车软件堆栈。我们已经在这个领域耕耘了将近10年。因此,这一能力是世界闻名的,我为此感到非常自豪。

  汽车领域正在发生的事情,也在一个新的行业中发生,正如我之前提到的。如果可以从提示生成视频,如果人工智能可以感知、推理,并且能够生成视频、文字和图像,那么它为什么不能像汽车中的路径规划和方向盘路径一样,生成局部运动能力和关节运动能力呢?因此,人工智能彻底变革最复杂的机器人问题之一的能力即将到来。

  人形机器人将成为现实。我们现在知道如何构建、训练和操作这些机器人。人形机器人可能会成为有史以来最大的行业之一,它需要那些懂得如何制造具有非凡能力产品的公司。这与欧洲国家息息相关。世界上许多行业都扎根于此。我认为这是一个巨大的机会。假设全球有10亿台机器人,那么拥有10亿台机器人的想法是非常合理的。

  那么,为什么它还没有发生呢?原因很简单。如今的机器人太难编程了。只有最大的公司才能负担得起安装机器人、教它们做正确的事情、确保它们足够安全的费用。这就是为什么世界上最大的汽车公司都有机器人的原因。它们足够大,工作足够重复,行业规模也足够大,可以在工厂中部署机器人。对于中型、小型企业或夫妻店餐厅、商店或仓库来说,这种编程能力几乎是不可能的,直到现在。我们将为你提供可以“教”的机器人,它们会从你那里学习。正如我们刚才提到的代理人工智能一样,我们现在拥有人形人工智能,它可以通过与我提到的Nemo工具包非常一致的工具包从你的教学中学习。

  英伟达也构建了一个三层堆栈。我们构建了计算机,Thor计算机开发工具包看起来有点像这样。这是一台机器人计算机,一个完全自包含的开发工具包,放在你的桌子上。这些是所有的传感器,里面是一个小型超级计算机芯片。这真的很令人难以置信。这些……是的,我可以想象像这样插入一个。好的,谢谢,珍妮。这就是Thor处理器。在其之上是一个为机器人设计的操作系统,而在操作系统之上则是Transformer模型,它接收传感器输入和指令,将其转换为飞行路径或手臂、手指和腿部关节运动的电机控制信号。

  然而,人形机器人面临的巨大挑战是,训练它们所需的大量数据很难获取。那么,如何解决这个问题呢?解决这个问题的方法是回到Omniverse,一个遵循物理定律的数字孪生世界。我们正在做的这项工作令人难以置信。

  好吧。这些是我们开发的机器人,我们开发计算机来模拟它们、训练它们,以及放入它们内部的计算机。全球有许多人形机器人公司正在成立,它们都看到了彻底变革这一新设备的巨大机会。进展非常迅速。它们学习的方式是在虚拟世界中学习,而这个虚拟世界必须遵循物理定律。

  最近,我们宣布与迪士尼研究公司(Disney Research)和DeepMind建立重大合作伙伴关系,我们将共同创建世界上最复杂、最逼真的物理模拟。我正在试图弄清楚现在如何切换到那张幻灯片。教教我,谁和我在一起?这就是只排练一次的结果。好的,这个令人难以置信的系统是人工智能学习成为人工智能的地方。让我展示给你看。为你推出来。

  你的名字叫格雷格(Greg)。你是小加尔森(Garson)还是小比尔(Bill)?好的,他是一个小女孩。现在看看这个。格雷格在Omniverse中学会了走路,遵循物理定律。我说的“在Omniverse中”,是指我们创造了数十万种场景。最后,当格雷格学会了在这些环境中操作、行走和操纵物体时,无论是在沙子上、碎石上、滑溜的地板上、混凝土上还是地毯上,当格雷格进入物理世界时,物理世界只是虚拟世界的第100,001个版本。因此,你在虚拟世界中学会了走路,看看你现在。你能跳吗?哇,太棒了,太棒了,太棒了。你能跳舞吗?

  我想让大家知道,我是主题演讲者,所以我需要你。我需要你安静几秒钟。我需要你表现得乖一点。困惑吗?你能坐下吗?嘿,你知道我们该做什么吗?让我们给每个人拍张照片。砰,砰。是的,是的,是的。你想和我一起回家吗?你想和我一起回家吗?我有……是的,我知道,亲爱的。是的,我有宠物。它们会很高兴让你成为它们的宠物。不,你太聪明了。你太聪明了。这太不可思议了,对吧?

  你是世界上最棒的机器人。总有一天,我们每个人都会有一个像你这样的机器人,它们会在2020年围绕着我们转。但如果我需要一杯威士忌,你得去告诉别人帮我拿一杯威士忌,因为你没有胳膊。我?是的,你太可爱了。好吧,小女孩,你先待在这儿。我们来总结一下。

  好吧,这很清楚。一场工业革命已经开始。人工智能的下一个阶段已经开始。格雷格是现在机器人技术可能性的完美例子。教机器人操作、模拟以及当然,创造令人难以置信的机器人的技术,现在就在我们面前。我们有人形机器人,也有信息机器人,我们称它们为代理。因此,人工智能的下一波浪潮已经开始。它将需要推理工作负载呈爆炸式增长,基本上会呈指数级增长。使用推理的人数从800万增加到8亿,仅用了几年时间,增长了100倍。生成的提示和标记数量,正如我之前提到的,从几百个标记增加到数千个标记。当然,我们今天比以往任何时候都更多地使用人工智能。因此,我们需要一种专门用于思考、专门用于推理的计算机设计。而这就是Blackwell,一台思考机器。这些Blackwell将进入一种新型数据中心,本质上是专门用于生产标记的人工智能工厂。而这些标记将成为你的“智能积木”。

  是的,我知道。让我非常高兴的是,欧洲正在全力投入人工智能。未来几年,这里建设的人工智能基础设施将增加一个数量级。

  我想感谢你们所有人与我们合作。祝你们在Viva Tech有一个美好的体验。谢谢。说再见。再见。多拍几张照片。多拍几张照片。