技术动态 > 正文
NVIDIA(英伟达)CEO发布
Hopper架构、H100 GPU、全新超级计算机和软件
2022/3/24 14:36   NVIDIA英伟达      关键字:NVIDIA 架构 GPU 计算机 软件      浏览量:
NVIDIA GTC 大幕拉开:黄仁勋揭晓 AI 领域的卓越进展,并阐述 AI 和 Omniverse 如何将现实世界和虚拟世界相融合,同时分享了一个时代愿景,即以工业规模创造智能,并将其融入真实和虚拟世界。这将革新价值万亿美元的行业,并有望解决“我们这个时代的重大挑战”。
  NVIDIAGTC大幕拉开:黄仁勋揭晓AI领域的卓越进展,并阐述AI和Omniverse如何将现实世界和虚拟世界相融合。
  NVIDIA创始人兼首席执行官黄仁勋分享了一个时代愿景,即以工业规模创造智能,并将其融入真实和虚拟世界。这将革新价值万亿美元的行业,并有望解决“我们这个时代的重大挑战”。
  在NVIDIAGTC大会主题演讲中,黄仁勋介绍了多款全新芯片,包括HopperGPU架构和H100GPU、AI和加速计算软件以及强大的数据中心级系统。
  “企业正在处理、完善他们的数据,构建AI软件,并逐渐成为智能制造商,”身处一个NVIDIAOmniverse实时3D协作和模拟平台上打造的虚拟环境中,黄仁勋描述了AI如何在各个领域“全面开花”。
  Omniverse将汇聚所有这些进步,加快人与AI之间的协作、更好地塑造和理解真实世界并成为新型机器人的试验场,推动“下一波AI”的发展浪潮。
  黄仁勋在这一全球最重要的AI大会上与领先的开发者、科学家和研究者们分享了他的愿景。
  本届大会吸引了1600多名演讲者以及超过20万名注册参会者。演讲者来自美国运通、DoorDash、领英、Pinterest、Salesforce、ServiceNow、Snap和Visa等公司。
  黄仁勋的主题演讲以NVIDIA全新园区的壮观航拍拉开序幕。整个园区,包括热闹的先进机器人项目实验室,都是在Omniverse中渲染而成。
  他分享了如何与广泛的生态系统合作来推进医疗和药物研发的进程,从而拯救生命,甚至帮助拯救我们的地球。
  黄仁勋表示:“科学家们预测,要想有效地模拟区域气候变化,需要比现在强大十亿倍的超级计算机。”
  “NVIDIA将通过我们的Earth-2(全球第一台AI数字孪生超级计算机)来应对这一巨大挑战,并发明新的AI和计算技术,加速实现十亿倍的性能飞跃。”
  全新芯片NVIDIAH100:“全球AI基础架构的新引擎”
  为了推动这些宏伟目标的实现,黄仁勋介绍了“全球AI基础架构的新引擎”,即基于Hopper架构的NVIDIAH100。
  他表示,语音、对话、客服和推荐系统等AI应用正在推动数据中心设计领域的巨大变革。
  “AI数据中心需要处理海量且持续的数据,以训练和完善AI模型,原始数据进来,经过提炼,然后智能输出——企业正在制造智能并运营大型AI工厂。”
  黄仁勋解释说,这些工厂全天候密集运行,即便是质量上的小幅改进也能大幅增加客户参与和企业利润。
  H100将帮助这些工厂更快发展。这个“庞大”的800亿晶体管芯片采用了台积电的4纳米工艺制造而成。
  “HopperH100是有史以来最大的一次性能飞跃——其大规模训练性能是A100的9倍,大型语言模型推理吞吐量是A100的30倍。”
  Hopper实现了许多技术突破,包括一个新的TransformerEngine,可以在不损失准确性的前提下将这些网络的速度提高6倍。
  “Transformer模型训练时间从数周缩短至数天。”
  黄仁勋宣布H100已投入生产,并将在第三季度上市。
  黄仁勋还发布了GraceCPU超级芯片,这是NVIDIA首款用于高性能计算的离散数据中心CPU。
  这款超级芯片由两个CPU芯片组成,并通过每秒900GB的NVLink芯片互连技术连接成一个144核CPU,具有每秒1太字节内存带宽。
  “Grace是全球AI基础架构的理想CPU。”
  黄仁勋还宣布推出基于HopperGPU的全新AI超级计算机—DGXH100、H100DGXPOD和DGXSuperPOD。
  NVIDIA的全新NVLink高速互连技术将被应用于所有未来的NVIDIA芯片,包括CPU、GPU、DPU和系统级芯片。
  他还宣布,NVIDIA将向客户和合作伙伴提供NVLink,帮助其构建配套芯片。
  “NVLink使客户能够通过新的方式构建利用NVIDIA平台和生态系统的半定制化芯片和系统。”
  全新软件——AI已“从根本上改变了”软件
  黄仁勋称,得益于加速计算,AI领域出现了“惊人的进展”。
  “AI已从根本上改变了软件功能以及创造软件的方式。”
  黄仁勋解释说,Transformers已经实现了自我监督学习,并且无需人类标记数据。因此,Transformers正在越来越多的领域中发挥作用。
  “Transformers实现了自我监督学习,AI的速度也得到了大幅提升。”
  黄仁勋表示,Transformers所带来的突破包括用于语言理解的GoogleBERT、用于药物研发的NVIDIAMegaMolBART以及DeepMindAlphaFold2。
  他介绍了用于自然语言理解、物理、创意设计、角色动画甚至是NVCell芯片布局的全新深度学习模型。
  “AI正在各个领域‘全面开花’,包括新的架构、新的学习策略、规模更大、性能更强的模型、新的科学领域、新的应用、新的行业等,而且所有这些领域都在发展。”
  黄仁勋表示,NVIDIA全力投入于加速AI领域的新突破以及AI和机器学习在每个行业的应用。
  NVIDIAAI平台正在取得重大更新,包括Triton推理服务器、用于训练大型语言模型的NeMoMegatron0.9框架以及用于音频和视频质量增强的Maxine框架。
  该平台包含一套由NVIDIA优化和认证的端到端、云原生AI和数据分析工具与框架NVIDIAAIEnterprise2.0,并且现在支持所有主要的数据中心和云平台。
  “我们在这次GTC上更新了60个SDK。300万名开发者、科学家和AI研究者以及数万家初创企业会发现,自己的NVIDIA系统变得更快了。”
  现在,一些全球大型企业都在依赖NVIDIAAI软件和加速计算SDK。
  (1)MicrosoftTranslator使用NVIDIATriton支持的实时翻译功能加速全球沟通。
  (2)AT&T使用NVIDIARAPIDS软件加速其数据科学团队的工作,这款软件可以让数万亿条记录的处理变得更加轻松。
  “NVIDIASDK服务于医疗、能源、交通、零售、金融、媒体和娱乐等行业,总价值达到100万亿美元。”
  “新一轮进化”:虚拟世界的Omniverse
  半个世纪前,阿波罗13号登月任务遇到了麻烦。为了拯救船员,NASA的工程师们在地球上创建了一个船员舱模型来“解决这个问题”。
  黄仁勋表示:“在扩展到巨大的规模后,数字孪生就能成为一个与物理世界相连的虚拟世界。这代表着互联网的新一轮进化。”
  用于构建数字孪生的NVIDIAOmniverse软件,以及全新数据中心级NVIDIAOVX系统,将成为“以行动为导向的AI”的组成部分。
  “Omniverse是我们机器人平台的核心。像NASA和亚马逊一样,我们和机器人以及工业自动化领域的客户都意识到了数字孪生和Omniverse的重要性。”
  黄仁勋解释说,OVX将使用Omniverse数字孪生进行大规模模拟,使多个自主系统在同一时空运行。
  OVX的骨干是其网络编织架构,为此他发布了NVIDIASpectrum-4高性能数据基础架构平台。
  全球首个400Gbps端到端网络平台NVIDIASpectrum-4由Spectrum-4交换机系列、NVIDIAConnectX-7SmartNIC、NVIDIABlueField-3DPU和NVIDIADOCA数据中心基础设施软件组成。
  为了让更多的用户能够使用Omniverse,黄仁勋发布了OmniverseCloud。现在只需简单的点击操作,协作者就可以通过云端Omniverse进行连接。
  为了演示该功能,黄仁勋展示了四名设计师(其中一名是AI)如何合作创建一个虚拟世界。
  他还展示了亚马逊如何使用OmniverseEnterprise“来设计和优化其无与伦比的订单履行中心。”
  “现代化订单履行中心正在变成一座由人类和机器人共同运作的设施,堪称技术奇迹。”
  “新一轮AI浪潮”:机器人和自动驾驶汽车
  黄仁勋表示,新的芯片、软件和模拟功能将掀起“新一轮AI浪潮”,即能够“设计、计划和行动”的机器人。
  黄仁勋解释说,NVIDIAAvatar、DRIVE、Metropolis、Isaac和Holoscan是围绕“四大支柱”构建的端到端全栈机器人平台。“四大支柱”指的是真实数据生成、AI模型训练、机器人堆栈和Omniverse数字孪生。
  黄仁勋表示,NVIDIADRIVE自动驾驶汽车系统本质上是一个“AI司机”。
  Hyperion8可以通过360度摄像头、雷达、激光雷达和超声波传感器套件实现全自动驾驶。它是NVIDIA自动驾驶汽车的硬件架构,NVIDIADRIVE在此基础上打造而成。
  Hyperion8将从2024年开始应用于梅赛德斯-奔驰汽车上,并于2025年应用于捷豹路虎汽车上。
  黄仁勋宣布,作为新一代电动汽车、自动驾驶出租测、班车和卡车引擎的集中式自动驾驶和AI计算机,NVIDIAOrin将在本月开始出货。
  黄仁勋还宣布了Hyperion9,该架构内置即将推出的DRIVEAtlan系统级芯片,是当前基于DRIVEOrin架构性能的两倍。Hyperion9将于2026年开始出货。
  全球第二大电动汽车制造商比亚迪将从2023年上半年起开始生产基于DRIVEOrin计算机的汽车。
  LucidMotors透露,其DreamDrivePro高级驾驶辅助系统基于NVIDIADRIVE构建。
  总体而言,NVIDIA未来六年在汽车业务的研发生产投入已增加至110亿美元以上。
  ClaraHoloscan将DRIVE中使用的大部分实时计算力用于支持医疗仪器和实时传感器,如射频超声波、4K手术视频、高通量摄像头和激光器等。
  黄仁勋演示了Holoscan如何加速来自光片显微镜的图像,并创造出一部关于细胞运动和分裂的“电影”。
  一般情况下,需要一整天时间才能处理完这些仪器一小时内产生的3TB数据。
  但在加州大学伯克利分校的高级生物影像中心,使用Holoscan的研究人员能够实时处理这些数据,实现了显微镜在实验进行过程中的自动对焦。
  Holoscan开发平台现已向客户开放早期使用权限,并将于5月全面上线,在2023年第一季度达到医疗级使用标准。
  NVIDIA正在与数千名客户和开发者合作,帮助他们建造用于制造、零售、医疗、农业、建筑、机场和整座城市的机器人。
  黄仁勋解释说,NVIDIA的机器人平台由Metropolis和Isaac组成。Metropolis是一个能够追踪移动物体的固定机器人,而Isaac是一个专为移动物体开发的平台。
  为了帮助机器人在工厂、仓库等室内空间中找到路线,NVIDIA发布了IsaacNovaOrin。这个先进的计算和传感器参考平台建立在JetsonAGXOrin上,能够加速自主式移动机器人的开发和部署。
  在一段演示中,黄仁勋展示了百事可乐如何结合使用Metropolis和Omniverse数字孪生。
  四个层面与五个趋势
  所有技术、产品发布和演示,都将助力NVIDIA推动新一代计算的发展。
  黄仁勋解释说,NVIDIA发布了覆盖其所有四层堆栈的新产品,包括硬件,系统软件和库,软件平台NVIDIAHPC、NVIDIAAI和NVIDIAOmniverse以及AI和机器人应用框架。
  黄仁勋还提出了影响行业发展的五个趋势:million-X百万倍计算速度飞跃,大幅加快AI速度的Transformers,成为AI工厂的数据中心,对机器人系统的需求呈指数级增长以及下一个AI时代的数字孪生。
  黄仁勋在演讲的最后总结道:“我们将在未来十年以数据中心规模加速整个堆栈,再次实现million-X百万倍性能飞跃。我已经迫不及待地想看到下一次百万倍性能飞跃将带来什么。”
  在主题演讲的结尾,黄仁勋表示“大家今天所看到的每一个渲染和模拟”均由Omniverse生成,随后他介绍了一段由NVIDIA创作团队制作的精彩视频,带着观众“最后再游览一次Omniverse”,来到NVIDIA园区中央欣赏一段迷人的爵士乐,而以黄仁勋为原型制作的数字形象ToyJensen也出现在这个虚拟世界中。

微信扫描二维码,关注公众号。