据悉Gaudi2的主要特点是提供更快的训练速度,延续上一代Gaudi的架构,工艺制程从16nm提升至7nm,由台积电制造,Tensor处理器内核数量增加到 24 个,拥有高达96GB HBM2e的封装内存,板载SRAM增加至48MB。缩小到7nm的部分原因是芯片获得了更多的计算单元和内容,并采用行业标准的OAM外形。
5月10日晚间,在英特尔On产业创新峰会上,英特尔发布了一款专注于人工智能(AI)计算的芯片——Gaudi2。
据悉Gaudi2的主要特点是提供更快的训练速度,延续上一代Gaudi的架构,工艺制程从16nm提升至7nm,由台积电制造,Tensor处理器内核数量增加到 24 个,拥有高达96GB HBM2e的封装内存,板载SRAM增加至48MB。缩小到7nm的部分原因是芯片获得了更多的计算单元和内容,并采用行业标准的OAM外形。
Habana实验室首席运营官Eitan Medina表示。该处理器的TDP为600W,但仍然使用被动冷却,不需要液冷。
英特尔表示,就性能而言,Gaudi2比英伟达A100更快。英特尔展示了Gaudi2与竞争对手的性能比较。在ResNet-50模型训练中,Gaudi2的吞吐量是一代产品的3.2 倍,英伟达80GB A100的1.9倍,V100的4.1倍。在其他一些基准测试中,Gaudi和80GB A100之间的差距更加明显:对于BERT Phase-2训练吞吐量,Gaudi2比80GB A100高出2.8倍。
除了从16nm升级到7nm之外,Gaudi2的Tensor处理器内核数量从上一代的8个增加至24个,这意味着3倍计算资源的提升。
此外,Gaudi2在架构上还添加了媒体处理的功能,包含了硬件加速器,这对于视频分析工作非常重要。
在AI领域,英特尔还宣布携手埃森哲启动“阿波罗计划”,旨在通过为企业提供经过优化设计的愈30种开源AI解决方案,让其能够在本地、云端亦或是边缘环境中都更易于部署AI。“阿波罗计划”的首批套件预计将在未来几个月内发布。