据介绍,此次发布的256TOPS算力的思元370主要面向中高端推训场景,与主要面向训练的512TOPS高端产品思元290形成协同,共同为客户提供全功能、全场景的智能算力。
中国安防行业网从寒武纪官方微信平台获悉,2021年11月3日,寒武纪发布第三代云端AI芯片思元370、基于思元370的两款加速卡MLU370-S4和MLU370-X4、全新升级的Cambricon Neuware软件栈。
▲ 寒武纪第三代云端AI芯片思元370
据了解,思元370基于7nm制程工艺,是寒武纪首款采用chiplet(芯粒)技术的AI芯片,集成了390亿个晶体管,最大算力高达256TOPS(INT8),是寒武纪第二代产品思元270算力的2倍。凭借寒武纪最新智能芯片架构MLUarch03,相较于峰值算力的提升,思元370实测性能表现更为优秀:以ResNet-50为例,MLU370-S4加速卡(半高半长)实测性能为同尺寸主流GPU的2倍;MLU370-X4加速卡(全高全长)实测性能与同尺寸主流GPU相当,能效则大幅领先。
思元370也是国内第一颗支持LPDDR5内存的云端AI芯片,内存带宽是上一代产品的3倍,访存能效达GDDR6的1.5倍。
同时,寒武纪全新升级了Cambricon Neuware软件栈,新增推理加速引擎MagicMind,实现训推一体,显著提升了开发部署的效率,降低用户的学习成本、开发成本和运营成本。
在视觉领域,思元370升级了视频图像编解码单元,可提供更高效的视频处理能力和更优的编码质量,支持更复杂、更繁重、低延时要求的计算机视觉任务。
解码方面,思元370集成了强大的媒体性能,可支持132路1080p视频解码或10路8K视频解码。编码方面,全新
编码器通过灵活的码率优化(RDO)控制、多参考帧、二次编码等特性组合,在相同图像质量(全高清视频PSNR)的情况下比上一代产品节省42%带宽,有效降低带宽成本。
另外,针对当前信息安全问题,寒武纪在思元370芯片内置安全模块,切实保障用户信息安全。思元370更是寒武纪第一颗支持国内外主流加密标准的云端芯片,支持用户数据、深度学习模型的加解密以及计算结果的加密输出,通过信任根的方式,保障AI芯片在启动及运行过程中加载的所有代码的安全性,还支持远程认证,用户可在业务运行过程中远程验证AI环境安全性。
据介绍,此次发布的256TOPS算力的思元370主要面向中高端推训场景,与主要面向训练的512TOPS高端产品思元290形成协同,共同为客户提供全功能、全场景的智能算力。
思元370在2020年三季度实现流片,相关加速卡产品已于2021年二季度陆续送测客户。目前,部分客户已完成测试、导入,产品进入早期销售阶段,并且已与国内主流互联网厂商开展深入的应用适配,在语音、视觉等场景的性能表现超出客户预期。