2018年推出MLU100是寒武纪的第一款智能处理板卡产品,其中搭载的MLU100芯片是中国第一款云端智能芯片,采用了MLU100 v01架构和TSMC(台积电)16nm的先进工艺,适用于视觉、语音、自然语言处理等多种类型的云端人工智能应用场景,为云端推理提供强大的运算能力支撑。与传统架构处理器相比,MLU100在处理人工智能任务时可获得巨大的性能功耗比提升,是真正适合人工智能的处理器。目前公司对MLU100具有完全的自主知识产权,拥有领域技术核心专利,已与阿里、讯飞、联想、曙光等领导性企业开展应用合作。
关键技术指标:
MLU100智能处理卡可工作在平衡模式和高性能模式下,支持稀疏化处理,等效理论峰值运算能力166.4 TOPS(INT8),可通过双槽位的PCIe Gen3 x16集成于现有的各类服务器机架和工作站中,支持被动或主动两种散热方式,典型功耗为80W,峰值功耗不超过110W。MLU100智能处理卡支持最高32GB的DDR4内存容量,并具备ECC数据校验功能。
产品创新点:
目前,深度学习等人工智能技术蓬勃发展、快速迭代,已经在语音识别、图像识别、视频识别、决策博弈和自然语言理解等领域达到了接近人类的水平,在工业界取得了广阔的应用。然而传统芯片如CPU和GPU远远难以满足深度神学习处理的速度和能效需求,本公司前期研制了全球首款深度学习处理器,每秒能处理160亿神经元和2.56万亿突触,比Intel同期通用CPU性能和能效提高百倍,该芯片支持的深度神经网络,是目前准确度最好、最实用的智能技术,广泛应用于各种移动互联网产品中(包括AlphaGo和谷歌大脑)。
公司最新推出的MLU100芯片是中国第一款云端高性能智能芯片,支持各类深度学习技术、支持多模态智能处理(视觉、语音和自然语言处理),广泛适用于语音、视觉、自然语言等领域的智能处理,支持稀疏化,可以达到166.4TOPS的INT8运算能力,相比GPU处理器,采用了针对深度学习和人工智能应用特点定制的指令集和处理器架构,具有更优的能效比。与传统架构处理器相比,MLU100在处理人工智能任务时可获得巨大的性能功耗比提升,是真正适合人工智能的处理器。在人工智能计算中,MLU100智能处理卡可替代英伟达图形处理单元(NVidia GPU)产品,广泛应用于大数据中心(例如BAT机房、华为云、电信天翼云等各领域云服务器)以及各城市大脑中,为云端推理提供强大的运算能力支撑。
寒武纪还为MLU100提供了一整套成熟的开发环境Cambricon NeuWare,NeuWare全面支持各类主流编程框架(如TensorFlow、Caffe、Caffe2、MXNet和ONNX等)。用户可面向上述编程框架,便捷地在寒武纪MLU100上开发和部署深度学习应用。同时,NeuWare提供了完整的运行时系统和驱动软件,方便系统快速集成。NeuWare还提供了包括应用开发、功能调试、性能调优等在内的一系列工具。
目前公司已经完成专利布局,具有完全的自主知识产权,拥有领域技术核心专利。公司在全球范围内共有276项专利申请,其中中国境内272项(发明专利申请266项、实用新型专利申请3项、外观设计申请3项);在欧美日韩等发达国家4项(发明专利申请4项)。其中一件中国专利授权。除专利以外,公司还拥有软件著作权6项。
国内外市场推广情况:
作为全球第一个AI芯片领域的独角兽创业公司,寒武纪成立仅一年多,其产品就已在广泛应用在千万级智能终端中(包括华为Mate10、P20和荣耀10等手机),智能处理效率较传统芯片提高上百倍,得到了上百个国际学术机构和商业公司的关注。
基于领先的技术优势和深度的专利布局,寒武纪当前已经与国内及国际上绝大部分的终端芯片集成厂商(华为、展讯、高通、MTK等)以及各大下游应用厂商(百度、阿里、腾讯、小米等)等建立了良好的合作关系。终端产品寒武纪1A是国际上首个深度学习专用处理器商用产品,面向智能手机、安防监控、无人机和智能驾驶等各类终端设备,已经应用在华为Mate10、P20和荣耀V10等数千万智能手机中。云端产品寒武纪MLU100峰值速度超越当前最先进GPU,主要服务于服务器端的大型智能处理,已与阿里、讯飞、联想、曙光等领导性企业开展应用合作。寒武纪将力争在3年后占有中国高性能智能芯片市场30%的份额,并使全世界10亿台以上的智能终端设备集成有寒武纪终端智能处理器。
微信扫描二维码,关注公众号。