技术动态 > 正文
寒武纪系列智能处理器产品
2017/12/29 13:18   中国安防行业网      关键字:寒武纪,系列,智能,处理器      浏览量:
2017年底,寒武纪推出了三款不同领域的智能处理器产品。第一款是寒武纪1H16处理器,这款处理器是华为麒麟970搭载的寒武纪1A处理器的升级款,相比前代拥有超高的性能;第二款是寒武纪1H8处理器,提供4种配置,主要面向视觉领域,主打图片图像处理、拍照辅助、安防监控,其性能功耗比为寒武纪1A的2.3倍;第三款为面向自动驾驶领域寒武纪1M处理器,拥有超出1A10倍以上的性能。

  人工神经网络就是一种模仿生物神经网络结构特点的计算机算法,最基本的特征就是模仿大脑神经元之间传递模式,并对输入的信息进行快速处理。而每一个神经元都自己独特的激励函数,用于处理计算来自其他相领的神经元加权输入值,并且用加权值神经元之间的信息传递强度来定义。人工神经网络算法最大不同是可以不断自我学习,通过大量样本数据进行训练调整传递加权值,改善自身拓扑结构,使得算法更加高效,广泛适用于人工智能领域,目前像是谷歌的AlphaGo、百度的语音识别和自动驾驶、阿里巴巴仿真机器人都是大量使用到人工神经网络算法。

  目前通用型处理器都是基于冯诺依曼结构,其存储和运算处理是分离的,需要大量读写运行操作的深度神经网络,不可避免受到了传输数据带宽的制约,效率低下。另外随着科学技术发展,通用型处理器已经不能满足各式各样需求,走上了专用细分的道理,GPU负责图形处理,DSP负责信号处理,而神经网络处理器就负责各式各样的智能识别任务。

  因此,中国科学院计算技术研究所和寒武纪公司提出采用专门的硬件神经元,设计高速连接的专门的存储结构,采用适用于神经网络算法的专用指令集,开发了寒武纪系列神经网络处理器:单核神经网络处理器结构的DianNao,超大规模神经网络的多核处理器结构的DaDianNao,面向多种机器学习算法的PuDianNao。

  2016年推出的寒武纪-1A(Cambricon-1A)商用智能处理器,集成到终端SoC芯片,每秒可处理160亿个虚拟神经元,每秒峰值运算能力达2万亿虚拟突触,性能比通用处理器高两个数量级,功耗降低了一个数量级。

  而开发的神经网络处理器指令集DianNaoYu则是参照RISC(精简指令集)设计思想,所有指令长度都是64bit,有效简化指令译码器的负担,减少功耗以及芯片面积。一条指令即可完成一组神经元处理,优化了计算数据在芯片上的传输,模拟实验表明,采用DianNaoYu指令集的深度神经网络处理器相对X86指令集处理器有两个数量级的性能提升。

  2017年底,寒武纪推出了三款不同领域的智能处理器产品。第一款是寒武纪1H16处理器,这款处理器是华为麒麟970搭载的寒武纪1A处理器的升级款,相比前代拥有超高的性能;第二款是寒武纪1H8处理器,提供4种配置,主要面向视觉领域,主打图片图像处理、拍照辅助、安防监控,其性能功耗比为寒武纪1A的2.3倍;第三款为面向自动驾驶领域寒武纪1M处理器,拥有超出1A10倍以上的性能。

  在推出三款AI处理器之外,寒武纪还发布了人工智能软件平台CambriconNeuWare,这个平台分为软件开发、性能调优、功能调试三个工具包。并且,这个软件平台还兼容Caffe和TensorFlow等主流深度学习框架,支持稀疏模型、量化模型、寒武纪模型。

微信扫描二维码,关注公众号。