智能安防急需适用于边缘计算且高性价比AI芯片
2019/5/15 09:20   AiRiA研究院      关键字:智能安防,边缘计算,高性价比,AI芯片      浏览量:
边端AI芯片在实际应用终端需要深度神经网络满足存储占用小、网络精度高、计算速度快、电量消耗低等条件,才能真正发挥作用。例如在社会治安应用中,可根据治安、反恐、社区可疑人员等信息结合时间频次信息等预测出可能出现的危险情况和安全隐患,从而组织治安力量更有针对性地进行社会管理,这些都需要网络的准确性和实时性,而且边缘端设备对体积和成本要求很高,不能接受占用很大的存储空间和功耗。

  一、AI芯片是安防领域强需求

  在电子安防产品市场中,视频监控系统占据了过半的份额,市场规模达到962亿元,成为构建安防系统的核心。目前安防行业涉及多个领域,包括公安安防、智能家居、智能交通、智能制造、智慧城市等,主要需求还是来自于对人和车辆的检索和识别,后期在行为识别方面的需求也会越来越大。在不久的将来,人工智能技术将会取代众多传统的安防技术,整个安防行业的发展已经到了比拼核心技术的关键节点。

  得益于深度学习的发展,以往模式识别中依靠人工完成的特征提取工作全部可以通过网络结构自主完成。它能够将视频图像内容转化成清晰表达目标属性的结构化数据,再进行数据深度挖掘,可有效提高数据处理效率。图像和视频的人工智能处理,是目前AI芯片商业化前景最乐观的赛道,也是玩家们弯道超车的最佳机会。

  目前市面上主流的人工智能摄像头产品售价均为几千元不等,是普通高清摄像头的几倍,其主要原因在于AI芯片成本居高不下。如何让AI芯片成本降低,性能不断提高,才是智能安防能否真正落地的关键。

  二、边缘计算是智能安防的主要瓶颈

  1.应用层面

  目前,产品落地上主要体现在视频结构化(对视频数据的识别和提取)、生物特征识别(指纹识别、人脸识别等)、物体特征识别(车牌识别系统)等应用方向。安防系统每天产生的海量图像和视频信息造成了严重的信息冗余,识别准确度和效率不够,并且可应用的领域较为局限。

  视频监控系统作为前后端分属较为明显的物联网系统,在边缘计算的应用方面有很大潜力。摄像机作为前端采集设备,目前不仅清晰度大大提高,而且对智能化需求也越来越强,因此行业内正在极力推进摄像机能够实现对视频图像内容的实时处理,不但能够极大地降低信息传输系统和后端设备的负担,同时还能够提升整个安防系统的响应速度,为安防领域一直提倡的"事前预警、事中制止、事后复核"理念走向现实提供最有利的技术支撑。

  比如在人脸识别应用当中,通过前端抓拍+中心分析的前后端智能相结合的模式,将人脸识别智能算法前置,在前端摄像机内置高性能智能芯片,通过边缘计算将人脸识别抓图的压力分摊到前端,解放中心的计算资源,以集中优势计算资源做更高效的分析。

  2.技术层面

  现阶段的人工智能,通常是指依赖于海量数据和深度学习,通过监督或非监督方式训练而获得的智能,代价是巨大的计算和存储复杂度,随着算法多样性和复杂度的进一步提升,运算和存储的代价都会大幅增长。传统的解决方案是,大量的数据是在云端的数据中心被分析并决策后,再将结果发还给终端,也就是说,云端负责人工智能的部分,终端(也就是边缘端)负责数据采集以及执行。

  3.云端的难题

  (1)数据传输成本高。随着数据量激增,对传输带宽压力也不断增加,边缘端的无线传输模块必须支持高速无线传输,这就需要更大的功耗,与边缘端低功耗的需求是冲突的。

  (2)许多终端应用场景对延时非常敏感。比如平安城市中的异常行为检查、人流量检测等,都需要实时预警,延时较长是无法被接受的。

  (3)像智能家居等场景对安全和隐私的需求,也使得云计算的发展受限,在数据传输到数据中心前,通过网络边缘设备对数据进行分析处理,匿名和加密,可以无需将所有终端数据都传输给云端,进而有效地解决这些问题。

  边缘计算可以很好的解决这些问题,根据实际应用需求,边缘端既可以独立作为智能处理模块,也可以和云端配合(边缘端做一些分析处理和过滤,再交给云端),这样的解决方案对延时、带宽和功耗等都有明显优势。

  三、边端AI芯片的技术挑战

  边端AI芯片在实际应用终端需要深度神经网络满足存储占用小、网络精度高、计算速度快、电量消耗低等条件,才能真正发挥作用。例如在社会治安应用中,可根据治安、反恐、社区可疑人员等信息结合时间频次信息等预测出可能出现的危险情况和安全隐患,从而组织治安力量更有针对性地进行社会管理,这些都需要网络的准确性和实时性,而且边缘端设备对体积和成本要求很高,不能接受占用很大的存储空间和功耗。

  随着深度神经网络模型变得越来越复杂,其参数量和计算复杂度也相应增加,以AlexNet为例,该神经网络包含超过六千万个参数,对于单幅图像进行分类的过程涉及到多达7.3亿次浮点运算。如此高的运算代价,使得深度神经网络在边缘计算中遇到了极大的挑战,而且边缘端对时延和功耗较敏感,导致不同存储介质间的频繁数据传输应尽可能地避免,这就又限制了深度神经网络模型的大小,如果能缓解冯诺依曼架构的瓶颈,尽可能减少甚至避免使用DRAM,减少存储层级,将是一个非常理想的解决方案。但是,随之而来的挑战是深度神经网络模型在保证精度的前提下必须足够精简。因此,如何解决深度神经网络的加速与压缩成为推动边端AI芯片落地的核心技术难题之一。

  如何在网络精度保持不变或略有下降的前提下减少网络的计算量和存储,如何实现更加有效的加速压缩,也存在着许多困难和挑战。首先,有些压缩方法虽然能降低存储,但由于其特殊存储方式,需要解码操作后才能用于网络计算例如K-means聚类的网络压缩方法,虽然可以使用低比特的聚类中心的下标来存储,但是在计算前需要对每一个权值用聚类中心所代表的浮点数替换,该类压缩方法只能降低网络对磁盘的占用,不能减少网络对内存的消耗,因此不能降低功耗,也没有真正做到加速。其次,对于目前基于CPU的计算平台,许多加速方法虽然能达到很高的理论加速比,但实际加速效果远低于理论,以网络稀疏的加速方法为例,由于大部分元素为零,因此理论上有效计算量小,但由于无规则稀疏,非零元素在内存不连续,因此仍然需要频繁访问内存,并未实现真正加速。

  面对以上挑战,定点量化的方式表现出明显优势。

  1.因为网络在训练好后,实际应用中并不需要全精度,量化就是指用更低的数值精度实现神经网络的加速压缩。

  2.量化的方式有多种,定点量化是相较其他几种更为有效的,由于其在硬件如FPGA上能够取得很高的运行效率。

  3.使用比特位数越低,加速效果越明显。然而目前常用的定点量化方法,尤其是当量化比特数非常低的时候,如1比特或者2比特量化,很难达到与全精度(FP32)相近的性能,这也是量化技术发展过程中所面临的挑战。

  四、利用量化神经处理架构解决上述挑战

  中科院自动化研究所基于十几年对量化处理技术的深厚积累,形成了独具优势的量化模型压缩处理技术,可以极大简化整个计算过程,且与全精度性能结果对比,几乎没有精度损失。

  1.AiRiA研究院基于中科院自动化所的量化处理技术,开发出量化神经处理器QNPU(Quantized Neural Processing Unit)。目前业内采用量化处理技术的标配是支持8比特,但AiRiA研究院能做到4比特、2比特甚至任意1比特的量化,在国际上也达到领先水平,并且可通过大规模神经网络实现片上计算,从而减少或无需访问外部存储器,进而解决耗费极大功耗、带宽和体积成本的"内存墙"难题。这就意味着QNPU可以满足智能安防中边缘计算场景的需求,在满足低成本、低功耗、低延时的条件下,仍然可以保持高算力,且精度几乎没有损失,也可根据不同应用场景和不同算力要求,灵活定制。

  2.基于QNPU架构,AiRiA研究院的芯片团队自主开发了量化神经处理芯片Watt A1, 将QNPU的优势发挥到极致,适合多种应用场景。该芯片采用台积电28nm工艺,峰值算力可达24Tops,支持1080P四路视频实时检测,基于MobileNetV2的图像分类达到每秒8000帧。目前在WattA1的demo展示中,在人脸重识别、目标检测分类、异常行为检测、车辆重识别、道路识别等高性能智能安防的边缘端应用场景下都表现出明显优势,这无疑是解决边缘计算诸多挑战的最好方案之一。

  3.为了能真正将科研技术赋能行业,帮助客户加速实现应用,AiRiA研究院为企业用户开发出一系列边缘计算落地急需的AI全栈式解决方案,除了前文提到的硬件Watt A1芯片,还包括模型压缩工具QTrainer和深度学习推理引擎QEngine。

  (1)QTrainer不仅支持QNPU,还支持第三方开发自定义应用。

  (2)QEngine也是针对量化架构,可兼容多种处理器和硬件,支持各种深度神经网络模型的计算,在各个平台、各个网络模型上的性能评估显示,QEngine在内存占用和性能上均有较为明显的优势。

  五、结语

  AI芯片在智能安防领域扮演着核心角色,芯片在很大程度上左右着安防系统的整体功能、技术指标、稳定性、能耗、成本等,并在安防行业未来发展方向上起到关键作用。目前安防监控领域主流的深度学习芯片是GPU,但GPU存在成本、效率、功耗等瓶颈,因此针对安防行业开发的FPGA/ASIC智能芯片成为新趋势,而且要满足即时、准确、低成本这些条件,才是未来能在智能安防应用中真正落地的AI芯片。相比于传统视频监控,边缘计算+视频监控最主要的变化是把被动监控变为主动分析和预警,因而解决了需要人工处理海量监控数据的问题。从本质上看,边缘计算通过对视频图像进行预处理,去除冗余信息,使部分或全部视频分析迁移到边缘处,由此降低对云中心计算、存储和网络带宽的需求,提高视频分析速度。

  智能安防领域急需适用于边缘计算的AI芯片,能满足即时、准确、低成本、低功耗等高要求,通过AiRiA研究院研发的量化神经处理架构QNPU开发的硬件AI芯片,以及配套的一系列推理引擎等软件,可以让智能安防有望突破上述瓶颈,推动智能化安防监控设备更大范围地普及。

微信扫描二维码,关注公众号。