2016年10月27日上午,2016年中国国际社会公共安全产品博览会的另一项重要活动,即以“深化解决方案拓展行业市场”为主题的“2016中国安防行业市场应用论坛&优秀行业解决方案颁奖仪式”在中国国际展览中心(新馆)综合楼2楼W201演讲厅召开。
英伟达NVIDIA高级总监陈曦
英伟达NVIDIA高级总监陈曦,IT领域从业超过20年,现任英伟达高级总监负责嵌入式及自动驾驶领域业务发展。本次论坛上陈曦总监从三方面讲述了“人工智能引领安防产品大变革”这一主题。第一,现代的安防监控需求正在从事后检索,转向实时报警甚至提前预判,海量的视频数据要求视频监控系统全面智能化。第二,基于GPU并行运算的深度学习算法在物体识别的准确度,效率以及在对复杂环境下的适应性方面有长足的发展,在对人脸、物体的识别率上甚至超过人的水平。第三,NVIDIA在安防领域提供端到端(Training到Inference,后端服务器到前端摄像头)的人工智能整体解决方案,被业界多家一流企业所采用,正在引领安防产品向人工智能升级的变革。以下是演讲内容实录。
今天我会讲一下我们怎么看个人工智能以及人工智能对安防产业的影响,人工智能可能是安防产业的第一个按钮。人工智能在这两年是一个大爆炸大暴走的一个时代,我们也认为在未来的10到20年就是人工智能的一个时代,我们也知道在人类历史上的几次革命包括工业革命、互联网革命,那下一个真正的影响到人类社会的革命就是人工智能。人工智能从实际上从2012年开始到现在是有一个突破性的发展,有很多里程碑式的事件出现,在2012年的时候,人工智能写的深度学习的算法第一次超过了人类自己写的;在2013年的时候,机器在乳腺癌的检测上面超过了人;到了2015年的时候在图像识别方面机器击败了人,我们知道,一个训练有素的人,比如说是安检员,他对人脸识别的准确率可以达到95%以上,但机器远超过人,在2016年的时候这个数据更加可怕,机器在人脸识别的时候,准确率已经达到了百分之九九十九点五几了,所以你会发现,机器超过人这是一个确定的事实。在今年年初,人工智能机器又击败了人类最顶尖的围棋选手。
我们英伟达公司是一个人工智能公司,20多年走过来,从做游戏卡开始,一直走到了人工智能。这个过程实际上是一个蛮巧合的过程,最开始做游戏卡的时候我们就发现,要处理图像就必须有一个非常强的并行处理能力,业界有两条线,一个是就像以Intel为代表的以逻辑处理去做它的CPU,那另外一种公司就是专注于去尽快的把图像做好。一个节点一个节点去做太慢,所以我们是一批一批地去做,这个就是gpu的诞生,它导致了一个变形计算的发展。
大家知道超算中心对一个国家来说非常重要的,它可以模拟核爆,可以做地层检测、地震波的检测,风洞实验,所有这些都离不开超算中心。可以说超算中心代表了一个国家的真正的实力所在,在中国,超算里也大量地运用并行计算。从2012年开始,人工智能深度学习的全球的领军人物也发现,并行计算非常适合人工智能,人工智能的新颖点就是希望机器能够像人脑一样思考。人脑有无数神经元,神经元之间有无数的连接,gpu也是,一个gpu里面有上万个核,这些核之间有非常丰富的连接,这跟人脑非常相似,非常适合在gpu里面去运作,是基本上所有的研发人员的一个共同的选择。人工智能的深度学习从2012年开始是一个全新的发展,但实际上这一概念在20年前就提出来了,但苦于当时没有条件去做。因为深度学习成熟越多,计算就会越准确,深度学习就像一个黑箱子。到现在为止,所有的科学家都不知道这个深度学习的黑箱子里面到底是怎么运作的,但是它得出的结果是远远超越传统算法的,所以这就是对于安防产业来说的可用和不可用,以前我们做cv算法,比如说我们想做人脸检测,那么我们最多可以做到百分之七十、百分之七十五,报错率非常高,可用价值就比较小,但是到今天为止,99.5%以上的准确率的时候就是完全可用的。随着训练量的增大、神经网络的演进,再加上超强的计算力,我们相信准确率会逐渐向100%去接近。在深度学习应用里有一些典型的应用。包括多目标的检测、人脸识别、语音的识别,不管是科大讯飞,不管是百度还是腾讯,还是新兴起来的云之声,他们都是用到了深度学习。在9月初的一个大会上,百度在演示产品时,有一个婴儿,她说话很不清楚,但是机器一样可以识别得到,人都听不懂,但机器可以识别,从这点上来讲,语音方面的人工智能已经超过了人,那我有理由相信,人工智能在未来会代替翻译人员。
接下来我们看安防行业的哪些痛点是人工智能可以帮到我们的。我们认为,第一就是识别的准确率。现在这个结论已经很确认了,人工智能已经超过了人;第二个就是节省带宽,节省存储空间,每天海量的存储需要很多硬盘,而且随着4k、8k的到来,传输带宽也是一个非常大的负担,都需要很大的投资,如果没有人工智能这个问题很难解决。人工智能除了在后端、在云端,去做事后的检索,同时在前端或者尽量靠近前端的地方,比如,在派出所里有一个人工智能的机器,所有一、二百路摄像头进来都可以同时进行检索,如果这个路口一晚上没有一辆车过,没有人一个人过,那这个录像根本不需要存储,直接删除就好了,节约了带宽,节约了存储。另外就是,以前假设一个前端的摄像头,我们去安装的时候需要去现场根据背景调软件,需要大量的高级算法工程师。但是在人工智能时代,你会发现工程师的作用正在下降。对人工智能来说,比如用深度神经网络去做目标检测,只要给它足够的训练就能很容易地从背景里把这个人或者这个车抠出来。也就是说,在安装摄像头的时候,不用去管它的安装环境是什么,不用去现场进行调试,那么安装的成本就会急剧降低。以前我们要去做一个复杂环境的识别,用CV算法是一件非常痛苦的事情,需要很强的工程师,只能处理一件事情,需要很多算法的叠加,那么我们再看的话就是你实际上就是说,对于那个,如果说仅仅是识别物体,一个算法就可以搞定,只要把它的大数据的训练量加到足够的话它就可以识别图里面的所有东西,很多人认为一个网络会不会很大,实际上,在训练的时候需要一个很强大的服务器,但训练完成之后,神经网络是非常小非常精巧的一个东西,这个东西甚至可以嵌入到芯片里面去。当然,嵌入芯片也需要一个很强的计算能力,那这就是我们提供给业界、提供给在座各位的一个端到端的解决方案。谢谢大家!