高端访谈 > 正文
海康威视研究院院长浦世亮谈深度学习+安防
2017/3/28 09:51   新智元      关键字:浦世亮,安防,海康威视研究院,深度,场景      浏览量:
最新一期的AI领军人物专访采访到了海康威视首席专家、研究院院长浦世亮,他分享了海康威视夺冠 ImageNet 背后的技术,谈到 2017年,深度学习在复杂网络设计、模型压缩方向的研究依然是热点,深度学习和LSTM、增强学习的结合进一步加强。另外,针对当下安防行业的智能+现状,他也提出了独特的见解。

备受关注的计算机视觉国际大赛——ImageNet 大规模图像识别挑战赛(ILSVRC2017)已经拉开帷幕,今年的比赛分为四个主要项目:定位、识别以及视频中物体识别和Tester Challenges。去年在比赛中拿下场景分类关键的

    海康威视首席专家浦世亮近日接受新智元专访,他谈到了去年参赛详情和技术细节。他也对深度学习与安防行业现状的10个问题进行了深入解读。

根据 ImageNet官网的最新消息,今年的 ImageNet 大规模图像识别挑战赛(ILSVRC2017)已经拉开帷幕。

今年的比赛项目分为4个:

物体定位

物体识别

视频中物体识别

Tester Challenges

官网特别提示:已经使用了几种算法的参与者可以每个算法提交一个结果(最多5个算法)。算法参数的变化不构成不同的算法(遵循PASCAL VOC中使用的过程)。

    去年的 ImageNet上,来自中国的团队大放异彩:CUImage(商汤和港中文),Trimps-Soushen(公安部三所),CUvideo(商汤和港中文),HikVision(海康威视),SenseCUSceneParsing(商汤和港中文),NUIST(南京信息工程大学)分别拿下多个项目的冠军。

海康威视研究院院长浦世亮谈深度学习+安防

    其中,海康威视拿下了场景分类(Scene Classification)的冠军。具体赛果见下表:

海康威视研究院院长浦世亮谈深度学习+安防

    另外,在物体探测任务上,海康威视也有亮眼表现:

海康威视研究院院长浦世亮谈深度学习+安防

海康威视研究院院长浦世亮谈深度学习+安防

海康威视这家做安防出身的企业目前在计算机视觉上已在国际上取得领先的地位,除了ImageNet 外,在PASCAL、KITTI和MOT等竞赛中都有亮眼表现。

    根据海康威视首席专家浦世亮介绍,在PASCAL VOC2012目标检测上,海康威视基于Faster R-CNN深度学习目标检测算法mAP性能达到87.9,排名第一,领先盘踞榜首近一年的第二名微软4.1个点,刷新纪录。

    最新一期的AI领军人物专访采访到了海康威视首席专家、研究院院长浦世亮,他分享了海康威视夺冠 ImageNet 背后的技术,谈到 2017年,深度学习在复杂网络设计、模型压缩方向的研究依然是热点,深度学习和LSTM、增强学习的结合进一步加强。另外,针对当下安防行业的智能+现状,他也提出了独特的见解。

浦世亮 海康威视研究院院长

浦世亮,法国国家科学研究院(CNRS)博士,浙江大学理学博士,现任海康威视首席专家、研究院院长,负责公司在人工智能及大数据领域的技术研究。浦世亮带领研究院研发的Smart 265编码技术、目标结构化算法、车牌识别算法、人脸识别算法、视频检索引擎、多传感器融合等技术,被广泛应用于公共安全、金融、交通、司法、零售、智慧城市等多个领域。

海康威视 ImageNet 2016 夺冠背后技术详解

去年 ImageNet 大规模图像识别挑战赛(ILSVRC)中,海康威视(HikVision)拿下场景分类项目的冠军。你能具体介绍一下这一比赛项目吗?海康威视夺冠的技术核心是什么?

浦世亮:ImageNet 场景分类任务采用MIT发布的 Place2 数据集,其目的是对图像中存在的场景进行识别。该数据集拥有365个类别的场景目标,800多万张已经标记的训练样本。相对于普通的ImageNet图像分类任务,场景分类任务的难点在于其数据分布非常不均衡,每个类别的数据从5000 到 30000不等,每张图像都可能在不同的场景描述和相对更模糊的场景标签。

场景分类技术,对于视频产业及其应用领域有比较重要的应用价值,基于对场景的理解有助于我们的系统更好地对于视频中的信息进行理解和应用。

海康威视研究院院长浦世亮谈深度学习+安防

海康威视从成立之初就专注于计算机视觉领域技术的研发,13年就开始深度学习的技术布局,实现了一整套的深度学习训练框架,并探索了深度神经网络的优化算法,包括对网络参数初始化、超参数搜索、正则项、损失函数、流形优化理论等的研究。

海康威视研究院院长浦世亮谈深度学习+安防

另外,我们还从信号调制方向切入,围绕信号在网络前向反向传输中的保范性(norm-preserving),探索深层网络优化的可行性与新方向。

浦世亮:深度学习+安防 10 问

海康威视研究院院长浦世亮谈深度学习+安防

2016年10月24日,海康威视在北京召开“AI+:感知未来、融合发展”主题论坛   

    深度学习技术可谓安防行业的“颠覆性力量”,具体如何理解呢?

    浦世亮:在SDT安防大数据时代,面对井喷式增长的视频监控数据量,只停留在浅层次分析识别的传统智能算法,已无法满足深层次数据价值挖掘的需求。显而易见,我们需要有更深层次的智能,应用人工智能可以帮助我们做到这一点,而这其中的关键点便是深度学习算法的应用:

准确率更高,应用深度学习算法的深度智能设备,可以自行提取更多更详细、更微小的特征,从而使得识别分类对象的准确率更高,也就是说:深度学习让智能有了质的飞跃;

环境适应性更强,同样是环境特征的提炼,深度学习算法可以自行提取更丰富、更适合的特征参数,从而达到更强的抗环境干扰能力。这就意味着,深度学习的产品可以应用到更广泛的环境当中;

识别种类更丰富,理论上只要有足够多的样本进行训练,深度学习能够实现比较精准的目标分类识别,自主特征识别的特点,又让深度学习特别适用于抽象、复杂的关于人的特征、行为的分析领域。

视频分析是安防中一个非常重要的技术。那么深度学习是如何对视频进行分析的?其中的技术难点主要存在于什么地方?

浦世亮:深度学习技术主要是利用深度神经网络,对视频关键帧信息进行逐层特征抽象,在此基础上,提取目标的结构化信息,并利用各关键帧的信息,进行前后有效关联,从而形成对视频中目标行为或事件发生的综合判断。其技术难点主要体现在海量数据应用、高性能训练、推理平台,以及适合安防领域的高效模型设计上。

安防数据99%都是非结构化的,那么你们是如何利用这些数据?有没有比较便捷的办法,把这些数据变成结构化的?

浦世亮:原始的安防数据几乎都是以非结构化的面目呈现,无法直接利用。针对这个业内普遍痛点,海康威视推出了基于深度学习技术的全系列智能安防产品家族,涵盖“深眸”系列智能摄像机、“神捕”系列智能交通产品、“超脑”系列智能NVR、“脸谱”系列人脸分析服务器等等。“‘深眸’系列专业智能摄像机依托强大的多引擎硬件平台,内嵌专为视频监控场景设计优化的深度学习算法,具备了精准的安防大数据归纳能力,实现了在各种复杂环境下人、车、物的多重特征信息提取和事件检测。将非结构化信息转为结构化信息,将打通大数据入口,从而为后续关键数据挖掘铺平了道路。

目前实际应用中,视频人脸识别的准确率能做到多少?

浦世亮:人脸识别的准确率与多个因素相关,与算法的先进性,产品形态,应用方式及场景架设相关。现有的人脸识别技术的准确率在多种应用场景下都已经达到了实用的阶段。海康威视打造了“深眸”系列智能摄像机、人证比对终端等,首先在产品形态应用方式,场景架设上保障了人脸识别的高精度应用。我们在应用中不断迭代我们的算法,使我们的算法准确率不断提升。

在实际应用中,摄像头采集到的安防数据,有多少还需要人工的分析?我们离真正的全自动化还有多远。

浦世亮:安防人工智能和应用需求相关,有一些应用已经达到了完全的自动化。有一些安全等级较高,准确率要求较高的应用,还需要人工参与。

除了人脸,其他的生物特征,比如瞳孔识别,这些技术在安防领域的应用有多大?

浦世亮:技术的发展和落地是有过程的,当前人脸识别比较火,主要是技术发展到了可以达到实际应用的水平。

瞳孔识别的标准说法是虹膜识别,对于图像采集的要求是非常高的,需要利用红外补光,而且需要虹膜区域分辨率达到100像素左右,当前主要用在金库等安保等级较高的场景,需要人做一定的配合。

当然我们也看到相应技术在进步,比如利用高分辨率的摄像头,结合一些自动调整策略,能够把虹膜识别在安检时用上,采集距离达到1米左右,1秒左右完成一个人的通关。

所以说,虹膜识别等其他的生物特征识别技术当前只能在一些特定的场合应用,随着技术进步,这些技术的应用场合也会扩大,但是什么时候能够像人脸识别一样广泛应用,就需要看特定技术的未来发展情况。

你如何看待 “开源”这一现象,海康威视有使用开源算法或者开源数据吗?

浦世亮:在信息共享越来越发达,信息获取越来越便利的时代大背景下,开源是对信息共享的最好诠释。从更加具体的层面来看,人工智能正是由于各大研究机构,对于数据集、算法、论文、技术报告的不同程度的信息共享,间接地加速了这一领域的技术交流与技术的更新迭代。

海康威视会研究跟踪开源技术,并且我们也会通过发表学术论文的方式对开源技术做出贡献。

在行业生态上,海康威视如何与其他的伙伴合作?比如英特尔,海康威视与英特尔的合作具体是怎么样的?你怎么评价他们的他们今年推出的端到端全面深度学习产品?

浦世亮: 海康威视是安防行业的产品和解决方案提供商,秉承共赢未来的理念,和硬件芯片厂商会开展紧密合作,共同深耕人工智能在安防领域的应用。

海康威视和英特尔有长期深入的合作,英特尔公司在深度学习领域有许多非常有价值的产品。

你认为2017年,计算视觉领域会有哪些发展?在与硬件的结合上,这一技术会呈现什么样的趋势?

浦世亮:经过前几年深度学习技术的迅猛发展,计算机视觉领域已经取得了长足进步。2017年,深度学习在复杂网络设计、模型压缩方向的研究依然是热点,深度学习和LSTM、增强学习的结合进一步加强。

深度学习的硬件平台,会呈现一个爆发期,各大芯片厂商都会在今年推出适合深度学习的芯片平台,但计算能力和功耗仍存在矛盾,所以若要结合硬件平台推出产品,深度学习模型压缩显得尤为重要。

现在在人工智能领域很多公司都强调AI+,用AI技术+具体的应用场景,但是海康威视走的传统的安防企业+深度学习技术,你认为这两种路径有什么不一样吗?对于传统行业来说,要如何实现向智能化的转型?

浦世亮: 海康威视投入人工智能的研究已经有超过10年的历史,已有人工智能的产品投放市场且产生了广泛的社会应用,我们主要将人工智能应用在安防产业。

今年2月,海康威视在蒙特利尔建立研发中心,在硅谷建立研究与,海外研发中心的作用体现在哪?海康威视每年对研发的投入有多大?

浦世亮:主要有4点:

1. 进一步扩大海康威视的影响力;

2. 吸引高素质人才;

3. 提升公司的创新能力;

4. 增进与世界顶级实验室的合作

研发投入占比:7%左右

海康威视目前在安防上的市场份额具体有多少?

浦世亮:据美国权威机构iHS market 2016年7月发布的报告显示,在视频监控领域,海康威视2015年全球市场份额从2014年的16.3%增长至19.5%,五年蝉联全球第一。2016年11月,全球知名的工业媒体a&s《安全自动化》(MFNE法兰克福新时代传媒)发布2016年度全球安防50强榜单。海康威视跃居全球榜单首位。

如何看待这两年来迅速崛起的图像识别公司?它们会对海康威视形成冲击吗?

浦世亮:人工智能将撬动非常庞大的市场,在这个过程中,一定会出现很多优秀的公司,海康威视在人工智能领域耕耘多年,我们的积累是系统性的,包括算法、产品、数据、系统方案。另外,海康威视也有着其他方面的一些优势,深耕安防多年,对客户需求的理解也会深刻一些,能迅速的将技术进行落地应用。我们认为这次人工智能的浪潮对于海康威视来说,是一次巨大的机遇,面对这次机遇,我们是有充分准备的

海康威视研究院院长浦世亮谈深度学习+安防

10月24日海康威视发布了基于深度学习技术的从前端到后端全系列智能安防产品,将人工智能技术革命性地应用于安防产品中,推动安防行业进入智能新纪元。

微信扫描二维码,关注公众号。