高端访谈 > 正文
田第鸿:以人为本的人工智能
2018/1/11 17:13   中国安防行业网      关键字:田第鸿,以人为本,人工智能      浏览量:
云天励飞是一家视觉人工智能领域的创业公司,所以我本身也是一名创业者,借这个机会,跟大家分享一下我们所做的一些工作和在人工智能(AI)领域进行产品和技术创新的一些体会。我发言的主题是“以人为本的人工智能“。这个“以人为本”有三层含义:第一层含义,云天励飞的工作聚焦在视觉,特别是围绕人的视觉识别领域;第二层含义,我认为人工智能在某种程度上约等于机器人(Robots),有形的、无形的机器人,AI的未来,很大一部分是机器人真正进入并改变人们的工作和生活;第三层含义,最重要的,人工智能的使命,是服务于人。我围绕“以人为本”的主题来跟大家分享一点对AI创新的体会。

  12月22日,第三届全国青年人工智能创新创业大会决赛在深圳大学城哈工大校区举行。“千人计划”国家特聘专家、深圳市“孔雀计划”团队带头人、深圳云天励飞技术有限公司田第鸿博士受邀出席本次大会并发表主题演讲。

  专家介绍

  田第鸿,“千人计划”国家特聘专家、深圳市“孔雀计划”团队带头人。他在视频图像领域有十四年的研发经验,曾任三星显示美国实验室高级主管工程师,负责智能显示技术研究。曾任美国思科系统公司技术主管,是思科拟真视频会议系统即网真系统视频技术主创人员,网真系统中视频、视觉先进技术研发负责人,图像视频压缩中“混合变长编码”技术主要发明人,发表国际期刊会议论文20多篇,拥有视频编码、处理、传输、人脸检测、人脸及动作识别等领域近40项已授权专利,获思科公司个人成就奖及团队成就奖。

  2014年联合创立了深圳云天励飞技术有限公司。云天励飞是一家研究人工智能领域的技术创新型企业。公司专注于视觉智能领域,以深度学习和新型处理器技术为核心,致力实现视觉识别“端智能”与数据分析“云智能”。

  主题分享

  云天励飞是一家视觉人工智能领域的创业公司,所以我本身也是一名创业者,借这个机会,跟大家分享一下我们所做的一些工作和在人工智能(AI)领域进行产品和技术创新的一些体会。我发言的主题是“以人为本的人工智能“。这个“以人为本”有三层含义:第一层含义,云天励飞的工作聚焦在视觉,特别是围绕人的视觉识别领域;第二层含义,我认为人工智能在某种程度上约等于机器人(Robots),有形的、无形的机器人,AI的未来,很大一部分是机器人真正进入并改变人们的工作和生活;第三层含义,最重要的,人工智能的使命,是服务于人。我围绕“以人为本”的主题来跟大家分享一点对AI创新的体会。

  第一点体会,AI创新的核心,是技术突破催生行业变革。

  过去10年中,产业化创新集中在多媒体和移动互联网,也就是内容加连接。从2006年的高清视频通信、基于PC的流媒体,到2007年,iPhone的出现,推动了我们从PC时代进入移动互联网时代,短短几年时间,到今天,这样一个小小的设备已经承载了大量的应用,也由此产生了海量的数据。回头我们看2006年到2015年这样十年的视频通信迅猛的产业化,它是从数据推动技术,而技术又反过来促进计算平台的加速发展,而计算平台上面产生了更多的应用,因此也产生了更多的数据。如果我们再往前看10年的话,这样的迅猛产业化,实际上是基于再往前的10年里面,我们在视频、图像的编码、处理,以及在通信领域大量的技术成果。

  AI领域的创新,本质上并没有改变技术突破或者说技术积累催生行业变革的科技发展潮流,只是更加迅猛。过去10年中的一个重大技术突破,就是深度学习。以深度学习、强化学习为核心的机器学习算法,结合海量的训练数据、GPU为代表的高性能计算平台,奠定了人工智能创新的基础。在算法、数据、计算平台之上,智能的核心在两个维度,感知智能(Perceptual Intelligence)和决策智能(Decisive Intelligence)。最后,智能的体现,需要一个场景X。Google的Alpha Go,就是在围棋这么一个场景下,通过算法+数据(3万副棋谱,3千万棋局)+计算平台,实现了感知和决策两层智能。未来的10年,是人工智能催生行业变革的产业化10年,而AI的技术和产业化创新,可以说都在围绕这几个方面,而核心的一点,就是找到场景这一个X。

  人像识别可以说是一个技术突破+应用创新很好的例子。传统的静态人脸识别在配合式场景下进行识别,对人脸角度、图像质量的要求都比较高,核心是解决“TA是谁”的问题;深度学习技术结合大规模人像数据,大幅提高了人像识别的准确度,使得动态、非配合场景下人脸识别成为可能,不止可以解决“TA是谁”,还能够解决“TA在哪儿”的问题,实现科幻电影里面的在人群中精确搜索的场景。

  云天励飞在2015年,就基于深度学习人像识别技术、异构计算技术和搜索技术,以“云+端”的技术路线,实现了一套我们叫做云天“深目”的人像智能系统。通过前端智能摄像机实时提取人脸图像,在云端实现基于深度学习的人像特征提取及搜索。在我们的技术路线中,会通过AI专用处理器技术,进一步把人像特征提取植入前端,真正实现视觉识别端智能和搜索挖掘云智能的结合。

  从2015年在深圳龙岗建设108路人像识别前端开始,两年时间里,云天励飞在深圳已建设在线智能前端设备6500+路,动态人像数据量50+亿,通过警务移动终端,公安民警可以在两到三秒钟的时间内,精准搜索出人像目标在城市中跨区域的活动轨迹。稳定运行近两年,云天”深目“已成为是目前全球最大规模在线运行的公共安全动态人像智能平台,协助破案2000余起,在北京、上海、杭州、新疆等十多个省市以及马来西亚等国家先后落地,是唯一落地北上广深杭五大城市的动态人像识别系统。

  作为“AI+安防”的先行者,云天励飞也积极投身公益,通过与“宝贝回家寻子网”、深圳CID公益合作,用人脸识别技术助力“天下无拐”,找回多名失踪儿童和老人。今年除夕仅仅用了15个小时,从武昌火车站解救了一名三岁被拐带的男童,就在最近,云天励飞动态人脸识别技术还帮助深圳龙岗警方在不到24小时找回了一名患有老年痴呆的82岁老人。在公共安全这个场景下,人工智能创新改变人们生活的价值得到了很好的体现。

  云天励飞目前已经建成最大规模动态场景人像库。从2015年Q4在线前端100+路,动态人像数据1000万+张,2016年Q4在线前端1000+路,动态人像数据5亿+张,到2017年Q4,在线前端已经达到6500+路,动态人像数据50亿+张。在两年多的时间里,我们“云+端”技术路线获得业界包括华为、海康等IT巨头认同,我们对行业应用理解获得公安客户认同,应用效果获得公众认同。AI创新,技术突破催生了视频监控的行业变革。

  然而,人工智能创新也仍然充满着挑战。2016年5月,云天深目上线不久即协助破获重大案例时,某视频民警评语道:“如果(系统)在规模扩大10倍后能够保持同样的效果,那对我们来说是一个革命。”到今天,系统的规模早已超过10倍,但挑战始终存在。

  所以我要分享的第二点是,AI创新,机遇下也充满挑战。

  技术突破是产业变革源头,AI创新的挑战核心仍然是技术挑战。首先是场景。识别场景千变万化,挑战永远防不胜防。任何一项技术或算法,一旦从实验室落地到商用,那么就需要面对规模扩大带来的各种无法预测的挑战。就人像识别而言,随着规模的几何式增长,如何应对千变万化的场景,是人像识别技术最大的挑战之一。其次是规模。随着特征值在不断增长,计算量在几何级增长,数据量在爆炸式增长,人工智能技术创新对存储、计算的规模要求不断提高。以大规模数据规模计算的应用场景为例,在人像布控场景下,以每秒采集100张人脸图像的速度对比一个百万人脸图片的名单,需要实现1亿次/秒的比对;在人像搜索场景下,如果每张人脸图片以2KB的特征值存储,在50亿人脸图片中进行一次搜索,就是10TB的数据规模。

  所以人工智能技术要解决的两个核心问题,始终是“如何准”,和“如何快”。

  解决如何准的问题,应该从算法(Algorithm)、数据(Data)、人机互交(HMI)三个方面着手。围棋人工智能从AlphaGo发展到AlphaZero,通过全新的强化学习算法,不需要棋谱训练就能超越人类智力水平。但从机器学习的角度来说,围棋的规则本身就是监督信息,就是数据源头。在包括人像识别在内的绝大多数场景中,大量的、涵盖场景知识的训练数据仍然是需要的。算法是解决之道,数据是核心途径,可以说数据是AI的原材料。

  在感知智能的场景中,数据的质量也是识别精度的保证。前端实现深度学习感知智能,可以有效提升采集数据的精度和质量。一方面,算法硬化、智能前置,将图像传感升级为视觉传感。另一方面,工程实施质量也是前端数据精度、质量提升,一个容易被忽略的关键点。

  在围绕人的识别中,从生物特征拓展到外延特征,实现人脸->属性->服饰->体态->行为特征的多维度识别,也是提升识别准确度的一个重要方向。最后,设计出“聪明的”人机交互,在人工智能技术的实际应用中,科技公司可以通过对业务和客户需求的深刻理解,智能的告诉机器人工智能的需求,更智能的引导机器完成人工智能的任务。

  解决如何快的问题,可以从算法(Algorithm)、架构(Infrastructure)、处理器(Processor)的角度进行思考。在快和准的问题上,算法始终是基础。算法结合分布式计算架构,结合面向算法加速的专用处理器,是解决如何快的基本思路。在人像智能这个场景中,我们通过“云+端”的计算架构,在采集识别上实现端智能,通过专用神经网络处理器和模型压缩等嵌入式AI技术,提升感知速度,减少传输依赖;在搜索挖掘上实现云智能,通过子空间分割的向量搜索技术、内存计算,以及从CPU到GPU到XPU的硬件加速方案,实现海量人像数据的秒级乃至毫秒级搜索。

  在解决人工智能技术产业化的挑战中,在“算法+数据+芯片(计算平台)“的基础上,还需要加上”场景”和“工程”,才能形成一个端到端解决方案,形成一个AI闭环:数据为智能源头,算法为应用基础,芯片实现高效计算,场景落地解决实际问题,而工程则是保障体验的最后一公里。

  我要分享的最后一点,回到我的主题,AI创新,以人为本。

  AI的使命是服务于人,提供更加安全、健康、便利、愉悦的生活。人工智能技术的本质,是机器通过感知实现最优决策,帮助人们完成任务,代替人们完成任务,延伸人们的触角,满足人们对安全、健康、便利和愉悦更高的需求。人工智能的未来,是机器人的时代,有形的机器人,云端的机器人,各种场景,各种形态。人类需要学会与“机器人”共同生活。

  英国作家查尔斯 狄更斯在其作品《双城记》里曾经用“这是最好的时代,也是最坏的时代”描述工业革命。人工智能的时代也是如此。目前人工智能的研究才刚刚起步,需要探索的空间还非常广阔,研究者们热情高涨,产业变革的机遇巨大,可以说这是最好的时代,但伴随而来的是可以预见的隐患和挑战。人工智能技术要走向成熟,催生各个行业的变革还有很长的一段路,技术的突破和X的寻找,都充满挑战,对创业者来说,也充满竞争。这也是最坏的时代。但AI的未来,就如这一句英文所描述

Adapt or perish, now as ever, is nature's inexorable imperative.
               - H. G. Wells, A Short History of the World (1922)

  人工智能有未知更有未来,通过人工智能技术赋能百业,逐步实现人类生活的安全、健康、便利和愉悦,未来人工智能将无处不在,更好的时代将会到来。

微信扫描二维码,关注公众号。