2018 全球人工智能与机器人峰会(CCF-GAIR)在深圳召开,峰会由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办,得到了深圳市宝安区政府的大力指导,是国内人工智能和机器人学术界、工业界及投资界三大领域的顶级交流盛会,旨在打造国内人工智能领域最具实力的跨界交流合作平台。
CCF-GAIR 2018 延续前两届的“顶尖”阵容,提供1个主会场和11个专场(仿生机器人,机器人行业应用,计算机视觉,智能安全,金融科技,智能驾驶,NLP,AI+,AI芯片,IoT,投资人)的丰富平台,意欲给三界参会者从产学研多个维度,呈现出更富前瞻性与落地性相结合的会议内容与现场体验。
大会第三天的“AI+专场”,中兴力维首席技术官曹友盛博士发表了题为“人工智能和城市智脑”的主题演讲,分享了人工智能技术如何应用到智慧城市、电信和公共安全领域。 曹友盛现任力维首席技术官,曾任思科全球研发总监和思科中国研发副总裁,并于惠普、SGI、爱立信等公司担任技术高管。获得美国宾夕法尼亚匹兹堡大学物理博士、美国超算中心超级计算科学博士后学位。
在演讲中,曹友盛认为,人脑不是简单的三维体,而是具有极其复杂的结构。我们能不能用多维的脑袋去设计一个城市大脑、人工智能群体,让这个群体像人脑一样可以进行各方面的考量,这就是力维在考虑的问题。
谈及智慧城市的发展历程,他认为,智慧城市1.0基本上都是在做智慧交通,智慧城市2.0实现了信息共享,智慧城市3.0则是要用“城市五官+城市智脑群”实现术业有专攻。
打造“城市智脑”需要用到三方面的技术,分别是“数据使能”、“数据融合”以及“数据分析”,其中数据分析是最难的,。曹友盛认为它要求更高一层的智能,模拟人脑进行分析,作出决策,这就需要业界能够对自己的业务形成深刻的认识,在此基础上通过数据分析技术,可以才能得出比较有效的选择和建议。
以下是曹友盛博士的全部演讲内容:
曹友盛:正式演讲前,我们先探讨下人类是怎么思维的?现在人工智能都是基本靠“人工”,投入多少人工才会有多少智能。我们是用人脑训练人工智能,实际上这是很不成功的,因为人脑看世界是三维空间,加上时间就是四维。爱因斯坦曾经用超过三维、四维的能力想出一个东西。
以AlphaGo为例,AlphaGo不是靠眼睛、鼻子等五官去全方位判断事物,而是有点“偏才”。比如有些人是弱智儿童,但计算能力很强。它需要把精力集中到一本书上或者一个算盘、一个计算机上,但这时你会失去眼睛、耳朵等共用的功能。
有时候人们为了进行深度思考会习惯把眼睛闭起来,这个时候五官的功能就也会同时被关起来。我们把人工智能分成三类,大的范围是人工智能,中间的一个子集是机器学习,最核心的部分是深度学习。AlphaGo实际上是机器学习,但最后一级用的是深度学习,就是需要关起门来想一想。
爱因斯坦是十三维的脑袋,据说他有十三维的空间,那到底什么是十三维?简单来说,从一开始,上帝就给了我们一组数据:1+2=3,这是一维数据;二维数据是Table、Excel表格;三维数据是数据库;四维数据是数据仓库。深度学习就要到N维了,需要超过四维的想象力,所以我们今天无法像爱因斯坦那样做出他想要的人工智能。
近年来,AI又引领了一波全球浪潮。不管是中国,还是美国、欧洲、日本,人工智能都是一个趋势。2018年我们要怎么做人工智能,接下来我们来讨论这个问题。
人工智能”能否达到“人脑智能”?
人工智能”能否达到“人脑智能”?阿里、百度喜欢用“城市大脑”,为什么我把它改成“智脑”?正如我刚才所讲,具有超强的数学能力的人在某些方面非常强,比如AlphaGo在计算上非常强,但在一些感官等其他方面的感知能力则非常弱,所以我们今天只谈大数据、深度学习是不行的,这是我今天要讲的主题。
力维如何做“人工智能”?人脑是如何被机器模拟的?很多人都会问一个问题“人脑是怎么思维的?”前面我已经讲了,人脑思维分成三种思维:
一是人工智能思维,简单的由五官作出快速判断,快速判断时不需要回到人的脑子里细想;
二是需要专门针对某一方面进行学习,比如AlphaGo学东西,我们把它称为机器学习。
三是要进行冥思苦想的,这一类我们称之为深度学习。在深度学习上,我们认为一定要跟业务相关,不懂业务去做人工智能或者做深度学习是不可能的。
人脑不是简单的三维体,它是无穷复杂的结构,做数据科学的人都会跟你说卷积神经、深度神经等。脑神经不是简单的三维体,是一个多维体,它在思考问题时也不是三维、四维、五维,聪明的人会用N维考虑问题。我们能不能用四维的脑袋去设计一个城市大脑、一个人工智能群体?要让这个群体具有各方面考量,比如睁开眼睛就能用人工智能判断,针对某一数据能进行机器学习,也能做深度学习,有没有这么一个设计呢?这就是力维在考虑的问题,我们认为打造人工智能,三者都要做。
怎么用人工智能做智慧城市?
我们怎么用人工智能做智慧城市?智慧城市1.0基本上是在做智慧交通,到了智慧城市2.0,大家知道信息需要共享,共享后可以进行机器学习、数据碰撞。智慧城市3.0怎么定义呢?以阿里和百度的定义,智慧城市3.0就是城市大脑,即城市有一个大脑,将所有信息到云端汇总,这个大脑可以做各种各样的思考 ,这就是智慧城市3.0的定义。
力维认为,一个大脑不可能解决智慧城市,正如一个城市的管理需要按区域、层级进行划分,需要市长、区长等级别的管理者。如果真有一个大脑能管理城市,也应该是上帝的大脑,我们认为一个城市应该有一群脑。城市还要有五官,既有五官,又要有一群城市智脑,这样才能做到城市人工智能、机器学习、深度学习,并能管理一个城市。
这是百度城市大脑和阿里城市大脑框架,是一个非常完美的城市大脑,自上而下管理城市。
城市智脑的技术路线分为三个阶段:过去做城市智脑时,我们希望把各种各样不同的数据都汇聚到一个中心做机器学习,有点像周末我拿本书,好好学这本书,把这个问题搞明白,将互联网数据汇聚到一个地方,用偏才的方法学习数据,从中得出一个可以派上用场的结论。
这种做法有一个好处,就是可以学得很深,但它也有很多坏处,数据来源单一,缺乏其他数据。当大脑在深度思考的时候,全部都是脑子内部的数据进行计算。比如我们经过机器深度学习,我们从民政局拿到菜价,菜价的波动居然跟一个城市的安全指数相关,这不就是啤酒和尿布之间的关系吗?因此,只有把眼睛闭下来,让机器去做深度学习,才会发现菜价跟城市安全指数非常吻合。
所以在日常生活中,我们既需要往深里想,把更多维的数据在一个可以思考的脑袋中思考,但有时我们又必须要作出快速判断。 未来我们要按照神经拟态计算,接下来会专门讲神经拟态计算,因为我们过去和今天做的并不能完全模拟一个人的神经。
未来我们要依赖三个技术:
一是数据使能。 一个城市需要感知设备采集数据,但是采集进来的数据并不能马上使用,这中间还要有使能过程,何为使能?就是对感知设备采集到的数据进行清洗、处理等。
二是数据融合。 把前面使能好的数据融合起来,转换成一种知识,将有能力的数据融合在一起进行加工,让它成为能够被应用的东西。
第三个技术、也是比较关键的是数据分析。 数据分析是最难的,它要求更高一层的智能,模拟人脑进行分析,作出决策,这个时候我们要结合一些业务,所以必须要对自己所在的行业足够了解。在此基础上,通过数据分析技术,可以得出比较有效的选择和建议。接下来怎么改进,某种意义上来说,机器在这个时段会作出一些判断,这些判断比人脑能想象的东西更深奥。
人工智能和深度学习存在的问题
目前大家都在谈人工智能、机器学习、深度学习。我们认为这里大概有四个困难:
一是机器学习很多时候是用督导式学习 ,首先要大量的数据训练机器,比如AlphaGo,只有进行了很多棋谱训练的AlphaGo,才能跟李世石下围棋。但是很多情况下我们没有足够的数据, 也不能区分这些数据。这种我们称之为无标签数据。
第二是数据样本太少,甚至零样本。
第三是训练机器花的时间很大,要用大量的数据训练机器。 现在市场上有很多人工智能企业,如商汤、依图、旷视都做得很好,它们基本上是在做样本学习,所以需要花费很多时间才能做出一个人脸特征来。
第四是成本问题。 因为计算量、维度越来越大,没有足够的数据和维度,这些样本都很难被计算出来,这种情况下用CPU很难进行计算,所以就会出现GPU,怎么理解GPU呢?CPU是一维的话,GPU就是二维的,现在又出现了TPU。
这四个问题怎么解决呢?一是大家比较关心的小样本,没有什么数据怎么做大数据?这里又要讲到人的浅层学习,即不需要很多数据,人工智能判断很快,这种能力我们称为“元知识”。
小样本挑战我们就是用和元知识相关的元学习和关系网络来进行的。比如这张图,上面有鸡、狗、猫,我们让机器先把鸡、狗、猫的特征提取出来,让它学习。当有一只狗放进去进行识别时,机器就能很快识别出这个东西像一只狗,这就是小样本元学习和关系网络技术。
下面是一些经常用到的技术:K近邻、深度学习与少样本学习、弱监督、无监督学习,增强学习,数据增扩技术,生成式对抗网络。
我们做智慧社区时经常碰到样本特别小,尤其是公共安全领域的视频监控,对行人进行再识别,基本上采样很小,一两张照片就能把罪犯找出来。
解决第三和第四个问题的办法基本上有多个。,其中的一个是采用神经拟态计算,人脑判断一个数据时用的是脉冲形式,而不是一直在想。所以我们需要有一个CPU,它也是以人脑的脉冲形式在想。
其次是期待未来的人工智能更快、更简单、更便宜、更智能,更省能耗。其中高性能计算今天已经可用,量子计算机和神经拟态计算网络即将进入商业化。
一个城市应该有五官和智脑群
最后是我今天的总结:简单来说,一个城市应该有五官和智脑群。 人脑思维时并不是简单的用脑在想,更多时候是用中枢神经和脊椎神经在思考,中枢神经和脊椎神经直接跟感知设备连在一起,判断一个事情并没有连接大脑,是直接在中枢神经、脊椎神经作出判断。
如果今天有一个人跟你说,一定只能是利用大数据进行深度学习,通过学习和模仿才能做出人工智能,显然这是不可能的。这是我们在智慧城市中的机器模拟,首先是五官,各种采集设备;然后通过中枢神经进行数据汇聚,如果这里能作出判断就立刻作出判断,快速作出反应;中枢神经存储、神经网络和记忆思维在这一块,浅层次的做出快速判断,最后是深度学习,也就是能超出人脑思维能力的这一部分。
近年来,在智联网领域,力维不断进行探索和实践,以力维结合最新智联网技术推出的智慧社区解决方案为例,基于社区多维数据汇聚融合以及大数据架构的深度挖掘分析技术,为社区主管单位和社区居民提供更丰富的社区级大数据服务,如人像惠民、社区停车、社区联防、社区指数等,极大提升了社区智能化治理和服务水平。
这就是力维对人工智能和城市智能的体会。谢谢大家!
微信扫描二维码,关注公众号。