4月2日,2017中国(深圳)IT领袖峰会正式开幕,腾讯董事会主席兼首席执行官马化腾、百度创始人、董事长兼首席执行官李彦宏、微软全球执行副总裁沈向洋围绕“人工智能”的主题进行了高端对话。
马化腾由“绝艺”谈到腾讯对于人工智能的理解,他用了“恐怖”这个词汇来描述对于AI强大的自我学习能力的感受。李彦宏谈及了百度在非常早的时期布局人工智能的缘由,他还认为,人工智能并不是互联网的一部分,而是颠覆性的技术革命。沈向洋博士谈到现阶段微软在人工智能方面的主要方向,是交互式人工智能。以下分别是马化腾、李彦宏、沈向洋对话实录,编辑整理。
马化腾:没有场景支持的AI研究,是空中楼阁
问:腾讯为什么重视人工智能,为什么做绝艺这个项目?
马化腾 :其实李彦宏是人工智能走得更前了,对腾讯来说我们还是落后一些,只是去年刚开始成立的部门。当然在我们所有BG内部结合它的业务形态,像我们微信里面,超过上百亿条消息,包括我们图片、特别是做社交网络,里面有人脸数据图片绝对是天文数字,每天高达上十亿张有人脸照片。这方面的技术研究在各个BG有相当长时间研究。包括后台数据分析、广告匹配都用了人工智能技术,只是大家感受不到。因为他在后端。我们在前端也希望做出一些产品,刚好一年前Alpha Go它的paper出来,通过人机对战让全世界对人工智能认知到了一个新的高潮。我们团队本着练兵的心态也做了尝试。
谷歌收购了deepmind团队发表的论文,原来做计算机围棋的团队都纷纷采用深度学习方法来融入原有的似乎已经走进瓶颈的计算机围棋软件开发中,大家不约而同在这一年中起步。我们内部团队有三个团队也在做,只是分在不同部门。这个部门刚好是它能够突破这个瓶颈,也动用了公司相当的大的后端的计算机资源,绝艺和Alpha Go最大的不同,是我们的绝艺AI的成长,全程得到了国家级围棋世界冠军的陪练,然后找出它为什么不同。我们十几位研发人员不懂围棋的,一开始连黑先下还是白先下的规则都不懂,我们从计算机原理、工程实现以及结合中国包括很多的专家来去训练。
我们觉得绝艺算是小小的成功吧,但是也不能过于欣喜,毕竟是站在前人肩膀上,因为你没有发布这个paper,我们也不可能做出来。但是也不能说这是毫无疑义的事情。这里面给我们最大的思考,过去我们对AI很多是从一些规则、从简单的训练得出来的能够改善我们计算处理的这样一种能力,最终我们发现其实还有一个更恐怖、更深层的意义在于他能够在计算机的后台能够用云计算、大数据方式能够高速的自学习,能够自己跟自己对弈。所以AlphaGo出来后,它的下一代master,经历了数十亿盘自我对弈,已经超越过去所有人类交战的盘数,然后它自己寻找规律,找到的已经远远超过人类过去在围棋领域认知的范围,是极大的扩展,这是给我们一个很大的启示。
在很多的领域——围棋以外的领域,不管是医疗(刚才讲的病理的检测),以后的金融,现实中的每个行业,如果能用计算机后台做出一个模拟器,能够让它充分尝试,就像开车一样,你可能不用教自动驾驶怎么开车,就模拟一个现实环境,给它一个规则,让它驾驶,它去撞,有各种反馈,自然会琢磨出一套理论和经验,这是给我们带来巨大思考。在很多领域如果能做出模拟器,定义出很多参数,自己学习,他能找到规律可能远超我们现在想象的。这是我们最大的启示。
问:人工智能要取得突破性进展,是模仿人的神经网络、人脑的效率,通过仿生人脑思维的方式突破,还是完全不一样的方式?
马化腾 :我们期待有本质性的飞跃,比如说发现飞机的空气动力学、流体动力学和鸟不一样的,车轮和人型马一样,仿生是某些垂直的领域,包括围棋是选非常窄的领域,通过各种参数训练。
郭为刚提到用AlphaGo下一盘棋消耗多少能源,垂直领域训练消耗能源,但是实际用消耗不了多少。现在训练出来的单机版本跟职业棋手差不多,训练需要很长时间,最麻烦的是改一个参数,规则改一点、算法改一点,全部重新来消耗很大,所以这属于很窄的技能模拟。
未来下一步到通用的,再下一步是不是有更本质性的发现背后的原理,智能其实可以超越现在碳基智慧,是不是有其他的元素可以形成更高级的生命和智慧呢?这是超越人类现在发现的知识,这是有可能的。
有人突发奇想说,现在认识的宇宙是高智能生命用量子计算模拟出来的环节,一切都是模拟起来的,这是发挥大家脑洞大开的想象力吧。
问:有没有可能把数据分享出来,让这些创业公司来用?
马化腾 :这个问题在内部我们也有激烈讨论。首先看人工智能我们关注那几块,第一个是场景。第二个是大数据。场景就是你想把这个技术应用在什么场景下,你是不是有高频的跟用户接触,这是一个落地的很重要的地方。所以我们看到很多研究院也好,包括我们内部研发团队。如果没有场景落地,没有平台支持,基本上就是空中楼阁,研究一半很难往下走。第二个是大数据,大数据也是从平台、业务部门有大量实际运转数据才能产生出来。但是这里面很多大数据是垃圾数据,因为没有标签,每人做规划定义,用多好的算法也学不出来,学出来也是走火入魔,没有用的。数据清洗、标签化难度非常高,我们甚至要雇佣很多人用人手的办法,先用人脑清洗干净,再让AI学习。这里面是一个混合结合的过程。第三,计算能力,也就是你有云的资源,拿几十万核的计算能力,CPU、GPU,我们还是有这个能力的。而且在云里面本身就可以很好的调用,这是我们第三个优势。第四个,一年前我们比较缺乏的就是人才。通过一年我们也招了挺多的人,我们在微软、在西雅图还设置了一个实验室。因为很多微软的人不愿意离开西雅图,所以我们就在旁边设,没有办法,人才就是这样。几个方面结合起来才有办法真正在某一个领域看到它的成效。
我们现在观察到很多的AI所谓的大拿们,他们更关注怎么落地,能不能把毕生研究成果能够体现出来,所以在我们内部在吸引人才的时候,往往也会说你们微信、手机QQ里面的平台数据能不能给他们用,但是事实上大家都知道,BG、部门里面的平台他们也很希望近水楼台先得月,数据就在我身边流动,我为什么不能招人先研究一把,为什么给你呢。我们现在还处在内部怎么把数据分享出来这个阶段。当然这里面还有一个用户很关注的个人隐私,别把我的数据都卖了,到时候大家都知道,这里面还有一个很复杂的信息安全个人隐私脱敏,你是不知道无法根据数据倒推到哪一个人做了什么事情,我们要把这些处理干净才能往下一步谈。这里面数据清理到什么标签,才能给其他部门、包括外部合作伙伴怎么用。同时有很多数据来自合作伙伴,业界其他公司,他们也遇到这样的问题那者一堆裸数据不怎么用,这样业界还要有一个标准,互惠互利交换,这是一个大方向,还有很长的路要走。
李彦宏:人工智能不是互联网的一部分,它是颠覆性的
问:当年百度为什么那么早做人工智能布局?
李彦宏 :我其实也思考过这个问题。从百度的基因来说,我们从一开始成立到现在最主要是做搜索。搜索本质上是机器试图理解人想要的东西。我们一开始用各种各样计算机方法试图理解人的意图。我在想一个问题,深度学习在图像检索里头的效果不错,是一个偶然还是它代表一种趋势?分析完之后,觉得它是代表一种趋势的,它不仅仅对于图像搜索有用,它对很多其他计算机科学要解决的问题都是非常有用的。原因就是,随着互联网这么多年发展,数据越来越多,越来越丰富,计算资源越来越便宜,越来越强大。人工智能有60年历史,前50年,为什么大家不看好,为什么大家觉得人工智能没有用?我在美国读书的时候,我就很喜欢人工智能这门课,但是学完之后,教授告诉我说其实没用,人工智能没有一个真正有商业价值的应用,你将来靠这个是找不着工作的。
到现在最近几年,原来认为没用东西变成有用,是因为市场环境变了,条件变了,原来认为不可能的事情现在变成可能了。分析了环境因素之后,觉得人工智能是代表未来的。所以我们在2013年1月份对外宣布成立深度学习研究院,这个可能是全球工业界第一个用深度学习来命名的这么一个研究院。而且等于我自己食言了,我2013年以前不断跟外界说我们是一个商业公司,我们不应该成立研究院,不应该搞纯的研究机构,这些机构要想转化成产品,进入市场被市场所认可的话,应该跟那些产品部门、跟那些业务部门紧紧结合在一起,而不是单独成立一个研究院,但是深度学习这一波起来之后,我觉得是完全不一样的东西,他需要在理论上、在算法上,在很多方面有长远的布局和突破,所以从那个时候开始大规模投入去吸引人才,去推进算法,其实不光是算法,在刚才朱民讲的时候也讲到各种各样芯片结构层、CPU到GPU等等,都要审视算法的需求。所以现在看起来人工智能比2013年我们决定进入的时候一个更要大的产业。前一阵我对外讲了,互联网其实现在只是一道开胃菜,真正的主菜是人工智能,所以人工智能不是互联网的一部分,不是互联网第三个阶段,它是堪比工业革命一个新的技术革命。
问:百度深度学习有一个开放的平台,你们不觉得这样开放以后会培养出竞争对手?
李彦宏 :我觉得人工智能是一个非常大的产业,而且是会持续很长时间。像我们现在的判断未来20-50年都会是一个快速发展的人工智能时期。在这种时代大潮下,显然不是一个公司能够把所有的事情都做下来的。相反,对于一些小机构没有这么多计算资源和长远研发能力,但他们可能会对垂直领域的了解更加深刻,我们为他们提供一些这样的平台,让他们去做,这会推动整个人工智能技术的发展。而且我们也能够在平台上看到大家在干什么事情,哪些方向发展的会更快,哪些领域更适用于现在已经解决的技术。所以我们把平台开放出来,对大家都有益。
我刚才讲人工智能永远不可能超过人类的能力,但是当他逐步逼近人类能力的时候,其实已经是可以一个一个行业去颠覆掉。比如说人脸识别这种应用,我们今天如果你去机场的话,要过好几道安检,又要把身份证拿出来,比对一下,其实人脸识别这个问题解决后,将来到机场就应该大摇大摆就过去了,他那个摄像头可以识别,不需要一道一道检查的。我们在家里自己开一个Party,不可能每个人进来先把身份证看一看。但是人多了,几千人、几万人,甚至更多人的情况就要用现在比较笨的办法一个人一个人对他的身份,但是现在这个问题基本上解决了。比如百度大厦,我们那个闸机就是刷脸可以进,到哪儿直接过就可以了。这还是人脸识别一个东西。语音的识别、自然语言的理解等等,都是可以。未来人和物的交流方式,人和工具交流方式,不是人学习工具怎么使用。人和动物的区别就是人发明了工具,但是人发明了工具之后,是发明人写一个用户手册告诉你这个东西怎么用,电视怎么用、冰箱怎么用,这些东西,电脑手机怎么用,我们要学习用键盘,小时候都要学打字。但是未来应该是机器、工具学习人的意图,以后人再也不需要学习工具怎么用了,我要这个工具干什么,他就能够明白,这就是我希望用人工智能方法解决理解人的自然语言,以后人和机的对话、人和物的对话就变成一种自然语言的对话,这是未来几十年可能代表人工智能发展最大的方向。
沈向洋:每一个商业应用都会被人工智能颠覆掉
问:人工智能有哪些非常具有潜力的商业应用?
沈向洋 :我自己从研究生开始到现在,从事人工智能的研究也有20多年的实践。看到现在人工智能如火如荼,我很激动,因为当时90年代中期我们毕业的时候连像样的工作都找不到。
我觉得人工智能经历了多少个冬天之后,发展到现在这个样子,主要还是因为三个方面的原因。第一,是因为大量数据的出现,第二,是强大的运算能力,摩尔定律到现在,大家觉得应该会死掉,但是并没有,持续有更多新的计算方法出现。第三,是深度学习技术的突破,以前很多不能解决的问题,现在可以解掉。
从人工智能基本和研究方向来讲,还是两个不同非常不一样的阶段。一个是人类感知这件事情上,我们讲人工智能,原来对人工智能的定义就是跟人类智能相比较。人类的智能体现在哪?主要是两方面,一个是感知方面、一个是认知方面。感知方面,刚才我提到这几个原因,所以在接下来5-10年进展会非常快。具体表现在计算机语音和计算机视觉发展,我觉得AI会超过人。很多人会同意我这个说法。第二方面问题大家今天还没有搞的很清楚的地方是人工智能的认知方面,包括自然语言,包括知识的获取、包括你对一般的情况下这种解决的方法这样的思考,包括情感,这些东西今天我们还都是不知道。所以我是觉得现在是非常好的时代。激动之余的话,我觉得我们作为科研人员还是要有一个平常心,因为很多科研进展还需要一些时间。
从微软公司来讲,我们的研判是,短期之内有非常非常大的一些商机。那具体到哪些行业有商机呢?如果这个行业已经有相当量的数据,并且这个行业的从业人员对现状并不满意,那么这就是人工智能有商机的地方。从销售、人事、客户支持等方面,每一个商业应用都会被颠覆。
我们公司内部一共有7000多个工程师和科学家,但是我们还在继续招人。
我觉得微软在中国最近几年推出的最了不起人工智能产品,就是微软小冰,这个产品面对的是比较年轻的人群,大概18到20多岁的一个用户群,因为这个年龄段的人更愿意花时间跟聊天机器人对话。所以我们跟QQ的合作,也主要是为了面对这样一个用户群。我们在推小冰这样一个产品的过程当中,学到了很多的东西,所以我们现在主推的研究和产品方向,就是对话式人工智能。
问:如果大家愿意开放数据合作,微软是不是感兴趣这个事情?
沈向洋 :作为大公司来讲,特别是成功大公司来讲,我们对社会有一个责任,对行业有一个责任。当我们行业做的很成功,第一件事情就是开研究院。现在Pony也开研究院,唯一做的不对的就是开到微软门口去了(笑)。我也想分享一下在微软的工作经验,你说叫这些公司把数据拿出来,让初创公司或者其他公司去用,我觉得不见得很现实、不见得很容易。但是我想鼓励大家,很多的数据如果我们愿意花时间、花精力做一点处理,然后让研究人员去用,完全是可以做到的。我们微软出了两个数据集,一个是计算机视觉标准方面的集,这样可以做数据分割、物体分割。最近做了另外一个数据集是在自然语言,希望有一批新的做问题问答。这样推动研究领域,大家在标准集下,不断把标准集数据越做越多。我们做的方法是用搜索引擎数据,非常小心处理过,包括很多隐私的问题等等。拿出一些数据让大家做研究是非常实际的,完全可以做到。
微信扫描二维码,关注公众号。