距离1956年人工智能之父马文·明斯基提出“人工智能”的概念已整整过去了60年,其间商业化的浪潮一直迟迟未至。之前,尽管有微软、谷歌、Facebook等大公司不断投资人工智能技术,但大多把研究成果用于自身业务的优化与效率提升,未能激起多大的浪花。直至人机大战重新夺回大众的关注点,人们才意识到,人工智能商业化不知何时已悄然开始布局。
实际上,从图像识别、语音识别的细分角度看,今天的人工智能商业化已经让大众受益颇丰。然而就在10年前,今天市面上可以见到的Siri、人脸识别等仍是天方夜谭,人工智能商业化的前提到底是什么?更快的计算机、更多的数据、更高级的算法为了达到人工智能技术落地的可能,无数科学家试图给出可行的方案。与此同时,市场也在用商业的力量和逻辑,加速人工智能产品迭代,掀起一番巨浪。
AI大潮下进击的巨头们
人机大战折射出的现象是人工智能早已成为巨头们发展的方向,“深度学习”成为竞争的焦点。事实上只有更多的开发者加入人工智能领域的研究、不断推动技术进步,才能实现商业化的最终目标。因此可以说,谷歌大张旗鼓赢得与李世石的比赛,打响了巨头们之间又一轮竞赛的起跑枪。同样斥巨资布局人工智能的还有Facebook、微软、苹果等多家商业巨头。
苹果公司早早推出了以Siri为代表的人工智能应用,通过收购和自主研发完成对人工智能的提前布局,在语音、图像、机器学习都有产品覆盖。相对于苹果,谷歌和Facebook在人工智能领域的努力更容易为外界所捕获。
对于谷歌来说,Alpha Go只是其人工智能计划的开端。除了AlphaGo,谷歌还推出了基于人工智能的新搜索算法的Rank Brain,联手福特研发了无人驾驶汽车、D-Wave量子计算机测试,并将人工智能融入聊天。后起之秀Facebook则于2015年6月在欧洲成立人工智能研究中心,试图建造能够理解海量数据的人工智能机器。值得一提的是Facebook一直是开源人工智能技术的积极推动者,Facebook日前开源了三款图像分割软件工具,三者相互配合可以完成一个完整的图像识别分割处理流程。此前,Facebook还曾在Torch上开源了一些功能强大的深度学习工具。
不同于谷歌和Facebook的吸睛,微软在人工智能领域显得十分低调,但其实早在1991年微软便成立研究院,专攻人机交互、自然语言处理、机器学习、语音识别和语音合成、计算机视觉5个方向。而这些,不论是在学界或是业界,恰恰成为了人工智能最重要的分支。
目前微软在中国为人熟知的产品是人工智能虚拟机器人小娜(Cortana)和小冰。小冰在中国即时通信软件巨头微信上运行三天后,获得了150万条聊天记录。之后,小冰入驻微博,成为最受关注的账号之一。尤其是小冰与网友的“舌战”赚足了眼球。小娜则更像用户生活中的人工智能助手,在今年3月微软举办的Build大会上,小娜成功算出了“主人”最有可能到家的行程和时间,并在“主人”到家前的5分钟让家用电器启动。
力图在人工智能领域“后发制人”的微软日前宣布收购了人工智能调度工具Genee,并表示或将把它融入云服务Office 365当中,这表明微软正计划人工智能助理的多领域用途。事实上,微软不仅将人工智能技术应用于Windows、Azure等核心业务中,还构建了开放的平台,将多年的技术积累开放给产业界,它的野心是打造一个人工智能生态圈。
除了BAT,还有谁在AI+?
目光放回国内,除了众所周知的BAT在人工智能领域有着较为深厚的积累,还有一批进击的巨头们在不断探索。8月12日,搜狗、华为、小米、360等巨头在“全球人工智能与机器人峰会”上,对人工智能商业化场景进行了一番探讨。关于人工智能的现在和未来,大佬们都说了什么?
“从搜索引擎产品的从业者来讲,我们认为搜索引擎其实是人工智能最大的一个场景。”搜狗CTO杨洪涛表示,得益于互联网的发展,足够的应用、信息和用户量产生了海量数据,这让搜索引擎公司有了更好的算法,能大批量、低成本地将计算力连接起来。
8月3日,搜狗推出语音搜索引擎——“知音”,并融合了吞音优化、语音纠错以及多轮交互三个全新的功能。杨洪涛介绍,目前搜狗的智能语音技术已经成功应用到搜狗的全线产品中,随着搜狗在自然交互与知识计算方面的不断完善,加之与行业内其他领先企业的深度合作,“知音”将会布局到更多的终端入口,在物联网、车联网、人工智能等各个方面以“任务+应用”的形式在特定场景上发力,如汽车和智能家居。
不过,搜狗的智能语音技术不是一个卖技术的商业模式。搜索引擎公司在背后能够提供的不仅仅是语音交互,它本质上是技术应用对企业和用户产生价值的一个过程。对信息的掌握和服务的整合产生的价值,将会极大地满足和促进市场的需求。
作为一个互联网公司,搜狗布局人工智能或许并不令人意外,但很多人似乎不知道华为也早已开始布局人工智能,并成立诺亚方舟实验室,发力AI方向的产品和技术。
“华为诺亚方舟实验室在进行人工智能研究和未来技术探索的同时,主要还将关注终端产品的智能化研发。”该实验室主任李航说,他们的目的是打造一个全智能化的智能移动手机终端,用户将通过自然语言的方式从终端获取一切想要的信息和协助。该实验室成立4年多以来,主要关注人工智能、机器学习、数据挖掘等前沿科技领域的研究。
目前华为诺亚方舟实验室已经推出了两款产品,分别是华为手机上的App市场及“手机服务”App。面对3亿用户,每天3000万次检索,1亿次下载总量的大数据挑战,前者能够智能化地为客户提供检索结果和推荐App;用户可以用自然语言的方式向后者求助在手机使用过程中遇到的各种问题,在每天10万次当量的问题求助中,有超过90%的用户都可以得到满意的回答。
而根据华为公布的2015年年报的内容,在人工智能领域,华为在深度学习上持续突破,取得了不错的成绩。基于深度学习,华为研究出了业界最先进的神经应答机,发布业界第一个基于深度学习的单轮对话生成模型。所谓神经应答机,就是一个单轮的对话系统,用编码器将问句转换成中间表示,再用解码器将中间表示转换成回答。
比如你说:“我想买一部iPhone”,系统回答:“还是支持一下国产的吧”。事实上,这一句话并没有提前写入对话数据中,而是系统在看了许多对话例子后自动生成的反馈。除此之外,华为还研发出神经机器翻译(Neural Machine Translation)技术,能够支持深度记忆框架,达到业界一流机器翻译能力。
和华为类似,小米的人工智能布局也着力在终端上。“人工智能的发展离不开这三个前提:产品、大数据、机器学习。”小米科技联合创始人黄江吉,带着对一系列小米智能家居设备的介绍,在大会上分享了小米对人工智能技术发展的方法论。
机器学习与大数据离不开高活跃度的产品,这些产品包括常用软件和手环、电视盒子、网络设备以及智能家居等智能硬件。黄江吉提到,小米手机有两千万MIUI系统用户,其中日活跃1000万的应用有8个,而日活跃超100万的有17个。这为大数据和机器学习能力的提升打好了基础。
当高活跃度的产品须落地时,就会产生大量数据,而建立高质量的数据,则通过数据采集,数据清洗,数据挖掘,数据智能等方式来实现。任何数据最终都是为人服务,因此建立每个人的用户画像就显得尤为重要。小米为建立用户画像收集了各个场景和各个碎片时间产生的数据,数据量共达200TB。
黄江吉表示,只有将硬件做好才能培养用户的忠诚度,从而产生批量数据,“产生了这个数据之后才可以去机器学习、深度学习,让它反过来变成一个数据模型,把你的产品做得越来越智能,才可以把它的体验度做得越来越好”。
“武术大家都热衷于名门正派,你不仅能把别人打败了而且还能提炼出一些招式来,希望这些招式能帮助别人在格斗的时候获胜。在学术界的人工智能研究与武术这一点就很像。而在工业界,这些招式就变得不那么重要,重要的是你能有一种武术,或者一种合作的方式能把别人打败,把一个问题解决掉,这就是好的人工智能。”学界出身的360人工智能研究院的院长颜水成,在大会上这样解释先后在学术界和工业界与人工智能打交道的感受。
直到2013年,学术界还能在人工智能竞赛中拿下第一,但是到了近两年,颜水成发现好的成果都是从互联网企业出来,这也是他接受360聘任邀请的原因。过去两年,360向市场推出了一系列智能硬件产品,其中很多依托人工智能的技术。如360智能摄像机,依靠的是飞速进步的图像识别技术和大数据技术,如今能智能侦测移动物体,家里无人状态下门窗被打开,它会发出警报。而360周鸿祎更是放话360要利用IOT技术解决人们的出行安全、家居安全、儿童和老人的安全。
华为进入无人区、小米神话遭遇平台区,进入2016年,一大批公司再遇到发展瓶颈。如何突围,成为了每一个巨头不得不思考的问题,人工智能将成为助力破冰的关键。
细分市场再起风云
如若把人工智能具象化为“人体的延伸”,构造“眼耳鼻舌身意”则是迈向人工智能的系统性工程。在人类的各种感官中,视觉负责接受80%左右的信息。同理,计算机视觉也成为人工智能研究的重要方向。
这门致力于教会机器“看”的科学,实质上是让摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,而后进行图形处理,试图从图像或多维数据中获取信息。计算机诞生50多年以来,计算机视觉经历了从感知到认知的发展,主要有特征提取、图像标注、图像理解和图像的深度理解4个阶段。
计算机学会用人的方式看懂世界,将人从繁琐的劳动中解放出来,无论是巨头还是初创公司都企图抢滩计算机视觉的商业化市场,尤其是2012年深度学习崛起后,不少该领域的创业公司大放异彩。
微软最新的深度学习系统在2015年的Image Net计算机视觉识别挑战赛中,将计算机视觉系统错误率降低至3.57%,相比于人眼辨识的5.1%,这是人工智能首次在识别图像的正确率上超越人类水平。这些机器由微软的Azure云服务提供支持。
“在2012年引入深度学习之前,图像标注的错误率高达28.2%,而自从引入了深度学习网络分析模型,机器标注图像的错误率已经从2012年的16%降到了2015年的3.5%,而神经网络分析模型的规模也增加到152层。”微软亚洲研究院常务副院长芮勇向记者介绍,微软研究院的计算机视觉技术已处于世界顶端。
全球人工智能公司多专攻深度学习方向,而我国超过70%的公司主攻图像或语音识别两大类别。最早一批获得投资人和市场认可的科技创业公司中就不乏图像识别的佼佼者。
获得百万美元A轮融资的Face++在2012年抓住机会,进军人脸识别技术和相关产品应用研究,通过“脱敏”技术掌握了500万张人脸数据库。阿里巴巴现已携手Face++探索计算机识别的商业化场景,旗下支付宝的“笑脸支付”就采用了该公司的技术。
格灵深瞳则是另一家引人注目的计算机视觉创业公司,他们获得了来自红杉的数千万美元A轮融资。这家公司选择以“安保”为切入口,做出了深瞳人眼摄像机,不仅可以极速全场景抓拍,每秒可抓拍超过100张人脸,还可看清80米外的人脸。此外,格灵深瞳现在也介入了汽车视觉业务,技术注入驭势科技等新兴创业公司。
和计算机视觉一样,自然语言处理也是人工智能的重要组成部分。计算机语言是人与计算机之间传递信息的媒介,计算机系统最大特征是指令通过一种语言传达给机器。
Siri和小冰均是自然语言处理技术落地的产品,但用户对其印象仅仅停留在娱乐层面,两者在回答问题中还存在很多的问题。确切说,目前语音识别虽已达到很高水准,但是语义分析仍旧有很长的路要走。因此,在整体语音识别率差异较小的竞争环境中,语义分析的算法优劣和切入的使用场景就成为了NLP(Natural Language Processing)产品最为重要的条件。
前谷歌科学家林德康今年回国后加入了“奇点机智”,并参与了该公司的语音助手项目——“小不点”。这项语音助手并不是用来回答问题的,而是为手机添加了一只无形的手,代替人手的功能,完成一些基本的点击和输入操作。如果你对“小不点”说“买一张后天上午北京到上海的飞机票”,它就会打开订票APP,然后自动输入北京到上海的飞机票以及时间。同一件事,其他语音助手也可以做,但需要跟相关App合作拿到相关软件接口。而林德康的语音助手则不需要,走的是人正常操作手机的流程,只是代替人操作,从而实现了自动化。
看起来,林德康只是做了一个小软件,实际上,在这个小软件背后,他们想探索的是手机交互上的一次变革。它的切入点是语音,核心则是从把用户语义转换成App间操作的能力。
在语音识别领域,“云知声”入局更早。2015年底“云知声”完成了B+轮数千万美金的融资,并开始了对公司品牌的升级——从智能语音公司,到物联网人工智能服务商。云知声布局人工智能,首先推出的是一个“云端芯”的概念。这个概念简单解释就是通过芯片将终端和云端连接起来。基于这个概念该公司开始实践人工智能。云知声要做的,是将AI芯放进从家电到汽车的各种产品里,让它们都能连网并通过语音交互连接至云端服务。目前云知声主要瞄准家居、车载、教育、医疗四块市场,其中前两块是重中之重。
深层探索,AI商业场景更进一步
计算机语音和视觉技术让计算机有了“开眼看/听世界”的能力,对接收到的信息进行进一步分析和判断,则成为了人工智能商业化的深层探索。
金山软件CEO张宏江透露:“人工智能发展速度如此之快,离不开大数据和云计算。我们看到的未来是前端一系列的智能设备,而它的大脑实际上在云里面。”AI+大数据+云正在成为企业的标配,现在的企业需要大数据的支撑,而大数据要靠云来支撑。云计算和大数据已在医疗、政务、游戏等领域成熟运用。
香港科技大学教授杨强表示人工智能要想获得成功,需满足以下5个条件:“人工智能有很多领域,到现在为止最成功的一个领域就是机器学习。”杨强说,“机器学习的一个基本概念就是从数据里面经常重复的现象汇总出规律,从而把现实中简单重复烦琐的工作给替代掉。”
技术落地,哪些硬件夺人眼球?
无人驾驶、无人机和机器人领域就是结合了计算机视觉、语音识别及深度算法等技术呈现出来的人工智能商业化场景。
大疆无人机近年来在无人机市场风头正劲,“未来我们还要做得更加精准,把99%变成99.9%,这就是工匠精神。”大疆创新副总裁王帆谈起大疆的未来显得十分自信,“从室内到室外,无缝对接,我们的产品不会产生任何偏移。这才是基本的、关键的、核心的,而不是其他花哨的功能。”
同属“无人系列”的智能汽车,无论是在经济体量还是商业多样性上更为热闹。从自动驾驶到无人驾驶,甚至是智能汽车领域的共享经济思维,有关“自动驾驶”和“无人驾驶”的消息持续霸屏,热度不减。
智能汽车生态圈的打造并非空想,神州租车首席信息官刘亚霄直言:“计算机能下赢李世石,也一定能下赢三轮车。”
事实上,神州专车以及神州租车在2015年也在智能驾驶方面做了大量的技术投入。神州想要构建的是一个以自动驾驶、车联网等技术为基础的开放性智能汽车运营体系。现在,神州专车在客户端通过应用集成驾驶,把汽车的租赁、专车、安全驾驶行为融合在一起,变成一个真正的车场。
眼见无人机和无人驾驶的商业化之路不断拓宽,机器人的商业场景路径也愈发令人畅想。尽管学界对机器人的探索有共融机器人、机器人灵巧手、软体机器人等多个研究方向,不过在机器人的商业化领域,产品的同质化严重,不少企业仍处于“摸着石头过河”的阶段。
“等到机器人市场真正爆发的时候,每一个细分领域都会有强者出现,机器人还是要聚焦到垂直领域来把它做透。”乐橙CEO梁磊认为应该从用户的角度出发,盯着垂直领域做机器人。
梁磊表示,乐橙最开始关注的是toC的市场,考虑的是围绕着视频领域在监控、安防以外延伸更多的功能,在调研了很多家用产品之后,发现家用视频应用场景特别丰富,很多用户用视频智能技术来看宠物、看小孩、看老人,所以他们决定基于用户深挖一个产品,最后决定做母婴领域。
乐橙关注的是“看得见摸得着”的机器人,达闼科技CEO黄晓庆感兴趣的却是“云端机器人”。“宏观的理解,就是把机器人的大脑放到云端,然后用网络接到一个机器人的身体上。”黄晓庆描述,“也就是把机器人变成三个部分,把机器人的大脑放在云端,把机器人的神经网络变成移动通信的网络,然后把机器人的本体变成一个阿凡达,这样就形成了一个云端机器人。”
黄晓庆表示达闼科技初期会以运营云端机器人的运营商新创企业形象出现,主要的研究在机器人的大脑和机器人的神经网络,未来会做机器人连接云端的控制器,到最后实现家庭保姆机器人。
人工智能的黄金时代已经到来,在这一波AI+的淘金热中,关于人工智能的商业化场景,大企业和创业公司均跃跃欲试。想要梦想照进现实,或许还要等待上游技术的成熟和终端产品的优化。AI能够+出何种未来,值得期待.
微信扫描二维码,关注公众号。