来自中国阿里巴巴公司的AI战胜了全球众多知名公司的AI程度,取得了看图后正确回答人类提问测试的桂冠。凭借74.57%的正确率取得了第一名,而排名第二的来自微软公司的AI的正确率为64.78%。
在由美国佐治亚理工大学、FACEBOOK人工智能实验室等机构创办的视觉对话大赛上,来自中国阿里巴巴公司的AI战胜了全球众多知名公司的AI程度,取得了看图后正确回答人类提问测试的桂冠。凭借74.57%的正确率取得了第一名,而排名第二的来自微软公司的AI的正确率为64.78%。
基于同样图片,人类回答类似的问题的准确率为64.27%。也就是说全球排名第二精确的AI和人类水平差不多,排名第一的AI则高出人类平均水平10.3%。阿里的AI比人看图还准确。
关于视觉对话大赛是这样的。首先准备将近一万张(或者更多)的图片供AI识别。当机器计算完成后,人类会在识别图片范围内随机选择一张图片并提出问题。问题都是具有相关性与逻辑性的。比如图片中拿着伞的男人旁边的人身上衣服是什么颜色的之类。
通常AI都能够识别出男人、女人、动物、花草之类的。这都是基于图像识别来实现原。而视觉对话大赛关注点可不是简单的认出图片中物品是什么那么简单。因为图像识别技术已经发展的非常成熟,据说就算一个人做了整形手术(美容的那种),AI仍可以在极短时间内正确识别出来。
比赛却是要求AI能够在正确认出事物的基础上,掌握事物间相互关系。对于物体间空间位置,逻辑关系AI必须能够看懂看明白。感觉上比赛要求AI只有具备了思考判断的能力后,才能参加这个比赛。这可是非常困难的事情。虽然研究者们一直在试图利用数学方式解释真实世界上复杂的关系,但是并没有特别出众的AI展现到人们面前。前些时候谷歌的电话人工智能还被爆出“作弊”事件,让人们对于AI的发展程度充满疑虑。
通过这次公开比赛,表现出来AI的思考能力还是让人非常惊喜的。仿佛阿里的AI具备了人类大脑一样,甚至比人类自己判断的都要准确。
这个比赛之所以称为视觉对话大赛,还有非常核心的一点是AI必须能够听懂人在说什么内容,或者人类想输入给AI的信息。阿里的AI使用了自然语言处理技术,让其AI具备了同人类使用自然语言自然交流的能力。从测试表现上来看,整个过程显得非常自然,如果两个人类之间的交流一样。
人工智能技术绝对是未来信息技术发展的一个极致,是各个国家着力发展的关键技术。我们进入了信息化时代,周围的一切正在以不可思议的速度数字化,无论是万物互联还是大数据的运用,为人工智能技术的出展与成长打下了坚实的基础。这也是为什么最近几年AI技术突飞猛进的原因之一。
未来谁掌握了AI技术谁就掌握了未来科技发展的核心,也就掌握了未来发展的趋势。而这次阿里向世人展现出了一个能像人类识别真实世界、能够像人类一样思考逻辑、能够像人类一样同其他人自然交流的AI。无论从哪个角度来看,阿里的AI更像一个人类了。而这是AI技术发展追求的效果之一。
按照这个速度发展,在不久的将来会有更多更像人类的AI出现在我们的社会中,并服务于人类的方方面面。存在于人类幻想中的世界也即将变成显示。