演讲者:
李开复
导读:创新工场为什么看好人工智能领域?未来人类哪些工作会被机器取代?机器的深度学习为什么人学习不了?Google为什么比BAT厉害?人工智能领域到底有哪些机会?这么好的机会如何把握?今天创新工场创始人李开复为您全面解读人工智能的黄金时代。
为什么创新工场看重人工智能这个领域?
创新工场成立于2009年,过去七年我们专注所有中国创业者需要的服务和投资。创新工场的特色是做技术型的投资。我们自认为最专长的是看到一个趋势的崛起,并对这个趋势做深度的分析。比如说在2009年我们对移动互联网的投资,在2011年左右我们对娱乐内容的投资,
而我们今天正在对人工智能做一个非常大的布局。
为什么我们会特别地看重这个领域?
最近人工智能得到全球关注,主要是因为阿尔法狗击败了李世石。在很多的世界媒体上我们看到的,就是机器是否会取代人脑?我个人认为没有足够的科学根据,让我们想那么多,担心那么多。
而短期让我们更应该关注的是怎么用人工智能,我们的工具为社会创造价值,来为创业者创造机会。
为什么人工智能会这么强大呢?
就是因为今天人类做的大部分工作是重复性的,是基于一个有限的领域。这些工作在未来的十年都会被人工智能取代。
这些工作我这里列了一些,如果你们不太相信的话,我们可以举几个例子:
今天美联社90%的稿件已经是机器人取代了,在过去的十年华尔街交易员已经一半下岗离职了。未来我们肯定会看到无人驾驶的车,当这一天来到的时候,世界上大约9%人的工作就即将被取代。
怎么能做到呢?
其实在这些领域里,人工智能不是模仿人类,也不仅仅是取代人类,所谓的人工智能,就是用特别巨大的数据集看到一个人的一生,甚至一百个人的一生,然后用数据推算出逻辑、判断和推测,做出比人更好的判断。
阿尔法狗就是研究了几百万的棋谱和花无数小时的时间来打败人类专家的。有人说这个不公平,一个棋手不可能花一百万个小时研究棋谱。这不是公平不公平的问题,而是我们如何用人工智能做出人不能做的事情。
最近特斯拉提出了一个问题,大家可以想想,特斯拉有几亿小时的车行数据,这些数据难道不会成为比人更好的司机吗?这一天还没有到,但如果有一个数据做十亿小时的练习,哪怕它开始像个孩子,学完以后,难道不会超过人类吗?
我们可以想像,如果有一个人脸识别的机器,它把全世界罪犯的脸都背下来了,有人能够做到这一点吗?所以从这个例子可以看到,我们丝毫不用怀疑人工智能会全方面超越人类。但是这不是在所有的领域里,是在一些特殊领域,或者可以客观分析的领域,或者有正确答案的领域,有大数据的领域,而且是有专家参与的领域。所以它会逐渐地发生,不会一次到位的发生。
深度学习,巨大的变革
我个人有幸在三十年前开始做人工智能,但可惜当时数据不够,所以并没有做太多超越人类的事情。因此,我们可以看到对弈只是游戏的领域,它本身并不带来巨大的商业价值。我们在业界更多会看到的可能是感知,就是用算法,人工智能来做判断或者反馈,这个时候机器就要动起来了。
我们可以看到过去七八年来有特别大的进步,这是为什么呢?
这是因为在机器学习的领域有一套技术,叫做深度学习。
它带来了巨大的变革,今天可能没有时间太解释这套算法。
简单来说,就是
过去人是需要一步一步地告诉电脑,你该怎么走,该怎么做。
对人来说,先对人脸找眼睛、找鼻子、找耳朵,但这个大概是所谓的专家系统,就是人告诉机器一切,然后机器来计算,这个大概是三十年前的技术。
大概十五年前的技术是人找特征,机器学参数。这里就是人告诉他,识别人的时候找眼睛、嘴巴,然后你再来计算,这是人机结合的学习。
什么是深度学习?
深度学习的技术应该算是最近五年推出的技术,这个技术几乎人都不用参与了,特别神奇的地方。给你看一亿张脸,你自己看,我就把大量数据给你,让你收取你认为重要的特征。而且这些特征只有机器懂,人都听不懂的。
这就是阿尔法狗战李达以后世石的时候,下出了人类顶尖棋手都没有办法看懂的步骤。这就是深度学习,它能自我学习抽象的概念。而且这个抽象概念超越了人类的想象,因为它用的数据集比人更大。它就像一个孩子,能够自我学习,而且数据量够大的时候,什么都学得会。这大概解释了什么是深度学习。
深度学习,这是一个识别物体的领域,而且是有人标注的数据库。
我们可以看到大概仅仅在五年前,一个机器跟人的差别还是一个74%对94%的差别。如果算错误率的话,可能是六七倍的差别了,所以不太能够用到实际的场景里。但是每一年都在快速进步着,我们可以看到在2014、2015年的时候已经超越人类,而且差距越来越大。
就是说当机器识别人脸,比人更厉害的时候,那些以识别人脸工作的人就要下岗了。同样的,语音识别超过了人,像客服,比如每天打电话卖房地产产品的人,以后打电话的不是人了,因为机器比人更听得懂。
当每个技术超越人的时候,它带来的机会是巨大的。
未来五年,什么会产生巨大价值?
我们认为下一个阶段,未来的五年什么东西会产生巨大的价值?
如果一个领域有特别大的数据,只是这个数据没做挖掘,没有产生价值,比如商业化的流程和互联网的数据,这里就会产生巨大的价值。
现场照片
所以今天谁最适合做大数据人工智能呢?其实就是BAT,在美国就是Google、微软和FaceBook,因为它们已经有了互联网大数据。
这些怎么做到呢?
举例:
像百度搜索的十个结果,我一个都没有点,这暗示这十个都不好,这不是绝对的暗示,但是数据足够多,是可以充分地学习。其实这些BAT都在使用,滴滴、美团都在使用,只是在创业领域大家还没有足够的机会。
这个世界上还是Google做得最好,因为它有世界最大的数据集,它在世界上做人工智能做得最早。然后再加上Google多年累计了大量的技术人才,还有特别快的机器。
这就是为什么Google可以做出来阿尔法狗,而不是BAT、美团、小米,但是Google的野心不仅仅是阿尔法狗。前些日子,我们看到Google自我命名为Alphabet,是互联网的一家公司,它可能还有做医学的公司,可能还要做基因检测的公司,可能做汽车等等领域。
Google做智能产品的过程中发展了一套Google大脑。其实Google里有两套大脑,这个可以用到各个领域。
发现这个大脑,其实才是它的最大价值。
在其它的领域,只要有数据就可以启动。所以Google拥有了巨大的数据量,它们启动了数十个不同的项目。
在美国有一些机构,比如OpenAI,也担心如果Google这么多数据,还有没有机会跟它竞争,它会不会比人类知道的太多了?当然最好的办法是让更多的人参与到这个领域来创业,这样就不会被某一个垄断了。
如何捕捉这个领域的机会?
这么好的机会,我们怎么捕捉呢?
我告诉大家,这并不是人人能做,做起来也不是很简单的。
1)有些领域是要平台;比如开发一个苹果APP,或者安卓的APP,必须要有平台的。计算机程序员只可以学会开发一个安卓APP,即便是一个优秀的程序员也没法儿用深度学习,因为这个还没有平台化,你还要知道很多微妙的东西,这方面的专家可能只有几百个人,所以这样的人才很稀缺。
2)需要海量的数据;说一千万的数据就是大数据,其实那是小数据。真的要深度学习有用武之地,需要有更巨大的量。
3)数据储存,还有存储量;
4)我们都认为深度学习超越人了,可以倒过来解释给我们听,但是机器学习没有办法告诉你,它怎么决定的,你要相信就相信,按照结果说话。你让阿尔法狗回来说怎么打赢李世石的,它说不出来。
怎么做呢?买这个数据,标注这个数据,不要浪费钱,GPU可能比CPU好用。找专家,这样的专家真的不多。Google已经开出九位数的代价挖这样的专家。
这是我们过去不能够想象的,在国内我们也看到,比如说看到投资的Face++,最近也是努力挖到了华人深度学习的研究员,这些人才的价值特别巨大的,因为非常稀缺。但是话说回来,这个稀缺也是未来两三年的现象,之后我觉得会有很多聪明人,尤其在中国会涌入这个领域。
有这些东西还不够,深度学习还会有一些挑战,最后还不能完成你的应用,该怎么办呢?就要用巧妙的、非技术的方法,不要取代人,辅助人就好了。
比如做安防的人,他只要带着摄像头,摄像头把拍出来的东西告诉人,那边的窗子坏了,其实就够了,辅助人就够了。还有辅助医学,我们不是说取代医生,但是可以给医生做一些工具,这是完全可以的。
我们是不是能局限于某个领域或场景?
举例:
比如,为什么要全天候无人驾驶?为什么在可控的领域做好无人驾驶呢?现在特斯拉的车,我们看到它这次出车祸(笔记侠注:6月末,特斯拉首起死亡事故被曝光。一辆自动驾驶的Model S拦腰撞上一辆正在横贯马路的货车,造成车主死亡),就是分不清巨大的卡车和天空的颜色。
所以,要用一个聪明的局限领域来创造价值。
人工智能的未来蓝图
这是今天一张重要的PPT,但是我也不能保证这张是没有错的,因为没有人可以预测未来。
我们相当看好大数据,尤其是金融领域,因为它有最大的黑盒(笔记侠注:因为人大脑太复杂,所以干脆把他看作一个“黑盒”),能够产生最大的效应,也能吸引最大的应用;在感知方面有一个误解,就是自然语言理解,以为听到语音了,变成字了,我就懂了,因为人是很容易懂的。但是听、识别你讲的字,和懂你的意思还是有一个特别大的鸿沟。这点我觉得至少五年,甚至十年的时间才能突破。
机器人方面,大家都想做家庭机器人,但这样是不能满足家庭期望值的。这个在日本可能是可以的,但是我不认为有一定的代表性。这样的机器人好玩儿,可以做老人陪伴,可以做小孩的玩偶,但就是这么多了。
你要期待它帮你炒菜、扫地,成为家庭主妇,或者成为家庭新的一员或者新的电器,这个还是一个天方夜谭。当然,你很聪明地把这个机器人做成了一个音响,或者做成了陪伴老人的小机器,像我们投资的小鱼在家,当然也是可以做的。
但是,我们人所想象的机器人一定会先在商业领域出现,之后才会在家庭有希望。
最后关于无人驾驶,让它在有些场景可以有用,先帮助人,人帮助它,最后才是无人,而这还是在十年以后。总之,这个领域我们是特别看好,希望今天的演讲对大家有些启发。