2017年5月21日,由中国人工智能学会、中文信息学会主办,亿欧承办的2017·全球人工智能技术大会在北京·国家会议中心拉开帷幕,学术界、工业界、高校师生参与其中,5月21日为活动的主论坛,主讲嘉宾包括中国人工智能学会理事长-李德毅院士、IBM中国研究院院长-沈晓卫、微软公司全球资深技术院士-黄学东、香港FDT金融银行家兼FDT总导师-马蔚华等。
在5月21-22日举办的2017全球人工智能技术大会上,进行了两场尖峰对话,可谓是精彩纷呈。两组嘉宾在台上唇枪舌剑,论战人工智能,场间妙语连珠,引爆多个当下的AI热点。提问环节更是反响热烈欲罢不能,本文是尖峰对话速记整理,一起来再次回味当时的热烈场面。
山世光(主持人):
大家好,我是来自中国科学院计算技术研究所的山世光,这次2017全球人工智能技术大会是在第三次人工智能热潮大背景下召开的,我们知道人工智能在历史上经过两次大起大落的发展阶段,现在我们似乎非常幸运地进入了第三次人工智能热潮,而这一次的人工智能的热潮的兴起与深度学习有极其密切的关系,那么深度学习是否通用人工智能问题的终极解决方案?这就是我们今天Panel的讨论主题——通用AI之路:继续大数据驱动深度学习还是另寻他途,有请嘉宾:
360副总裁,360人工智能研究院院长颜水成
罗切斯特大学教授、腾讯优图顾问罗杰波
云知声董事长/首席技术官梁家恩
北京大学信息科学技术学院教授、计算机科学技术系主任黄铁军
山东大学计算机科学与技术学院院长、软件学院院长、教授陈宝权
北京大学信息科学技术学院智能科学系教授、机器感知与智能教育部重点实验室主任查红彬
几位嘉宾都是在人工智能大的范畴里有过非常久的研究经验或者是工程经验的,我们可以看到几位嘉宾的分布,有4位目前还是在学术界,是非常著名的大学或者研究机构的教授或者是院长级别的大咖,我们的颜水成教授刚刚从学术界来到工业界,也是在学术领域有非常多的研究的经验,还有一位来自工业界的梁家恩博士,来自于云知声,也是技术出身,因为这次大会其实是一个全球人工智能技术大会,这个话题偏技术,我们希望探索讨论通用人工智能这样一个话题,我们的技术应该怎么走的问题。
几位嘉宾刚才做了非常简单的介绍,相信大家还希望能够知道的更多一些,下面请几位嘉宾分别简单做一下自我介绍,同时解读一下他们对这个话题的理解,首先请查红彬老师。
查红彬:
各位老师,各位同学,各位嘉宾大家好!本来我看到今天讨论者的名字排出来的时候,我应该是坐最边上的。没想到坐在了主持人边上,轮到最先发言了。我是叫查红彬,今天很高兴参加这个讨论。我们现在讲到大数据,讲到深度学习,这是我们今天讨论中非常核心的概念。这两个概念的出现,在今天的人工智能领域,甚至是整个科学技术领域的发展中都发挥了非常重要的作用。
这一点是毋庸置疑的,不然没有这么多人对这些概念感兴趣。但是如果我们将尺度放大一点,在人工智能的发展历史中来看大数据与深度学习,可能这样一些概念并没有脱离传统的人工智能的框架,是在人工智能发展过程中自然的进步。也就是说,我们还有很多问题目前没有完全解决,比如说智能系统本身的柔性,智能体与环境间的交互行为,还有新的计算方法和硬件框架,这些都是遗留下来的问题,值得我们进一步探讨,谢谢大家。
陈宝权:
各位嘉宾好,我算是第一次参加人工智能类的会议,以前不敢参加这个会议,因为有一点投机的嫌疑,我本人的研究方向不是人工智能,是做视觉计算,但我发现人工智能确实已经涉及到了各个领域的发展,也包括视觉计算。我的研究团队最近也开始采用深度学习的方法解决我们原来不太能解决的问题,或者解决不太好的问题,比如在三维视觉中的三维场景理解问题,所以觉得这是一个不可忽略的发展方向。
回到今天的研讨题目,从我本人作为一个新手进入这个领域来讲,基于数据的深度学习还是一个新的途径,它还有很多可以挖掘的东西,是不是还有其他的途径呢,对我来说目前不敢奢望,我觉得目前重要的是在现在的途径之上,怎么样把它进一步的完善,把深度学习的模式识别,这样一个工具性的东西,变成真正有智能的东西,这是我们可以研讨的方向。谢谢各位。
黄铁军:
各位专家、各位同仁,我是北京大学的黄铁军,计算机专业的。在这么多年里,我觉得每个搞计算机的心里都有一个通用人工智能的梦想,即怎么实现强人工智能。这个梦想一直在我脑子里,2014年我突然发现,存在一条通用人工智能的技术路线,当然这未必是唯一的技术路线,但是它真的是存在的,这是这一生最值得做的一件事。我认为人工智能的终极目标就是做强人工智能,可惜昨天看会议日程的时候发现英文翻译错了,“通用人工智能”应该翻译成“Artificial General Intelligence”,定义很清楚,但是怎么实现,一会儿还有机会讨论,我先说到这。
梁家恩:
各位嘉宾、老师、同学大家上午好,我是云知声的梁家恩,云知声是技术起家的创业公司,团队在人工智能行业已经有将近20年的积累。现在是第三次人工智能浪潮,云知声五年前开始创业,主要是面向物联网提供完整的人工智能服务解决方案。
今天论坛的主题是“通用AI之路:继续大数据驱动深度学习,还是另寻他路”,在过去的五年里,大数据和深度学习,已经为云知声在技术性能提升和产业应用落地做了非常大的贡献。通用人工智能,从我们的角度来看,大数据和深度学习会有很大贡献,但整体上还没有比较清晰的路径。现在有很多新的机器学习方法不断出现,都非常值得期待,谢谢大家。
罗杰波:
大家好,我叫罗杰波,来自美国罗切斯特大学。我这个人比较不喜欢跟风,所以我实际上跟颜教授是反着来的,我在柯达工业界做了15年,做过开发,做过研究,6年前我决定回到学术界。我的主要研究领域是两个,一个是计算机视觉,这是我有20多年经验的领域,最近十多年是大数据的挖掘,特别是基于图像数据的挖掘。
对深度学习,我一不排斥,二不迷信。打个比方,AI是个大家庭,这个大家庭里原来有很多孩子,视觉只是一个,自然语言理解,语音识别,机器学习等等,计算机视觉这个孩子属于熊孩子一类的,很长时间成绩很差,最近因为吃了深度学习这个药就赶上来了。作为一个计算机视觉领域工作很多年的从业者,我认为现在不是计算机视觉飘飘然的时候,应该和人工智能大家庭一起推动行业的发展,谢谢大家。
颜水成:
我叫颜水成,在2015年底从学术界来到工业界,前期研究计算机视觉和机器学习比较多,加入360以后开始涉猎语音和语义方面的东西,算是对人工智能的四个维度都有一些初步的认识,但是如果说涉及到强人工智能的话,我个人觉得不得不把学术界和工业界两个合在一起来分析。我觉得当前的状态来说,强人工智能的理想是丰满的,但是现实是骨干的。
总的来说,强人工智能到底要实现什么样具体目标还不是特别清晰,至少在我看来。在这种情况下,我觉得可能最好的方式是工业界专注在弱人工智能,在特定领域如果已经有可以用的东西,则在产业界中发挥它应有的效能。但是强人工智能不是完全放弃掉了,比较适合于在高校里,像黄老师做这种研究非常合适,等这方面真的有它可见的一些成功的案例以后,工业界再涉猎比较好。谢谢大家!
山世光(主持人):
我们的嘉宾们已经有开火的味道了,刚才罗老师说计算机视觉是个熊孩子,在座的几位嘉宾除了梁博士都是搞这个熊孩子的。我们知道深度学习在过去几年的时间里,之所以能够得到大家足够的重视或者引起大家非常大的兴趣,很大程度上也是因为人工智能在计算机视觉和语音识别等感知领域取得了非常大的进步,除此之外,这几年已经有非常多的领域涉猎深度学习,下面我们请每位嘉宾分享一下,最近在深度学习应用方面哪些新的比较大的进步,以便听众理解这种大数据驱动的深度学习的技术路线,它能解决什么样的问题,之后我们再讨论一下这种路线不能解决什么样的问题。还是从查老师开始吧。
查红彬:
刚才也说到,今天在座的很多讨论者都从事计算机视觉研究,大家基本上是做感知方面的。如果我们仔细地分析一下大数据这个概念,其实它与感知之间有着非常密切的联系。什么叫大数据?今天的大会报告中说到了行业大数据,其实这些大数据是人工智能中感知系统一个非常大的变革。为什么这么说呢?如果我们将一个大的行业,一个大的企业,看作一个系统的话,我们拿到的大数据,就是我们得到的有关这个系统的感知信息。
从这个意义上讲,今天我们讲的大数据获取就是系统完成了对外部世界的感知任务。当然这个感知概念与我们通常讲的人的视觉、听觉、触觉等有所区别,而是更广义更抽象层面上的感知。现在讲物联网,就是要在各个行业,像医疗、交通等,获得更多有用的数据,有更强的感知能力。当然,这种感知能力是相对被动的,系统只能将手头已有的数据提供给系统。
陈宝权:
我一点体会,数据驱动未来的趋势可能是一方面往大,一方面往小发展,大的就是在一些行业里,针对特定的目标,尽量把这个数据集中在特定的目标领域,因为如果是很散乱的数据,它估计是学到的东西是有限的,不精准的。另外一个是小,数据在小样本的情况下怎么样学到东西,这个应该是未来很重要的趋势。说得具体一点,比如我做三维场景的理解,以前理解都是通过对大量二维影像的学习。但想想,这个世界是天然三维的,三维表达是一个更加紧凑更加本质的表达,那么学习的对象和表达不应该只是二维图片和模式表达,怎么样把三维本质的表达和深度学习结合起来,让一个小样本也能得到很好的学习的结果,这个是我们比较关心的问题。
黄铁军:
总体上讲,我认为大数据、深度学习、神经网络,这几个方向从长远来说都是对的,大方向是对的,但是不等于现在就好了。我比较反对小样本这种说法,那边是大数据,就有人说在小样本我的算法好,其实大家想一想,人的智能生成其实就是大数据训练的结果,当然这是广义的大数据,我们从单细胞的生物演化出今天大脑皮层的复杂结构,什么东西在影响?就是进化过程中,地球的各种环境作为大数据刺激这个系统的演化过程。
所以我们的智能的产生,本来就是大数据训练的结果,进化大数据,演化的结果。我们今天说大数据,大家老觉得对数据苛求太多,其实本来就应该这样:真正强的智能,背后的数据一定足够丰富,不丰富哪来这么强的智能呢?所谓小样本学习,总得有一个学习模型在后面吧?学习模型总要采用某种实现结构吧?这种结构从何而来?像人脑,如果我们要设计更复杂的神经网络,神经网络的结构怎么就应该那样呢?这种结构本身就是数据训练的结果,所以我的意思是,不要片面强调小样本,小样本不可能单纯作为一种方法存在,它要在复杂结构和模型基础上才能存在。
梁家恩:
大数据深度学习,在工业界取得了举世瞩目的成果。如果没有深度学习和过去互联网发展积累下来的大数据,现在可能我们没法看到这么好的结果,这在听觉、视觉方面的进展是毋庸置疑的。现在深度学习的“黑盒子”属性没有完全解开,有些科学家觉得深度学习太工程化,在数学上不是特别优雅,和传统机器学习不一样,但是在工业界非常实用,在未来一段时间里,还会发挥非常重要的作用。大数据深度学习,特别适合解决数据量很大的端到端的序列映射问题,效果非常好;如果说不太适合的场景,就是数据规模不够大、或者不是一个简单的序列映射的问题,比如符号理解、推理和对话。
目前的深度学习网络结构通常是设计好的,如何根据问题寻找适合的网络结构,这点上需要更多的研究和推进,也是我们期待的。至于大数据,我们现在的机器学习,用到的训练数据主要还是靠人工干预得到的标注数据,并不是一个真正的大数据。所谓大数据,应该是能用上人处理不了的数据规模,这是未来的机器学习的一大挑战,这个跨度非常大,也是目前的一个热点所在。人类的学习,是以进化了很多年的大脑为基础,感知特征抽象能力非常强,人出生以后,各种学习都是在相对比较小的样本上进行的,能很快通过适应和调整,达到较高的认知水平,这是我的看法。
罗杰波:
因为我最近教书教多了,一般我不上来就说自己的观点,我讲几个故事,你听完了就知道我的观点。我们今天讲人工智能,我们可以拿人的智能做一个例子,我以前的导师有一个小孩子很聪明,3岁时候有一个现象,因为我的头发是自然卷,长的时候是卷的,理完发就不卷了,我每次理完发他就不认识我。我想说什么意思,3岁以前,我认为人不是用深度学习,我认为到5岁以后,就具备深度学习的能力了。但是我的观点是,深度学习只能让一个机器达到5岁的智能。
颜水成:
会不会是3岁的时候,深入学习模型还没有学好呢?
罗杰波:
我主要想说的是,深度学习只能让一个系统达到5岁,5岁对世界的认识是什么呢,主要是感知,不是认知。我再讲一个例子,我女儿的例子,我女儿我认为她很聪明,至少比我聪明,这个是IQ指数出来的,她现在16岁了,她在美国从小长大,她不知道腌黄瓜pickle是从黄瓜来的,因为我们在中国长大,我们知道腌黄瓜怎么出来的,我一到美国就知道。她没有见过,但是她在16岁某一天突然反应过来了,她认知腌黄瓜是从黄瓜来了。
我认为5年级的学生就不需要大数据了,你问他,他也能知道腌黄瓜是黄瓜来的。我讲这两个故事的意思呢,我认为深度学习“不”可能让我们达到强人工智能的地步,但是深入学习让我们把底层的问题,比如说视觉是我们人感知世界的主要手段,占70%的信息是从视觉来的,视觉这个问题不解决,想讨论更上层的人工智能的问题,这是没有基础的。因为深入学习,计算机视觉有一个长足的进步,让我们在这个基础上可以真正去探索,去解决强人工智能的问题,这个就是我的观点。
颜水成:
我非常赞成黄老师的观点。我们先讨论一下基于大数据的深度学习为什么这么重要,我想从这个角度分享一些我的观点,大家可以看到,大概在2015年2016年早期的时候,大家在讲人工智能的时候,主要讲人工智能的三要素,大数据,计算能力和算法。但是2016年底和2017年初有一些变化,大家讲人工智能有四个要素,有大数据,有计算,有算法,还有一个是场景。场景是非常重要的,从工业界的角度来说,如果人工智能算法或者说能力没有落地的场景,人工智能就没有它的价值。
如果从这个角度出发,我们会发现,大数据是非常关键的。为什么呢?如果这个场景本身不产生大数据,很可能是大家比较关心它,很重要,但可能不是高频的应用。有些场景从整个社会的层面来说是非常有价值,比如说一种特有的疾病,如果能治好那是非常有价值的,但是可能的病人的数字不是特别多,这个时候比较适合从国家投入的角度去解决问题。从商业的角度来说,如果这个场景没有足够的数据,这个商业场景不可能往前走,要想有比较好的应用场景,必须有价值,也要高频,一定就有大数据,大数据驱动深度学习往前推动,我认为是因为大家越来越重视人工智能的落地性,希望在工业上产生价值而带来的结果。
陈宝权:
大小数据是一个相对的概念,我之所以提出小数据,是针对你最后要达到的目标,目标越来越高,可是你处理的对象越来越复杂,相比之下,手头所拥有的数据就会显得越小,,所以大小数据是相对的概念。如何在有限的数据的情况下,也就是说不是你想多大就有多大数据的情况下,可以仍然达到你预期的目标,这就需要小数据的概念。
颜水成:
为什么拿不到大数据,是因为这个场景根本无法拿到这个大数据,还是你根本无法标志这个数据?
罗杰波:
大数据不是简单的很多数据,没有标定的大数据是没有用处的,所以即使现在我们有能力拿到很多数据,其实要建立很强大的人工智能系统,比如说人脸识别,它是需要很多标定的数据。为什么人脸识别发展这么快,是因为有大量标定数据。在别的领域,比如医学,实际上医学应该是限定领域的问题,它应该发展得比通用图像识别要快,但是它现在没有跟上来的原因,就是因为没有足够的标定的数据。我想跟大家说一点,我们要大数据,但是我们更需要的是有标定的大数据。
山世光(主持人):
这里是不是存在一个有效大数据的问题?比如我观察一类物体做识别,你看到一个物体的大量的样本,并不等于你见了这一类物体的大量的不同的相似物体的大量样本。我刚才问题的意思是说,是否是我们现在所有碰到的AI问题,只要有有效的大数据,用深度学习,就一定可以解决好?甚至是否可以说只要机器见到了比人见到的更多的大数据,用深度学习就可以做的比人好呢?
黄铁军:
我一定要提醒大家一下,小样本是相对于大数据而存在的,不要绝对化。举个例子,比如特殊事件,异常事件,说缺乏大数据,搜集不到那些数据,车哪能老撞?这种缺少大数据的情况怎么办?没有大数据!其实这是开发是错误的,正常的数据都给你了,突然出现不正常的,异常实际上正常大数据的例外,仍然是大数据。通用智能能做到这一点,实际上仍然是大数据驱动的,因为你见到太多的正常,突然出现不正常,你就应该有发现不正常的能力,你发现异常的能力来自哪里?仍然是基于大量的数据训练。
颜水成:
在360曾经有一件事情,是关于杀毒软件的。以前的做法,用算法把病毒和非病毒分开。360有一段时间做白名单,就是把你电脑里,网上云盘里存的文件,有极其多不是病毒的样本,不一定有特别模式,存下来,有这些大数据在那个地方,当你的电脑上出现一些文件,我可以非常肯定地确定一些样本一定不是病毒,这个就跟刚才说的异常事件一样,不一定通过分类的方法,而通过白名单确定这些东西一定是好的,剩下的就是我们需要注意的就可以了。
山世光(主持人):
这次为什么勒索病毒没有搞定呢?
颜水成:
这个的原理不一样,它是一种通过新的端口漏洞进行攻击。通过早期监测发现一些异常以后,360的安全工程师就把它确定,很快360就有修复的SDK发布出来了。
罗杰波:
我赞成黄老师说的,大数据大家一般想到的都是监督学习,但是大数据学习有一个重要的手段,就是无监督学习,当你把正常的样本了解得很清楚以后,任何跟它不相像的东西就是异常的outlier。现在很多人认识到,深度学习要向无监督学习方向发展。
山世光(主持人):
有没有哪位嘉宾觉得:即使现在有了有效的大数据,还有解决不了的问题呢?
黄铁军:
所谓的数据,就是描述你要解决问题的素材,你要解决什么问题,一定要对这个问题描述,比如说我要解决这个问题,目前的深入学习能不能解决好,那取决于背后的网络模型是不是够强大,算法是不是好,不是方向对不对,而是数据在哪儿?大家可以不断提高新的模型和算法,今天解决不好,可能过一段新模型就解决了,数据还是那些数据,大数据和神经网络、机器学习的大方向没错。
山世光(主持人):
我的意思就是,有什么问题是现在我们知道的深度学习模型搞不定的,即使我们与足够大规模的有效数据。
黄铁军:
现在的学习模型和神经网络结构解决不了一些问题并不奇怪,还要继续改进提升。
山世光(主持人):
刚才我们几位嘉宾也讨论到这个话题,我们现在能够解决好的问题通常都是大数据驱动的,如果是我们类比人的话,就像刚才罗教授提到,很多时候小孩认苹果,其实没有经过上千个苹果的学习,看几个苹果的图片,就可以形成比较强的识别苹果的能力。刚才说了,因为进化过程中,人类作为一个种群,已经进行了大数据的学习。而对每个个体而言,其胚胎发育期,通过基因继承了这些大数据学习的结果,而出生后的发育则经常是小样本小数据学习。那么像陈老师提到小数据学习之类的问题,该如何进行学习呢?
陈宝权:
我觉得这个题目是把我们锁定在大数据了,其实我觉得大数据能解决的事情还是非常有限的,我讲讲人类认知的过程,人类可以不停的积累知识,有一个抽象的能力,在抽象的层面传递知识,这是我们人类所具备的能力,还不说人作为一个生物体还有其意识,情感,这方面的计算模型,如果有的话,不一定是基于大数据。人的抽象思维的能力,传递知识的能力,这方面是我们在基本模式识别的基础之上很快进化到的更高的认知过程,我觉得它绝对是超过了所谓数据,以大数据驱动的深度学习的范畴。
不过正好澄清一下,强人工智能我现在不太热心,我只是觉得,在目前这个情况下,过度讨论这个问题可能会浪费我们的时间,原因是人类的认知有一个螺旋式上升的过程,你得先把底层的认知,如深度学习所能达到的模式识别能力搞得更清楚了,才可能推进更高层次认知的研究。把一个太超前的目标作为近期目标来讨论,就有可能形而上,就是浪费时间,这是我个人的观点。
罗杰波:
我补充一下,刚才黄老师也谈到,我认为人类除了深度学习和数据驱动的学习以外,还有一个迁移学习,就是我们通常说的举一反三。现在很多人意识到这个重要性,迁移学习有几种,一种是很近的领域迁移过去,譬如你在医学图像一个模态上搞出一个模型,再把模型转移到其他的模态,这个比较容易迁移。
更难迁移的是,你会打羽毛球的人,碰到网球大概知道怎么打,这就是更高一层的迁移能力。你不能用模型迁移。但是人是怎么解决这个问题,我认为是知识迁移的问题,不是一个模型的迁移,是知识的迁移。这个说起来比较玄,我们先从模型的迁移,比如知识图谱我认为就是有潜力的东西,我们现在也在摸索,怎么把外部的知识,以知识图谱的形式和数字驱动的深度学习结合起来。这个有一个实际需要,我如果确实拿不到标定的数据,我加上我学到的知识就可以达到我们的目的,我认为这是一个努力的方向。
颜水成:
其实这个题目不是特别清晰,我们说的意思应该是,基于数据驱动的深度学习,是不是能用一种纯粹的端对端的形式把所有的问题解决。如果纯粹只有深度学习的话,不能解决所有的问题,深度学习可以作为解决一个特定问题里的子模块,比如一个很典型的例子,下围棋,我们用的是搜索树的方式进行推演,但其中用到三个神经网络决定下一步怎么下,下的子以后可能取胜的概率多少,这时候深度学习在传统解决问题的框架中起到非常积极的作用。在我看来,大数据驱动的深度学习,可能不一定能解决所有的问题,但是很明显,到这个时间点,它已经变成解决大部分问题中不可或缺的模块,这是肯定的。
梁家恩:
我觉得在工业界应用中,没有数据是寸步难行的。首先,真实应用中有很多问题,是需要真实数据来定义的,这是解决问题的一个很重要的点,没有数据在工业界很难落地;第二点,即便在有数据的情况下,也不是一招就能解决所有问题的,人工智能技术有60年的积累,有很多的问题也有很多的方法。现在是深度学习,也就是过去的神经网络,80年代也曾经被打入冷宫,最近数据和深度学习的完美结合,给我们带来了颠覆性的突破,但是我想也不能解决所有的问题。对于数据序列到符号序列的影射问题,是比较适合深度学习框架的;对于符号层面的各种逻辑推理和因果关系等,可能不适合这种方法。
至于通用人工智能,大数据深度学习,应该不能解决所有问题,到底用哪种方法更好,目前还不能下定论,核心的是高效的机器学习方法问题。从我们角度看,像生成对抗网络(GAN),通过模拟真实数据和训练区分网络提升效果,以及AlphaGo通过左右手互搏生成数据进行增强学习,都是目前看起来比较有前途的方法。所以,我觉得通用AI核心的还是数据和方法,数据是不可或缺的,对于方法来说,任何单一方法可能都解决不了所有问题。
查红彬:
大数据与学习系统被分成了两个概念,但是从应用的角度看,这两者是分不开的。可能将来最理想的状况是,不是你给系统提供数据,而是系统本身要直接找数据,需要它和环境之间有更多的互动,这样才能找到它所需要的数据。所以数据驱动并不意味着把系统算法和数据分开,两者之间存在着非常紧密的联系。
山世光(主持人):
我个人非常认同,主动数据的搜集对系统是非常重要的角度。讨论到现在,大家的观点有一点是相同的,就是认为大数据的深度学习,这应该是一个基础性的东西,但是它是不够的,特别是解决我们通用人工智能的问题是不够的。最近李开复老师有一本书《人工智能》,有一章讲大数据和深度学习不能解决的问题,列了六个,一个是跨领域的推理,二是抽象能力,三是不仅知其然还要知其所以然,四是自我意识,五是审美,六是情感。接下来的环节里我们讨论一下,这样一套技术路线不能解决什么样的问题?
罗杰波:
我说一下,刚才李开复老师说的问题,我不同意他的观点。他认为人工智能不能解决的这些问题,其实是可以解决的,审美、情感,审美这个问题,用深度学习可以解决得很好。情感这个问题我们是最近几年做的,也是用深度学习做的,其实也达到一个很好的程度了。还有知其然不知其所以然,譬如说图像,用生成对抗神经网络。现在也轻而易举可以生成肖邦、舒伯特,你想要哪个音乐家就可以要那个音乐家的风格。
颜水成:
这点我不赞同,确确实实通过深度学习可以生成出一些美的东西。但是你会多多少少发现,这些美的东西并不是创新,只是风格模仿出来了。比如我加入360以后,我和设计UXC的团队聊天的时候,他们能够创造出一些以前从来没有存在过的,但是看起来又很美的东西。现在的人工智能,通过大数据学习的方式产生出来,是没有办法达到这个层次的,我跟他们聊,他们很高兴,因为他们的工作不可能被人工智能取代。
罗杰波:
这个问题上我反而比你乐观。画家、音乐家,实际上也是先把前面的画家、音乐家的东西学习以后才开始创作没有的东西,对吧?
颜水成:
如果是模仿梵高的话就没有自己风格了。
山世光(主持人):
这个也不一定吧,例如AlphaGo已经创造出一些新的好棋招,乍看起来是人类棋手不能理解的,甚至是过去觉得不好的一些招数。
罗杰波:
对,你要创新就是变革,你引进随机的因素,但是你只要学到了总的准则,什么样的东西听起来好,什么样的东西看起来好,这个神经网络能判断。加上随机因素的东西,是可能产生前面没有过的东西的。现在可能还没有,但是我觉得还是挺乐观的。
山世光(主持人):
对,随机性很重要。人类进化过程就是基于随机的基因突变,很多新东西都是从随机那来的,其他老师有什么观点。
陈宝权:
我们回到70年代,在智能领域看不上人工智能,深入学习它是一个技术,现在说人工智能很靠谱,说明它是一个工具,非常简单。所有人工智能可以实现的东西,包括情感,包括审美,它实际上就变成了一个工具,如果说到真的智能就是有意外,比如说音乐,原来没有交响乐,他创造出了交响乐,这就是人的智能。你说以前没有的东西多了,没有飞机,人的智能突发奇想,就设计这个飞机,这样的智能,我也不能说永远不可能,但是这个跨度是很大的,没有一定的基础,谈这个事就写小说,目前的智能从计算的角度达不到那样的程度的。
查红彬:
关于李开复先生讲到的人工智能相关的事情,我觉得他讲的基本是强人工智能范畴的东西。我们今天在做研究的时候,一定要有一个分界线,分清楚强人工智能与弱人工智能。现在有很多翻译系统,能够翻译相当复杂的文章,翻译相当复杂的对话,但是没有一个人说这些机器能理解这些文章和对话。机器没有理解能力,只不过根据已有的规则进行了转换,只是在有很多数据的时候,通过大量的训练能够做到这一点。机器如有理解能力,这就是强人工智能了。在应用中,计算机助手能帮我们做很多事情,但是它们没有进入到强人工智能的层次。
黄铁军:
我既支持今天的深度学习,也认为未来的强人工智能和今天有明显的区别,但我同样支持这两者存在必然的联系。我不同意李开复讲的六点,因为他站在以人类为中心的思维方式上,什么东西都拿来简单跟人类对比。当然大家可以想各种实现的途径,我刚才讲了我认为的途径,神经网络这个路线是对的,但是你是什么样的神经网络我们要讨论。第二个,大数据,有很多数据,刺激、交互、环境,来培育这个智能,这也是对的。
强人工智能有可能实现,具体实现方式,确实没有时间展开讲。但是它作为一个目标,一定要定这样的目标,为什么?大家想一想,计算机为什么成功?计算机70年到今天影响世界,是因为它是通用信息处理的机器,这台机器买回去装不同的软件可以做不同的事情,人工智能如果是做通用的,才能成为支撑各种智能应用的通用平台。短期内公司要赚钱,做专用人工智能,要在专用人工智能上做得比别人好,这些东西都对,我也不反对。
但是作为一个学科,作为人类对智能的追求来说,一定要把通用人工智能做出长期目标。一旦有了通用人工智能,就可以实现各种各样的应用,包括李开复说的六点,都不是必然不能实现的东西,实际上都能实现。人类智能都能实现,为什么它就不能实现?要跳出以人为中心的角度来思考问题,不能把所有东西简单跟人对比。
颜水成:
我补充一点关于什么东西人工智不能做。我比较赞同李开复老师说的情感。机器人通过它的感知,或者通过它的认知能力,给你传达一种爱的时候,比如它给你一个拥抱,它说它非常喜欢你,从人的角度,是不是能接受它所表达的情感,你会愿意把你真实的爱和情感反馈给它么?这是人工智能最难的点。其实挺有意思的事情,AI的拼音是“爱”,到底人工智能(AI)是不是能产生“爱”(AI)是值得思考的。
黄铁军:
这个人工智能本身是不是一个智能的主体,这个很关键。一定有这个智能主体的观念,再说直接一点就是有机器是可以涌现出意识,但是这个意识不等于人类的意识,机器意识可以和人类意识交流,就像我们和动物之间可以交流,可以有有爱。
颜水成:
比如说家里的猫狗从那里跳过来的,你心里是能接受这种爱是真实的,但是机器给你传达这种爱的时候,你会想这就是机器的指令所产生的动作和表现。
黄铁军:我们的感情也是不过是神经脉冲产生的表象而已。
梁家恩:
我想我们做人工智能,目的可能并不是为了去模拟一个人的全部行为,这可能也不是机器最擅长和做得最好的事情。未来人工智能可能就像AlphaGo这种典型应用一样,它只需要在某些特定领域(如下围棋)方面超过人类专家的水平,对我们来说就非常有用。通过人工智能的方法,把这些专业的问题解决好,超过人类专家的能力,这对我们人类的帮助也是最大的。模拟人的全方位能力,并整合人的感情等各方面的因素,对当前工业界来说,还不是最主要追求的目标。
罗杰波:
我经常爱用一个例子就是飞机,从前人想做飞机的时候,总想让飞机扇翅膀。莱特兄弟做出的飞机不需要扇翅膀就可以飞,所以机器不一定模拟人。解决同样的问题,不需要用同样的方法解,比如说resnet,150多层的resnet,我相信人的脑子里绝对没有,但是这个没有关系,这个network可以工作,我想说的问题是,我们的智能可以做人工智能的reference,但是没有必要让人工智能一定要去跟人对比,战胜人,模仿人,这是没有必要的。
山世光(主持人):
正好这个问题丢给黄老师,他是国内类脑计算的代表人之一,现在我们越来越多的任务,计算机做的比人类好,比如说人脸识别,那是不是意味着我们想做的比人好,不一定非要类脑,类脑就意味着只能做的和人一样好,而不可能超过人,比如刚才说了飞机的例子,您作为类脑计算积极的倡导者,对这样的问题是什么样的看法。
黄铁军:
我觉得很多时候大家讨论问题是有误解的。刚才讲到类脑,当然我现在不怎么用这个词了,我讲神经形态计算。一说“类”就想到模仿人的功能,模仿人的情感,这不是类脑的精髓,“类脑”不是模仿表面的功能,而是从精确模仿神经网络做起。我先用飞机做例子,每次大家说飞机,都说飞机很强大,从跨大洋可以飞过来,但是飞机绝对不如苍蝇那么灵活,苍蝇只有十几万的神经元可以起飞、追逐、躲避等,飞机还要造跑道才能飞上去,只会那么一个简单的动作,所以飞机并不比一生物系统强大。
飞机造出来学到了生物的部分特征,飞机也有翅膀,你只仿了一部分就可以做出很强大的东西,我不否定,但是不能因此能否定深度模仿的必要性。我说的模仿是指的结构模仿的必要性,通过高精度仿真,把智能甚至超越人的智能做出来,能不能做?当然能做!如果不了解“怎么类”,就反对这种可能性,我觉得太武断。我只是说,现在要作一种通用人工智能,它能涌现出智能,它有创造性,有自我意识,对这个问题是怎么做的问题。我不排除做飞机,而是说同时还要做一个苍蝇,苍蝇能进入各种环境,很灵活,那我怎么做?而不是简单否定能不能、要不要的问题。
罗杰波:
对,这个我同意,我说的是不要机械的模仿,可以灵活的模仿,刚才说的是灵活的模仿,这个上面我们没有冲突。
黄铁军:
为什么现在用“神经形态计算”呢?第一我们认为神经网络的这个技术路线对的,但是今天的神经网络模型不够强,它可能产生的功能复杂性不够,所以我们要做新的神经网络,这个神经网络一定能产生动力学行为,产生一定的创造性,比如说人的创造性,灵光一闪,就是这样一种状态,某种稳定的状态就是思维现象。
这样的神经网络做计算并不高效,我们从小学做数学作业,作业本写完肚子就饿了,但是计算机用不了多少晶体管就直接高效解决。人类智能做计算低效,但是这种网络能够产生更多复杂性,因此人类智能能够应对各种环境挑战是有道理的。所以,下一代复杂神经网络这个总路线是对的,还需要类似于深度学习这种办法,它的功能很强,甚至能涌现刚才说的类似人的甚至超越人的智能。
山世光(主持人):
刚才黄老师给我们对这件事情做了非常好的澄清。时间的关系,留五分钟的时间给台下的观众,我们有两到三个问题。
提问:你好,我是一个学生,我也是对人工智能比较感兴趣,在研究这方面的问题,我想问一个问题,各位老师,因为我们知道人工智能,我们提出人工智能,从当初提出人工智能的开始,我们就是想用它应用,用它来帮助人类做一些事情,我想知道,你们认为在哪些领域需要AI有意识的?
陈宝权:
其实这个事情呢,所有的信息技术都存在ethics的问题,并不只是AI,站在这个角度,它也不是突变,任何的信息技术永远存在这个问题,比如视频分析的水平越高,对人类隐私的暴露就越多。我只能这么回答,这不是人工智能带来的新问题。
查红彬:
对于应用而言,我想很多系统并不需要意识。意识牵扯到很复杂的过程,只是在系统需要适应极其复杂的环境的时候才可能产生意识。为什么人有意识,而有些动物没有意识?因为生物在进化过程中有自己的目的,自己要生存,要传递自身的基因,所以整个系统变得越来越复杂,来应对复杂的环境及其变化。最后可能当这个复杂程度超过一定范围之后,就产生了类似于意识这种东西。
不过,意识到底能起什么样的作用,还说不清楚。有的人说有作用,有人说根本没有作用,但可以说的是,意识和生物本身的进化过程有关系,而且和生物的本能及其生存目的是有关系的。在当今的应用中,当我们考虑一个设备和机器的时候,并不需要它有自己生存的目的,即使有意识,它起到的作用不大。所以从应用的角度来说,起码在很长一段时间内,意识不在大家考虑的范围内。
颜水成:
从对等的角度来说,如果你希望这个东西有意识,和你交互的本体也是有意识的,所以从我个人来说,如果需要意识的场景,应该更多的是设备或者智能体,是跟人进行交互的时候,这个意识就变得非常重要。
梁家恩:
首先,以现在的AI技术水平还做不出机器“意识”,目前还不用太担心;其次,AI真正要做好,可能并不需要人类的“意识”,机器擅长的是根据数据做出客观的判断,如果在计算出收益和损失概率时,还“意识”到损失风险而不敢决策,反而不能发挥优势。
罗杰波:
我同意查老师的观点,意识是为了生存而产生的,我认为人工智能不要有意识,除非我们想让它把人类灭了,它不需要有意识。
山世光(主持人):最后一个问题。
提问:我现在理解,哪怕是深入学习或者是各种学习方法,或者是人工智能方法,主要是专注于个体的某方面能力的提升,比如语音,图像识别,我们知道群智能,个体的智能水平比较低,但是群体就可以发挥很强的群体的智能,各位老师,除了作为单个的个体的人工智能,对于群智能的发展,是不是持乐观的态度?
山世光(主持人):
简单总结,问题是:智能是不是需要群体?
罗杰波:
你这个问题比较有意思,但是我认为深度神经网络就这么一个例子,每个神经元很差劲的,它合在一起群智能就很高,这本身就是一个例子。
颜水成:
我们这块的研究很少,最近包括Deepmind和阿里巴巴都有这方面的研究,如果在战争游戏中,如何让不同个体通过协同产生好的结果。记得在国家人工智能2.0里面也有一个协同/群体智能的概念。
黄铁军:
群体智能有很好的发展方向,有很好的发展前景,我没有什么好的评论,毫无疑问这是人工智能未来发展的重要的方向,蚂蚁、蜜蜂它们都是靠协同解决很多复杂问题,我们也一样,为什么这么多人在一起开会?而不是一个人闷在屋子里想呢。
山世光(主持人):最后一个问题。
提问:我是武汉的老师,也是做机器人方面的,我只想问一个问题,刚才听了很多专家讲,谈论未来机器人能不能超越人类,或者能不能跟人类谈恋爱,我想说,现在人工智能的发展,在我们现在生活中的应用已经很强大了,比如现在有机器人家教,机器人翻译,机器人会计,我想问的问题是,若干年以后,当这些机器人家教和会计人会计超越人类以后,那人类做什么工作?
查红彬:
这是最近很多人议论的话题,包括一些通俗刊物,如美国的《时代》周刊、英国的《经济学人》,都有文章讨论这件事。有些人忧虑,机器是否要与人抢工作。如果我们将现在的状况和100多年前做个比较,可以发现,100多年前很多新的产业出现时,也有很多人担心劳动力淘汰问题。但是,现在看来,当时的状况并没有那么糟糕。现在,机器人可以帮人干很多事情,同时先进的工业化和智能化也会创造一些新的就业机会。另外,人们的生活水平提高后,富裕了,可以做一些改善文化生活方面的事情,这也是工作。我个人觉得,起码在下一个100年内,问题不会像想象的那么悲观。
提问:谢谢给我这次机会,我是来自北京邮电大学心里安全大赛的学生,我想问一下颜水成老师,因为专业相关,360在信息安全块的研究,有没有跟人工智能,深入学习这块做交叉的研究,比如谷歌利用大数据预测了H1N1的爆发,360能不能预测一些病毒,或者以后用人工智能实现一些攻防对战?
颜水成:
非常欢迎你到360实习或者交流。我给你的回答是,历史上用过,现在在用,将来也会用。以前360有一个QVM引擎做这种病毒和非病毒的预测。从2015年开始,360用深度学习做一些和安全相关的事情,比如说你在网上获取一段数据流,用深度学习判断这个流是用什么样的协议发送出来的,用什么样的应用程序发送出来的。将来360在这块也非常清晰,我跟360安全部门的负责人也有很多的交流和讨论,我觉得后面类似于像深度学习这样的算法,肯定会在安全领域发挥更大的效能,非常欢迎你过来交流,谢谢。
山世光(主持人):
谢谢颜水成。我们拖了10分钟的时间,刚刚我们做了大量讨论,但相信大家并不会觉得我们讨论出了一个答案,事实上这也不是我们讨论的目的,因为这本身不是一个有明确答案的问题,当然即使有答案,各位嘉宾已经藏在心里自己偷偷回去做了,不会告诉大家,当然这是开玩笑,因为这确实是一个很复杂的问题,相信我们通过这样一个讨论和交流,给大家提供了很多的视角和维度,这是更加重要的。
山世光(主持人):
那最后我们还是请每位嘉宾每人用一两句话简单总结一下吧。
颜水成:
我本人非常喜欢一部电影《Chappie》。一个机器人有了基本的运动和控制能力之后,通过它的视觉、听觉、触觉,逐步通过老师教,自己看电视等形式,把自己的智能提升到至少十几岁小孩的水平,所以我觉得人工智能下一步发展的一个很好的点是跨模态的协同学习。
罗杰波:
我赞同他这个跨模态的协同学习。另外,我想说的是,大家不要有误解,我对深度学习是持积极态度的,我只是说,大家不要只看深度学习,程咬金还有三板斧,同学们不要只有一板斧。科学的发展是不断有新的东西出来,你的眼界和思维不要局限于一个东西,即使这个东西十分好,十分热,但是你的眼界要开阔一些。
梁家恩:
我认为人工智能第三次浪潮对我们大家来说机会都非常大,也有非常多的挑战需要我们克服,不管技术、工程还是产品应用上。我们首先要扎扎实实解决好当下问题、做出让用户真正用得起来的好产品,这点非常重要;同时,我们也要看到未来,在技术和产品方面,五年之后我们想到和看到的东西,是有可能和现在完全不一样的,所以,我们需要以更开放的思维来看待未来的发展。
黄铁军:
因为我跟各位老师都很熟,所以我不客气。你要让我讲清楚人工智能怎么实现,把对话的所有时间给我大概才能讲清楚。大家如果感兴趣的话,请搜一下中国计算机学会的公众号,有四篇文章,大概说清楚了如何实现通用人工智能。
陈宝权:
一句话三部分,第一是针对人工智能的公众教育很重要,要有一个类似斯坦福AI2.0那样的报告,从科技、政策、社会学等各个方面,让公众对人工智能有一个正确的认识。第二就是科技界要脚踏实地,扎扎实实把眼前的事情做好,避免大跃进似的冒进。第三就是对未来人工智能的发展要有愿景和规划,如果真要说强人工智能,就应该先定义好一个新物种,因为这个新物种肯定不是与人雷同,这个新物种定义清楚以后再决定怎么做。
查红彬:
我的观点是,现在人工智能的热潮的确是推动了社会和产业的发展,但是这里有很多要素需要进一步剥离开,需要细化。不能单纯只看数据和算法,很多其他因素都需要考虑,比如,智能体和环境之间的互动。如果没有智能体与环境间的密切互动,系统的自主学习就很难做到。
山世光(主持人):
好,今天的讨论到此结束,希望大家有所收获,再次感谢几位嘉宾非常幽默,其实没有保留的分享,感谢大家。