CNII网讯 3月28日,在工业和信息化部的指导下,为期两天的“2017大数据产业峰会”在北京国际会议中心召开。本次会议由中国信息通信研究院和中国通信标准化协会共同主办,数据中心联盟大数据发展促进委员会承办,旨在宣贯和解读《大数据产业发展规划(2016-2020年)》,支撑大数据国家战略落地,展示大数据产业发展成果,探讨发展面临重大问题,推动产业交流与合作。
北京大学软件研究所副所长黄罡
北京大学软件研究所副所长黄罡在28日上午的《大数据产业发展规划(2016-2020年)》宣贯会上发表了题为大数据视角下的API经济的演讲。以下是内容实录:
大家上午好,我争取在给定时间内完成这个报告。本来我的报告学术性比较强,我想在十五分钟里怎么可能讲完,但是所幸的是今天早上邬院士报告把我要讲的技术问题的大背景和核心的影响讲得很清楚了,今天我来跟大家分享的是邬院士今天上午讲的,都是以数据集为核心的大数据的共享开放流通交易里面产生的种种弊端,但是其实我们放眼看世界,以美国为代表的数据的开放流通共享交易几乎不是以数据集为核心,而是以API,如果大家学过编程的都知道是应用编程接口。今天我希望从大数据视角下,尤其是邬院士讲了开放流通共享领域的问题,我们看API经济是怎么回事。
API经济是针对APP,APP是手机里的应用,移动互联网出现以后所有移动互联网的产业价值和用户价值都是以APP来体现的,但是我们也知道随着APP现在iOs过100万以后,大量的95%一身的应用已经变成了僵尸应用,美国由此产生新的应用分发模式API,你不要再花心思开发一个APP在应用商店上大力推广,几块钱一个应用,根本不用想这个,你要做的事情是把你自己的业务做好,把你的业务以API的方式开放出去,别人会在他的应用里面,不管是微信还是Face book,不管是电商还是采购都会集成你的,只要你的业务功能有价值,你的数据有价值。
我们可以看这张统计图,推特是聊天的,它每天有150亿的API对它的调用不是走他的APP而是走API,谷歌也是100亿API调用每天,当然还有美国其他的。可以看到越来越多APP的功能其实不是通过咱们打开那个应用使用的,而是通过API。当然大家要问了,在这里面为什么要把API开放出来,从大数据领域得到了什么,大家越来越多的可以看到我的API出去以后随着用户对我的调用,我会得到用户对我业务的诉求,我可以优化,所以基本上我们可以看到今天不管是微软、谷歌还是Face book,他们人工智能的核心业务一个方式是开源,第二方式是API,因为他的API发出去以后你对API所有使用,它可以得到进一步调优他的算法,这是我们的API经济。第一种模式是对外提供API。
第二种模式很简单,就是应用集成,大家可以看到今天用的Top的应用里,微信2015年已经集成了583个第三方应用的API,包括滴滴打车、大众点评,根本不用再打开那个APP,在微信、淘宝里就可以打开。美国的亚马逊的Echo,最上面是定时,播放音乐,帮我读新闻,帮我开灯关灯,帮我调温控,Echo把家里的智能服务以及移动互联网上APP以API的方式塞到了这个音箱里面,以语音交互的方式给你,这是我们看到的第二个趋势。API很像当年的网站,应用集成很像当年的门户,自然而然我们可以看到确实有搜索引擎存在,而且这块是我个人也要呼吁的,大家都在说苹果不创新了,我们国内的手机厂说今天干掉苹果明天干掉谁,大家可以看一下苹果已经在2015年9月10月推iOS9,通知栏已经可以让你收到苹果自己的应用。去年8月份iOs10已经实现第三方APP应用类数据或者API的搜索,大家可以看到这是我们的截屏。在你的手机里搜美食就可以把美团搜出来,是美团里的数据,不是美团APP。谷歌在数据API走得较缓,苹果是成功的,谷歌去年10月份推出了手机里面Google Assistant内嵌了苹果的搜索功能。
API真正遇到什么问题呢,最大的问题就是数据孤岛的问题,就像今天陈部长谢司长说的,越来越多的数据是从移动设备、物联网设备产生的,这些数据不是网站可以用爬虫公开爬到的。今天上午邬院士讲了很多数据开放共享流通的问题,API经济能解决类似的问题,以应用为驱动的方式,如果我们要解决数据孤岛目前有什么样的方式。据我们对国内一流大企业调研,典型的政府和央企的信息孤岛要打开要花数百万人民币,而且这在里面从数据开放流通的角度最大的问题是应用开发商成了关键角色,但这个关键角色不合理,因为在大数据里面真正的数据是产生者和运营者,跟开发商没关系。就像iOS和谷歌,后端数据不好拿,中间逻辑层重构太难,热点是我们在前面的表现层通过智能感知把数据拿出来,具体的技术我就不说了,总而言之整个这套技术目前除了斯坦福等顶级高效也就是iOs里面有一点。
北京大学从2003年开始做类似的研究,研究的成果,我们如果能打破APP的边界,我们可以在各个不同的APP之间跳来跳去,再也不用关心一个APP接下来要去打车要去订餐,全部可以给你打通。易道打车,你可能看到查询的结果是我在云里跑的,所以你的手机上那几百万个APP一个都不用装,你可以用API的方式使用它。
接下来是邬院士反复强调的数据的问题,今天个人数据主要是以程序化通过APP搜到平台卖给了别人,你在淘宝里的一双鞋在今日头条马上给你推,我们每个人都被边缘化甚至都被忽视掉,没有数据的人权。我们利用这套API技术做的什么,这是我们做的demo程序,你可以看到在你的手机上你有什么数据,第一你知道你的数据在哪个地方,第二你也可以知道每天在这些APP里产生了哪些数据,第三只要你授权,我们可以帮你把所有的产生的数据进行优化整合。
这样达到一个什么好处呢?我们解决了数据开放共享流通里个人的问题,第一这个数据至少每个人本身是有权利而且你确实知道这个数据在哪个地方,第二这个数据通过API的方式可以把它拿出来,当然我们不能阻止APP厂商使用,因为你跟它签了那个和约,但是这个数据本身是属于你,但是此前是因为APP根本不提供任何方式让你把数据拿出来,所以数据你根本不能使用,这样的话用了我们这一套API的技术以后你就可以使用了。最后你也可以进一步的利用加工,所有这些东西全是在你个人的手机上,永远不会上网,这样就极大保护了个人的隐私,当然这套数据人权保护合不合理,能不能成功,我不知道,我们只是从学术上提供一个可能的探讨思考。
我们同时也在帮政府和企业做到了燕云的DAAS平台,政府和企业信息系统里的数据全部是政府和企业的,但是今天真正要把它开放的时候往往受制于系统的开发,系统开发又说我要集成的时候又被另外一个开发商给打了,这样带来了极大的问题,燕云DAAS提供了API的方式,以APID方式把你的数据开放出去,可以做到流程可控、来源可溯,明天会有具体的介绍。
北京大学花了十几年时间,在这套系统软件上做了一套东西,我们希望把互联网和移动互联网以及物联网存在的各个系统里的数据,在数据拥有者授权的情况下帮他开发出来,帮他进行流通,帮他进行共享,这是一套大的生态,北京大学希望跟产学研各界和政府合作,共创中国特色的而且是领先的API经济,谢谢大家。