2016年12月8-10日,由中国计算机学会(CCF)主办,CCF大数据专家委员会承办,中国科学院计算技术研究所、中科天玑数据科技股份有限公司与CSDN共同协办,以“聚焦行业最佳实践,数据与应用的深度融合”为主题的2016中国大数据技术大会在北京新云南皇冠假日酒店隆重举办。
2016中国大数据技术大会首日全体会议中,启明星辰公司副总裁,CCF大数据专家委员会副秘书长潘柱廷带来了题为《大数据发展趋势报告》的分享。期间,潘柱廷表示大数据发展趋势报告作为大数据技术大会的保留议题,每年都会发布一次,今天他带来了大数据领域的10大预测。他强调,今年的预测更多的关注技术,其中有7条是来自技术领域的预测,相比往年今年在技术领域更加关注,主要包括机器学习继续成为智能分析的核心技术、人工智能和脑科学相结合称为新的热点、多学科融合和数据科学兴起、大数据处理多样化模式并存融合,流计算成主要模式等等。体现了专家委寄希望于技术本身上寻求更多的突破。
除了总体的预测,他也带来了众多单项的预测,包括来自大数据应用、数据类型突破、数据资源流转、大数据发展的主要推动者等。
各位嘉宾大家上午好!我代表大数据专家委,向大家发布在大数据专家委所统计和发布的这样一个大数据发展趋势的报告。
这个报告我想大家都已经参加多年,可能比较熟悉了,这个报告是大数据专家为每年在技术大会上的保留节目,也就是在大数据专家为内部通过对专家的意见征集,最后投票、汇总形成这样一个对下一年大数据趋势的预测,当然这个预测并不是神预测,而是反映了大数据专家委这样一百多位委员对大数据的看法,大家基于这个预测可以有不同的解读。2017年大数据发展趋势十大预测:
1.机器学习继续成智能分析的核心技术。
2.人工智能和脑科学相结合,成为大数据分析领域的热点。
3.大数据的安全和隐私持续令人担忧。
4.多学科融合与数据科学兴起。
5.大数据处理多样化模式并存融合,流计算成主流模式之一。
6.数据的语义化和知识化是数据价值的基础问题。
7.开源成大数据技术生态主流。
8.政府大数据发展迅速。
9.推动数据立法、重视个人数据隐私。
10.可视化技术和工具提升大数据分析工具的易用性。
这里稍微提炼一下,十个预测可以分为三大类,首先是大数据专家委在今年的十条预测里对比去年和往年更加关注技术本身,就是在十条里有七条技术是纯技术的话题,不像往年有多条都是关于产业或者资本,这些都没有成为今年的热度,所以看到专家委寄希望于技术本身上寻求更多的突破。
第二是安全和隐私,安全和隐私几乎每年都会排在第三、第四的位置上,也就是说安全隐私成为现在阻碍大数据发展的几乎是唯一的一个制约因素,这样一个担忧使得数据的开放步伐放慢,使得大家对大数据的深度应用可能会带来负面价值等等令我们产生担忧,其实对安全的担忧成为我们对大数据发展的重要威胁,这是需要解决的一个问题。
另外,大数据专家委除了关注技术上,还是期望在政策和法规上能给予大数据发展有效的帮助,也就是说我们在关注技术和市场的时候,相对从市场的需求和政府的诉求上,更偏重于政府的诉求。这个是一个有意思的现象,我们期望于政府的力量和法规合规性的力量来推动大数据的发展。
这是对整个十条发展趋势的基本解读,我们简单回顾一下从2012年底做的2013年的预测,到今年预测,从2013年概念化的对大数据的趋势预测,到2014年开始更关注价值,数据背后的价值。第三年的预测,出现了一些更加具体的一种趋向性的引导,强调跨界、强调融合,强调在基础科学和基础技术上寻求突破,这是第三年预测的特点。第四年的预测体现了一些政策、战略方面的认识,比如说关注民生,同样是多样化的技术,同时对政策和生态给予比较多的关注。今年的预测主要是这两条,除了安全本身的特殊问题,大家更关注技术本身,同时寄希望于政策法规带来驱动力。
如果大家记不太清楚,我用这样一个十组关键字,基本上大家很容易能理解到,这样一个预测,并没有跳出大家的一个大的预期。可以看到现在整个大数据的发展并没有出现所谓的黑天鹅或者是一个突破性的变化,所以机器学习、人工智能、脑科学、安全、隐私、学科融合、数据科学、多样化处理、流计算、语义化、知识化、开源、政府大数据、立法、可视化,这些条目是从几十条搜集出来提炼出来的十条。
大数据专家委除了这样十大预测之外,也做了一些专项分析预测,其中部分预测还是很有价值的,这里介绍一下,就是一些单项的趋势调研。
大数据应用。因为大数据在应用,这是五年以来在做的单项调研,到底哪一个应用领域会得到瞩目,我们看到这五年以来应该说互联网金融一直是这样一个话题,而且尤其近四年的调研,互联网金融和健康一直排在前三甲。今年的调研把城镇化和制造业这两个方面放在灰色的区,因为后面这几个跟金融的票数差异是一个大的因素,如果大家真正看的话,关键就是前三个。另外和去年相比有意思的是金融退到第三,健康医疗放到第二,这个原因大家可以自己体会。比如从我个人体会来说,也许和互联网金融及其所面临的风险有某种关联度,这体现了专家委专家对应用领域上稍微的微调。
数据类型的突破。数据本身是大数据最重要的东西,哪个数据类型会得到重要的突破,这里指突破而不是说取得巨大的成绩。这里面城市数据、图形图象数据、语音数据和视频数据这四方面是大家认为突破的点,可以解读为现在大数据专家委研究的重点可能在这几个方面,语音数据和视频数据放在一起,因为它们票数是一样的。这是2017年对数据类型的看法。
数据资源流转。我们做研究、应用都有一个难题就是有没有数据,数据从哪里来,所以数据的流转、交换去年开始做了一个调研,我们看到今年的结果非常有意思。一起个小的变化是会买数据集退到第四位,而且票数和前面的差距也挺大的。大家现在对数据流转和数据交换并不抱太大的期望值,真正数据的流转并没有形成一个良好的,哪怕是共享或者哪怕是交易的氛围并没有形成,所以大家会转而倾向于自己搜集数据,去下载和能获得的免费数据,而对于通过交易和价值交换带来的数据集,尤其量比较大的数据集这方面的期望值在降低,当然还有人会免费提供数据集。这一点对整个大数据领域和数据领域来说是想办法努力解决的一个重要的点,这几条预测其实反映的是一个比较严重的问题。
大数据的主要推动者。到底是什么样的力量在推动大数据的技术、产业、应用这方面的推进,前年是互联网公司、政府机构和大学科研院所,到第二年的调研,科研院所从我们的名单中消失了,大家认为推动起来其实推动利用并不来自大学和科研院所,资本的力量和各种资源的力量并不来自于它。去年也许随着双创的概念,创业公司成为一个大家寄希望的推动者,但今年创业公司从这个名单中消失,这个名单中几乎只剩互联网公司和政府机构,其它的票数都很少。这反映了什么?和刚才大数据趋势十大预测中,政府大数据成为十大预测之一,这两个的调研是相符的,因为互联网是大数据推动是毋庸置疑的,不需要多谈,所以真正新的力量推动来自政府,政府在治理理念上的变化,治理方法的变化,带来对大数据真实性的需求,大家对这方面寄予比较高的期望,这是对主要推动者的预测。
这是从前年开始大数据发展阶段的预测,这里面把三年的预测一起列在上面,大家可以看到这里面的变化,用参加投票的专委专家的百分比来做这样一个展示,这个对大数据的发展阶段。在这六个阶段里可以看到,整体来说大数据专家委的专家们对大数据的发展前景还是持乐观态度,也就是第二第三和第六阶段里还是占到主流,基本上在70%的量。
乐观角度来说,从去年即将快速增长的比例是有所下降的,而有相当多的专家认为大数据已经过了幻灭期而进入稳定增长。因为这从技术上所谓的泡沫破裂期是不是真的度过,这个是在大数据专家委的专家中还是有一定的分歧。但总体来说大家对于大数据的看好还是毋庸置疑的,或者说大数据是否真的能跨越幻灭期持续实现有效的技术发展和应用的价值呈现,这也是值得我们持续去关注的。所以这样一个关于阶段的评判方面的预测,也会继续在后面每年的预测中继续为大家呈现这样的变化。
我想这一些单项的调研和预测,其实每个人都可以有自己的解读,我这里只呈现一个初步的解读,我想这些数据,大家可以有自己的理解,并由此产生2014年大家对于大数据技术产业和应用方面一个新的决策,希望对大家明年的决策有所帮助。
另外,如果大家希望关注更详细的大数据专家对于2017年大数据趋势预测具体的数据和内容,也请关注下一期的中国计算机协会通讯和大数据杂志。我这里的报告就到这里,谢谢大家。