2016年4月20日,“中国信息通信大数据大会”于北京召开。在本次大会上,工业和信息化部通信发展司司长闻库、中国通信信息化部副总经理兼CTO范济安、中国电信云计算中心主任赵慧玲等嘉宾出席了本次大会。
IBM系统硬件部电信行业技术总监 房树新
以下是IBM系统硬件部电信行业技术总监房树新演讲实录:
从电信运营商角度我们看到了几大地域,有B域、M域、O域,IBM过去很多时候都是在B域里面,在CRM这一块做的很多,另外在数据仓库这一块,不管是服务器的提供和软件的提供。随着大数据这几年如火如荼的发展,我们的工作也主线是在精分这一块,还有在B域这一块展开比较多一点。
我给大家展现大数据给我们带来什么?我们看到过去只是喊有技术了,怎么可以和实践结合呢?怎么利用大数据技术,能够给我们的企业带来价值,实际上过去我们也是在不同领域展开这样一个探索。现在来看,确实是随着大数据的建设,真的是带来了一种商业的价值。谈大数据都是X86、互联网发展来的,都用的是开源软件,是不是这些开源软件是在IBM平台上跑不起来呢?过去三大运营商里面很多应用服务器都是用的小机,小机上面可以跑AS系统,可以跑很多系统。现在我们在企业级用的各种各样的小机,完全可以把它装成一个操作系统可以使。
谈到大数据,大家说X86是廉价的,是成本比较低。从IBM在转型,它也推出了一系列的低端的服务器,用于在X86这样一个价格的档次,同时它又用到了一些小型机的处理能力、可靠性、稳定性,还有上面一些广大的运维支持的IBM的这些能力,这些能力不能光用IBM的商用软件,一定要用开放的软件去整合在一起。
这张图整合了,现在不管是O域、B域、M域常常用到的开源软件,这些开源软件在IBM的芯片上都能跑起来。过去我们做了很多实践,也是基于开源软件来的。我们是企业级的客户,除了用到开源数据,还要有KPI的要求,开源有可能不稳定,出现问题往往得不到及时的解决。现在有回归的看法,并不是追时髦,今天你出了某个版本,马上就使用。我要解决企业问题的,不是一个学术单位,不是一个研究单位,我一定要用有服务,有保障的解决方案,所以就冒出来了大数据有自己的模块,同时有服务支持能力的。IBM也是其中之一,第一部分是开源,你有我有,第二部分,你有,我没有,第三部分是各家公司在开源这上面加入的有价值的那一部分,这一部分是要收费的。同时如果这些东西用到企业级里面,还有一个运维的保障,这是给大家汇报一下解决方案。
我现在结合两个案例,给大家汇报一下我们在大数据领域里面做的众多案例里面选了两个,一个是纯开源的,一个是用的半商业的加开源的方案。第一个案例跟汤总介绍的有点类似,这个省份的运营商要把它的B域、O域、M域和第三方的数据做一个采集,有一个接口,数据抽取出来保存下来,在上面导入Hadoop,去做分析加工,然后再转到它的主体库里面。在这里面用到了X86一部分机器,用到了IBMpower芯片,构成了一个完整的大数据场景。
在最上面就是它的业务,跟上午各位领导专家讲的一样,客户的画像,精准营销,还有长漫游包的处理等等,都是基于整个大数据平台构建的一个业务层面的展现。到今天来讲,这个是做到了第二期了,第一期用了60台机器,上面构建了ETL等等,在接口层面透过IBM四台V7000,把各种数据抽取到这上面来,建立了一个全省统一的一份数据,能够被多个业务进行分析加工处理,这是一个IT的配置。
下面可以看到全是用的开源的东西,比如Hadoop的2.0、3.0。随着逐渐的建设,它引入了南大通用通用的数据库,用了28台机器,构建了高节点的数据库,跟原来的几十台的廉价的X86曙光浪潮的机器,构建了一个贮备库。随着业务量的突飞猛进,原来构建的库显得不够用了,到今天它扩到了102台机器的架构。这是一个架构演变的图,可以看到它的主库是DBT库,分布式数据库有主的,有备的,Hadoop也有一个全量的备份库,还有流处理的。这些库建设干什么呢?通过不同的库做不同的事情,比如DBT保存6+1月的地域的数据和备份数据,Hadoop是B域和O域的全量数据,通过6+1、12+1、3+1,根据业务保存不同的需要,用不同的X86技术和Power芯片技术,达到了一个混合的架构,一个是为了性能,一个是为了业务区分它的重要性和投资的考虑。
另外一个案例就是另外一个省的,这个省的案例原来是X86的案例,是用的纯开源的。纯开源碰到问题以后,得不到解决,用户吃了不少苦头。在后面建设的时候,他说我要在软件和架构层面有一个服务保障的解决方案,这里面就用到了30台Power系统,它认为是一个小机的架构技术,又是一个X86的价格,性能和稳定性是有保障的。另外原来用的全是CDH的解决方案,现在他用到了IBM的大数据文件系统,再结合开源的东西,来处理它的上网数据。这些每天的量达到50个TB,基于这样一个架构,各开发商在上面用SV来做各种各样的应用。
随着建设的发展,现在到了第二期,第二期主要是性能和容量,要补充第一期的不足。同时第二期还要再建一个跟第一期进行互补,或者是做一个互相备份的功能。在第二期里面就引入了更高版本的对Hadoop2.0的支持,构建了第二期的平台。前面通过处理,导向大数据平台。这基本上是第二期增加的部分,用了16核的机器,38台,用了IBM的大数据平台,建设了第二期,把数据和应用做隔离,做到两个系统同时运行,做到一个相互呼应。
另外一个就是用大数据来解决企业的问题,发现在性能方面还是不够。从Hadoop到SPARK,在内存迭代分析,觉得性能还不够,现在还得探讨引入SAPHANA这样的技术,我们能不能把它用在精分里呢?比如我把精分的数据和前面生产的数据,通过一个SAP工具导入HANA里面,我在上面进行分析加工,这也是现在展现的一个思路。其实这个是在国外HANA用的非常广泛,并且用的HANA都是支持十几个T、几十个T的一个场景。一种情况是用高端机器,我就用大内存、大数据能力来进行处理。
另外一个解决方案,我用受节点,构建多节点的东西去处理,这些东西对我们电信领域来讲都可以用。这个就举一个例子,在实时营销和实时报表方面,我就借用HANA快速内存计算的能力来引入这个技术进行处理。在这里我们探讨的是,我把数据仓库的数据导到HANA内存库里面,分析的时候基于HANA里面的数据进行分析加工,能不能在4G时代能够实时做到用户对通话,对流量使用的情况,快速作出决策。如果原来在数据仓库里面这个时间还是满足不了实时这块分析,引入HANA以后就是一个很好的思路。这些我们是在一些省份也在落地,在进行各种测试和验证工作。
另外用户提到在大数据里面,我买X86的机器,X86的机器可能在它的带宽上和CPU上和IO上有一些短板的地方,在Power芯片的机器能不能和X86机器搭一个混合架构,这边是给大家一个功能的验证。在一个Hadoop里面,我用Power芯片来做,用X86来做,构建一个混合的Hadoop没问题。如果是一个X86做主节点,其他的混合结构是做从节点,来发起对任务的调度和处理,也是没问题的。反之也是一样,通过这样一个验证,能解决有些省份的需求。我机器可能不被一家来绑架,我要根据我的集采,买了不同处理能力的机器,能不能放在统一大数据平台里面,构建一个多租户,统一共享的能力,甚至把Hadoop和SPARK在混合架构上来部署,这些是给大家一个信心,是可以的。
另外一个就是Docker,现在有了Docker以后,能不能把web服务器节点放在Docker里管理呢?Docker以及Docker之上的管理就摆在大家面前了,这是我们现在跟很多省份在谈,怎么把一些传统的架构改成一个微服务的结构,改成微服务的结构,就会带来什么问题呢?Docker那么多,怎么部署Docker?怎么监控Docker?怎么用多租户的方式,这个就带来了一个问题,IBM是在操作系统方面,在核心的调度管理方面是IBM有很多软件的积淀和积累。上午我的同事李永辉谈了很多多租户管理,我们把那个技术拿过来,绿的那一层,就可以和K8S对接,下面有Docker,同时加入了多租户的调度和管理,加入了监控和管理,加入了我上面的作业是实时应用的也好,我可以放在一起,构成一个统一的资源池,用Docker管理。这是IBM在开源的基础上,整合IBM有价值的能力,为我们不同的需要来提供解决方案。
另外从硬件上,这些加速方面,因为芯片的设计和带宽的设计,体系结构的设计,相对X86,我们就是有4倍或几倍的理论带宽和实际的处理能力。从实际处理能力来讲,给大家举一个例子,一台十核的机器和24核的E52090V3比,如果跑,我们一个核能跑到4.6个核的E52090V3的处理能力。简单总结一下,我们过去做了很多大数据的实践,为什么得到一些认可?一个是用户对小机的处理能力还是有一个继承性,另外它稳定、可靠性方面,他觉得比X86稳定。尽管X86可以说我用软件技术来屏蔽单点问题,但是现实很多软件还没有做到微服务,还没有像互联网那样,改造成容忍某个节点死掉,对整个系统的业务连续性还能保持很好,我们业务还没做到那一步。单节点的稳定性可能在现阶段还是一个强调的重点,另外在操作系统方面,可能买了一个订阅,有可能开了扣了以后解决不了,如果用IBM,IBM投入了巨大力量在参与社区,贡献核心的开发。我们看到很多实际的跟IBM结合的,IBM会有一个很强的队伍跳进来,分析这个内核的问题,也贡献了很多核心的功能。IBM我们是一块来解决问题,这也是一个售前、售后服务的保障和对核心业务的快速响应的保障。这些可能给大家有一个共识,在大数据方面,IBM还可以做一些事情。时间关系,我就介绍分享到这里。谢谢大家!