做过120个项目的“老兵”谈复星集团的大数据布局 | 数据科学50人· 甄浩

2018-08-08 14:11:57 浏览数 (1)

如今,我们每个人都在谈论“数据科学”,哈佛商业评论杂志甚至将数据科学家定义为“21世纪最性感的职业”。在这个大数据时代,究竟什么是数据科学?数据科学领域的科学家、从业者们又究竟是怎样的一群人?他们在创造着什么令人着迷的东西?DT君将在2018年走访50位来自各行各业的顶尖数据科学从业者,希望能让你们了解这些神奇的人和他们神秘事儿,为你们一窥数据科学的未来与未知。

▍搞大数据不会说段子怎么能当好首席数据官

2018年2月初,在复星集团举办的2018年C2M智能科技峰会上,DT君听到了两个大数据的段子。一个是关于国内几类大数据人群“脸谱”的:

如果在某个大数据相关会议上,有人一上来就提算法,那八成是学校的人;而如果一上来就提Hadoop、Spark的,一定是开源社区的人;一上来就用三个V、四个V来定义大数据的人,基本上是政府官员或者刚刚接触大数据的人;而一上来就谈到项目的人,多数是工程师或项目经理。

说段子的,是复星集团旗下上海星济信息科技的首席数据官甄浩。按照甄浩自己的描述,他更像是最后一类大数据人。在他的职业生涯中,各类数据项目一直是他最为熟悉和擅长的。

(图片说明:甄浩在2018年C2M智能科技峰会现场接受DT财经专访)

过去15年,甄浩先后服务过民企、国企、外企,做过数据工程师、数据架构师、大数据解决方案顾问、总数据官等。这期间,他主持或参与的数据类项目有近120个,涉足银行、保险、医疗、互联网等多个领域。

近些年,甄浩却尤其专注于健康医疗大数据的运营与产业化开发,并且还担任国家卫计委委员会和多个项目的专家委员。

2017年12月,甄浩从北京转战上海,担任作为复星集团旗下大数据业务平台的上海星济信息科技有限公司首席数据官。甄浩眼中,未来,医疗大数据仍是自己最想继续深耕的领域,复星大数据也会用大数据和AI去赋能各个行业,做智慧医疗、智慧旅游、智慧商圈等。

与甄浩见面,DT君还收获了第二个段子。在问及数据科学的定义时,甄如实道来:“很多人会将数据科学定义成一套科学,但像我们做的这类业界的事情,算不算呢?我觉得算。科学家常常做的事情很神秘,结果反而弄得很学术。”

提到这,作为大数据界的段子手的甄浩说了另一个段子:

数据科学其实做的就是两件事,第一是算命,就是根据历史的情况来分析现在是什么情况。测字先生通常会问你要问什么事情,然后通过数据,掐指一算告诉你出现了什么情况。第二件事叫做改运,因为已经知道了发生了什么状况,下一步就是要趋利避害,让数据告诉你如何改变命运。

甄特别强调业务场景的重要性。“很多科学家在实验室中埋头做数据分析得到的结论,在业界却可能是常识,要避免这样的问题,就应该更加结合业务,做到所谓的’接地气’。”

▍谈数据思维:从项目驱动到运营驱动

甄浩是北京人,本科学的是电子工程,毕业之后,先是进入一家科技公司担任数据工程师,后来又在长城计算机软件与系统公司担任数据架构师。

尽管一开始做的是编程,更多和前端及后台算法接触,但和数据打交道多了,甄浩对数据在企业内部的应用和作用也逐渐明晰。在他看来,算法和各种编程语言是相对多变的,但数据却是相对稳定,也是和业务最为接近的。

用他的话说,“2005年、2006年的时候,自己就看到了这样的趋势,因此也决定做离业务更近一些的东西”。

这样的想法,在IBM中国得到了实现。2011至2015年间,甄浩任职IBM中国公司大数据解决方案顾问,各种不同类型的数据项目,着实让自己离业务近了很多。这一时期,他作为项目负责人,给银行、电信、政府、保险等行业的不同公司提供过大数据解决方案。

在这些案例中,他印象比较深刻的是曾经帮助中国银行做过呼叫中心的数据项目。

甄浩说:“以往,呼叫中心的话务员接到呼入的电话,要在目录菜单里面慢慢找答案,耗时较长。但我们帮他们做了一个搜索引擎,只要输入关键词就能迅速查到结果,就跟百度一样。并且新的数据能够实时更新到库中,被迅速查询到。当时,我第一次明显感觉到分布式计算对整个系统带来的支撑,能够同时支撑几千个话务员进行实时的查询。”

在IBM的项目经验算是甄职场的分水岭。此前,他做的工作多是由项目来推动。但离开IBM后,他在阿里短暂任过数据生态总监,也在国企中电旗下中电数据服务有限公司担任过首席数据官,再到2017年底进入复星,这一阶段则是基于数据运营来驱动。

“在这些企业内部,初期的时候往往也有很多项目,但当数据积累下来、治理好之后,就转为数据运营。”

在从事数据项目和运营的相关工作之余,甄浩也在工程专业方向越钻越深,2010年,他取得中国科学院研究生院的软件工程硕士学位;目前担任首席数据官的他,还是天津大学先进制造方向的在读工程博士。

所学专业的变换,看起来和数据的关联不大,尤其先进制造方向。但其实不然。甄浩告诉DT君,很多人觉得,搞数据科学的人和搞工程实践的人水火不容,但在他自己的实践中,这两方面并不矛盾,比如,目前他博士期间的研究方向是脑机接口、物联网相关的先进制造,这和数据的关系很大。

▍谈医疗大数据:产业化起步,前景向好

过去几年,国内医疗行业兴起了一场大数据变革。变革的背后有着政府政策层面的强力推动。

2016年10月,国家卫生计生委在北京的一场电视电话会上,宣布福建省、江苏省及福州、厦门、南京、常州为健康医疗大数据中心的第一批试点省市,2017年12月,试点进一步扩大到了山东、安徽、贵州三省。

甄浩在任中电数据服务有限公司首席数据官期间,曾深度介入国内健康医疗大数据产业,是福州市医疗大数据中心与产业园建设国家试点工程的项目负责人。

甄指出,在医疗大数据领域,几个不同的主体有着不同的诉求:国家卫生计生委的诉求,是能合法收集医疗大数据;地方政府则希望兼顾经济发展、招商引资;而医院本身,也有数据分析应用的需求,比如说跨医院的转诊或者科研,就有着数据交流、共享的需求。

“健康医疗大数据涉及到国家的生物安全,不太能商业化,有着某种社会公共的属性”。虽有商业化方面的限制,但在福州项目上,甄浩带领的团队基本摸索出了一条路。

先是立法,由政府出台数据的相关管理办法,明确权责、数据权属、数据的运营方案等;第二步则是数据的汇聚,在福州,健康医疗大数据中心汇聚了市里二级以上医院的全量数据,让数据能够实时呈现;第三步是在地方立法的前提下保护数据的安全和隐私。

“从数据安全方面考量,由我们将数据随意给出去是危险的,因此我们选择了定向开放,只有遵守数据的安全和隐私规则,并且在产业园区落户的企业,才可能获得数据。”

而一旦在合法前提下向部分企业开放了医疗大数据,产生的产业化能量可能是巨大的。比如,制药企业可以加快新药研发的效率,对保险业来说,则可以基于临床的数据,获得关于某些疾病的发病率、人群方面的信息,在推出新的健康险产品和营销方面,也有很大的帮助。

在甄浩看来,这基本上是一个良性的循环。“对当地政府来说,能通过引进产业获得税收,而税收又能直接转化为惠民服务。而从居民个人来说,以往挂号时挂什么科可能都不太了解,但有了数据的支撑,可以很精准地知道。此外,将来医院还可能基于大数据,给不同的症状的患者提供定制化的服务,这对于患者自身也是有利的。”

▍复星集团的大数据布局

2017年12月,甄浩从中电数据服务有限公司转到复星集团旗下星济信息科技有限公司任职首席数据官。从北京到上海,这背后,甄浩的考虑是上海在大数据应用方面的施展空间更大。

在复星,大数据方面的内部整合和新的布局已经展开。目前,整合内部资源,复星推出了“星际大数据”平台,在这个平台,能够提供各行业的解决方案。

“复星的业务以往更多是以实体为主,比如医药、地产、建材等等。星际大数据平台,就是希望能通过大数据、AI(人工智能)赋能各个行业,为传统行业带来转型升级。”甄浩说。

另一方面,复星提出了C2M(顾客直连工厂,Customer to Manufactory),在这之中,大数据算是最核心的内容。

(图片说明:复星集团的C2M阐释)

目前,基于复星自己的实体产业资源,“星际大数据”平台已经有几个大的业务板块,比如,智慧商圈、智慧金融、智慧旅游、智慧健康。

举例来说,复星已经在智慧商圈方面有所布局,与上海豫园商圈的合作即是一例。

甄浩向DT君介绍,传统上来说,商圈运营模式最大的问题在于无法量化,因此要做的第一件事情就是“线下业务的线上化”。复星帮助豫园开发了一款商家导航类的App,通过App,可以定位到商家的位置等信息。对商圈运营者来说,这样就可以收集到一部分用户的数据,了解到人流量、顾客画像等信息,这些在以往都是摸不准的。

不过,这种新的模式的最大问题在于,如何才能吸引顾客下载并持续使用App?

对于这一点,甄浩觉得,问题要回到数据的运营。“要吸引更多人来用,就得根据顾客的习惯,以数据为核心,打造一个业务闭环。通过数据的运营,为用户提供更好的服务。”

除了智慧商圈,智慧健康也是甄浩最希望能取得突破的。他提出了依托于复星医药和医院相关的产业资源,打造以人的健康为核心的智慧大健康业务板块的想法。

具体做什么?怎么做?

“从复星集团来说,健康医疗是很重要的一个业务板块,在实体业务方面也有深厚的积累。我们就希望能打造一个面向政府、医院和基层的的健康大数据的产业生态平台,做到惠民,惠企,惠政。”甄浩如此解释。当然,要完全实现以数据运营为核心的健康医疗产业生态闭环,他也坦承,需要做的工作还有不少。

展望未来的工作和过往的经历,甄浩尤其觉得,做大数据工作,每个人对数据的准确都应常怀有“敬畏之心”。

他跟DT君举了这样的例子:

刚刚入行之初,他参与了澳洲保险集团的一个数据项目。当时,原始的业务系统是英国人做的,因为没有校验功能(DT君注:校验功能能避免很多错误,比如,限制数据格式,格式填错就无法提交),澳洲保险集团在中国的业务操作人员录入的数据很多都较为粗糙,有不少“脏数据”,直接影响了其后的数据分析。

于是,澳洲保险集团和英国供应商取得了联系,希望能对原始业务系统加以改造,加上数据校验的功能。不过,英国派来的一位工程师对此明确拒绝。

“这位英方工程师表示,确保录入数据的正确是你们的职责,而不是系统的问题。”对刚入行的甄浩来说,这样的回答让他震撼。甄感慨说:“中国人的思维常常是我们在系统设计上就把所有的问题都给预防了,但却忽略了最细微处的个人对数据的责任。这显然是数据文化出了问题。”

文 | 胡世龙: hushilong@dtcj.com

题图 | 视觉中国

▍数据侠门派

甄浩,复星集团上海星济信息科技有限公司首席数据官。有15年IT行业经验,10年数据相关领域经验。先后在民企、国企、外企、互联网企业中从事数据类相关工作。曾任IBM大数据解决方案顾问、阿里云数据生态总监、中电数据服务有限公司总数据官。曾主持或参与近120余个数据类项目。近些年专注于健康医疗大数据运营与产业化开发。

0 人点赞