本期Informatica微电台邀请到了Informatica中国区销售总经理李晨为我们揭示《长安十二时辰》的“硬核黑科技”,解密“古代大数据中心”靖安司——
大家好,今天我们要梦回大唐,聊聊《十二时辰》中的靖安司。这座唐朝的数据管理中心,司丞李必负责决策,那么他的决策依据从何而来?
大家好。我是李晨。最近被“硬科技”的《长安十二时辰》圈粉。
靖安司档案房,就是我们现代的大数据中心或数据湖了。依靠从各部抽调的35名精英吏员,对大唐所有行业、所有领域的各类原始数据进行人工梳理。找到相关数据后,以徐宾为核心算力,大案牍术为核心算法,对数据进行分析,利用基于特征的推荐系统,提供输出给到司丞李必进行决策。
靖安司运作核心在于这35名精英吏员能在浩如烟海的存档中快速找到徐宾所需要的数据。那放在企业里,数据资产管理应该由谁来做呢?是IT人员还是业务呢?
其实都不是。万物互联的时代,超过90%的数据都是由智能化设备自动产生的。这部分的数据梳理必须交给更加智能的系统来完成。
以Informatica企业数据目录为例,作为一个真正的企业级的数据资产目录,实现所有元数据的自动采集,同时:
● 提供组织内部共享,通过强大的推荐系统,利用群众的智慧丰富数据内容;
● 在没有IT人员的帮助下,让业务人员轻松的探索和发现数据,非常容易地找到想要的数据和信息,以及数据源、数据关系和数据意义;
● 让IT人员向业务用户提供定制化的数据资产和丰富的视图。
大案牍术是徐宾独创的算法,根据大唐卷宗案牍中记录的各种数字来准确推断真相,预测未来,这是不是大数据挖掘和预测的功能?
是的。剧中的数据挖掘部分,都是由徐宾这个人肉数据处理引擎进行的一个黑盒计算。徐宾信心满满地要通过这个算法来改变大唐由最高级别管理人员进行决策的传统,要建立一个真正数据驱动的商业决策的文化。就连主角张小敬的出场也是大案牍术基于其卓越战绩、上下级风评、任职期间功过等等进行推演而出,使得靖安司李必相信其虽有罪但今日可救长安。这就是典型的客户画像、行为预测,也是大数据未来的发展方向,由数据化业务处理迈向数据智能预测阶段。
那大案牍术这套神乎其神的算法后面有什么隐藏的问题?
徐宾的技术自然是好的。但也就是因为技术好,会产生“技术拜物教”的观念。然而大唐COO林九郎非技术出身,却根据自己强大业务观感,指出了徐宾没有思考到的一个关键问题:数据的可靠性。如果不能去伪存真,去粗取精地做好数据清洗和标准化,做所谓的预测分析只能是徒劳无功。剧中当徐宾想推荐张小敬出场时,却发现用算法怎么也得不出这个结论,于是只能仗着算法的封闭性,直接得出结果——把张小敬的名字写在上面。
那如何避免和防止这种问题的产生呢?
所有数据推演和预测的背后,必须要基于精准的数据质量。包括“长安大沙盘”等可视化展现的部分,也是需要完善的数据集成来实现可信的分析结果展示。所以数据标准化和数据质量提升,是作为数据智能化的重要基础工作。Informatica的数据质量和元数据管理平台,可以将这项古人认为不可能完成的任务非常容易地实现。在过去的10年间,Informatica一直作为市场公认的领头羊,引领这项技术的发展和应用。
《长安十二时辰》中对未来数据管理领域的硬核黑科技的预期,今天是不是都可以借助Informatica的数据治理平台来全面实现?
Informatica数据治理平台,依托领先的技术,整合所有接入的非结构化、半结构化数据,借助企业数据目录系统,对所有数据进行标准化和自动化关联,可深度挖掘其行为规律、关联关系、消费习惯等有价值的信息,为上层的应用平台提供目标线索、安全管理、商业运营等方面的认知数据, 实现“从数据处理到数据智能”的关键任务,构建全目标的知识图谱,真正完成对场景和目标的认知理解,从而帮助企业实现数字化转型。
古有大唐大案牍术
协助靖安司破案,守卫大唐长治久安
今有全球数据管理者Informatica
助力企业
成功走向数字化转型
数据驱动创新,智慧引领未来