关于主数据,你感兴趣的都在这里

2023-03-02 14:21:25 浏览数 (1)

11

2022-12

关于主数据,你感兴趣的都在这里

昨天的文章简单提了主数据的概念,相信不少小伙伴还处于道理我都懂,但还是不会用的状态,所以今天,我们就来深入谈谈主数据的用法。

LEARN MORE

图片来自网络,如侵删

通俗易懂解释

对于一个陌生的新概念,使用我非常推崇的概念分解法来学习绝对是一个好办法。如果你随手百度一下,你就会知道,正经的主数据定义是这样的:

1.主数据(MD Master Data)指系统间共享数据(例如,客户、供应商、账户和组织部门相关数据)。

2.与记录业务活动,波动较大的交易数据相比,主数据(也称基准数据)变化缓慢。

3.在正规的关系数据模型中,交易记录(例如,订单行项)可通过关键字(例如,订单头或发票编号和产品代码)调出主数据。

4.主数据必须存在并加以正确维护,才能保证交易系统的参照完整性。

5.高质量的主数据依赖于围绕主数据构建的流程、系统和管理要求,其对应的载体为主数据管理系统。

乍一看会给人一种每个字我都认识,但是连起来又不知道是什么意思的感觉。哪怕我已经用分层分段法拆分好了,依然会给人这种感觉。要知道,概念定义这种东西的存在,目的是为了清晰地界定一个概念,本来就不是用来给你在实际应用中的,会有一种道理我都懂但是依然很难落地的感觉也是正常的。

从应用的角度来说,主数据其实有三层含义:

1.主数据是一个系统最重要的数据

2.如果有数据不一致,请以此为准

3.啥数据都可以容错,这玩意容不得错

这样解释一下,大家是不是瞬间就对自己能接触到的数据中哪些是主数据有数了?如果还是没有,那就再教你一招,不管公司是做什么业务的,和钱和人有关系的数据,就是主数据。

先说钱,公司赚了多少钱,亏了多少钱,业绩提成发了多少,广告费用支出了多少,这些都是主数据。和这些东西密切相关的数据也是主数据,比如订单,支付了多少单四舍五入就是公司收入的钱嘛。再说人,客户是人对吧,客户的个人信息,性别年龄等就是主数据。对内来说,员工是人吧,员工发工资用的银行卡就是主数据。辅助这两个例子,就明白了吧,为啥少说主数据是啥玩意都可以错,这玩意不能错。

再说如果不一致请以此为准怎么理解。

一个最简单的例子,银行流水和系统里的订单,如果银行流水实打实收到的是10元,系统订单写的是100元,哪个是对的,显然是银行流水对不对。对于多数公司而言,和钱有关系的数据都不会错得离谱的,但是和业务有关系的数据,错起来没谱是很常见的,这就是界定以谁为准这件事的必要性。

搞主数据做什么

这个界定对于数据分析师而言是有重大意义的。搞清楚主数据就能解决很多问题:

1.某个特定的需求应该如何

取值

2.如何去push产品研发团队来改进数据质量

先说特定需求取值的问题,当公司有多个系统的时候,很有可能出现同样的信息在不同的系统都有存储的情况。例如客户的基础属性信息,很有可能在CRM系统中和用户管理系统中均有存储,并且按照常识来说,只要一个数据被存储了两份,就一定会有两份数据不一致的问题(此处插一句,作为数据分析师,可千万不能相信研发说得两份数据完全一致,有技术手段保障数据一致之类的话,这种存了两份的情况,99.99%会带来数据不一致的问题),当我们在进行数据取值和分析使用的时候就需要判断了,到底以哪一个数据为准。先做主数据界定的意义就在这里了,界定好某一个数据以哪里为准,就能省去很多不必要的麻烦。

如果说界定的意义只是规范数据取值的位置,那就大错特错了,界定主数据在实操上最最重大的含义还是在于找到责任人。

俗话说冤有头债有主,我们数据狗经常要给产品研发的bug和漏洞背锅,界定主数据就是一个很好的要求研发和产品为自己的失误背锅的过程。订单数据归订单开发团队对吧,如果系统bug导致数据错误,那就是这个开发团队的问题,这个团队应该负责确保记录的数据准确无误。这样一来,遇到坑爹的系统数据错误,就能找到合适的背锅侠了。

THANKS

做数据的二号姬

0 人点赞