数据百问系列:如何衡量一张或者多张数据表的价值?

2020-06-18 12:39:02 浏览数 (1)

00 前言

本期话题讨论:如何衡量一张或者多张数据表的价值?

如上,是居士最近看到小伙伴们讨论的一个问题,一些朋友也问过类似问题,因此发出来给大家来讨论,本文是将大家的讨论汇总成文,同时在末尾加上居士自己的理解。

01 讨论观点分享

讨论1

数据表的价值,要看是给谁看的。如果只是小白为了出报表凑数据,那价值就是帮助别人添花,如果是给懂数据和逻辑的同事看,而且能够层层递进直到触及问题根源,那价值就很大。同样是转化率,一个页面的转化率和一个登陆模块的转化率,就有很大的价值区别。总结一下,价值要看人看事儿。

讨论2

先定义低价值的特征可能会更简单一点,至少长期不被使用的表或字段,可以认为是低价值的,这应该是毫无疑问的。

讨论3

  1. 接入层和中间层,一般看这个表对应节点的下游节点的节点的多寡,如果是被引用或者依赖的次数比较多,会被列入重点监控的对象,自然其简直就会高
  2. 应用层,一般会同步外部存储进行报表展示,或者提供接口供外部访问,这种情况下,没有直接的下游节点,可以根据报表查看的次数或者接口调用次数来评价
  3. 部分面向特定场景的数据(高层或者财务结算等),其下游依赖节点少,访问频次也不高,但是因为汇报对象很重要,其数据的价值也比一般的表要重要

讨论4

最简单的指标就是字段在单位时间内被查询的次数

讨论5

需要结合他的使用对象,在整个数据链条中的位置来看,不同的角度对于价值的定义及看重程度都是不同的。对于业务人员来说就是它对于需求满足的程度,对于技术方来说则关注他的引用次数和复用度。最好的当然是不同的思维相结合,一步一步一点点的把复杂的业务场景问题拆解反映到数据上

讨论6

经营分析类报表还是以业务使用情况来评判,比如单位时间内的查看次数;非经营分析类(比如我们保险行业合规类)我们一般会推送到各系统中,这种需要看从各业务系统调用情况看

讨论7

  1. 分不同岗位职级,比如高层更多看的是汇总指标,单个客户明细表反而对一线员工更有价值,毕竟每个岗位层级能够操作干的范围不同
  2. 分业务阶段性战略目标,比如一张表是用来出数量的,后期业务调整,开始着重看客户质量等,那前期的数量相关表就基本没太多作用
  3. 看使用者用途,比如决定性方向的会议or用来甩锅的会议or只是用来看看,对方对于数据表的需求(准确性一致性等等)都不同,本身的价值也不同

02 总结

整体来讲,居士的意见和讨论3比较接近:

  1. 接入层和中间层,一般看被引用或者依赖的次数
  2. 应用层,一般看报表查看的次数或者接口调用次数来评价
  3. 部分面向特定场景的数据(高层或者财务结算等),不太容易量化价值,但是很重要!

然后,从另一个角度来看,单纯看表的价值,其实已经会比较被动了,这也是数据仓库同学经常会面临的问题,因为不管再怎么考核,这些表离业务价值还是太远了。

所以脱离表的角度来讲,可以多从其它角度思考,比如:

  1. 这些表提升了所支撑业务多少的运营效率?
  2. 比如广告、推荐等模块的提升效果里面,多少是你的表或者特征带来的提升
  3. 多做一些和业务提升贴近的数据,比如用户画像数据,可以用作提升DAU或者收入的用户圈定表等等

离业务越近,越容易体现价值。

0 人点赞