01
前言
本文是“思路比代码重要”系列的第3篇
- 1 - 零售超市数据分析(趋势和指标)
- 2 - 网约车渠道初级分析(漏斗与整体结构)
- 3 - 网约车司机情况中级分析 | 单维度分类(切割法)
前两篇推文中,我们知道了在分析数据时,指标选取以及确定标准的重要性。如果没有时间回顾,可以快速过一下下面两幅总结图。该系列的前两篇文章都是针对单一的指标进行分析,分析思路也比较初级。
当指标不止一个时该使用什么分析方法或思路呢?
其实很多时候,通过对单一的指标进行切分,也已经能够产生该指标下的多维度分类(净利润指标,被切割成高、中、低等三个维度)。所以本文我们先从“把单一指标切割成多个维度”开始,为后续学习多指标切分打下基础。
| 本文原数据代码在后台回复 “单维切割” 即可获取~
02
业务案例
这是一份网约车司机的信息数据(仅一日)
- 这批司机当中,效率最高的司机是哪位?效率最低的呢?
- 这些数据反映了什么问题?(假设:车油耗是百公里8L,当前油价是6.6元/升)
节选展示
就在线时长这个指标为例,为什么有的司机只是工作1个小时多,我们上班正常来说都要 8 个小时。
那我们是不是可以把在线时长分一下类。同理,每个指标有没有可能其实都可以拆解成多个维度?只不过是我们需要知道每个指标的业务含义。
如何找业务含义?(对什么指标进行切割分类)
- 在线、星级、订单数、行车里程和车费,车费是结果指标
- 通过找指标间的关系:在线→订单(司机只有在线,才会有单接,才会产生订单)、行车→车费(接到单了,开始跑了,才能获得车费收入)
- 效率 = 投入产出 → 在线时长÷车费收入
前两篇推文提到,投入产出比法是衡量效率和经营状况的一个非常好的自带标准的指标,而这个案例中,司机的效率又与在线时长和车费收入有关。所以这里我们可以分别对在线时长和车费收入这两个指标进行切割分类。
这批司机当中,效率最高的司机是哪位?效率最低的呢?
这里我们可以直接使用投入产出比法来进行探索,计算之前,我们可以结合业务知识 “假设:车油耗是百公里8L,当前油价是6.6元/升”,并顺便将已知指标进行组合,得出一些后面可能会对分析判断有参考价值的新指标。
- 单位时间完成订单数 = 完成订单数/在线时长
- 每公里收入 = 车费收入/订单实际总公里数
- 净收入 = 车费收入 - (订单实际总公里数* (8*6.6) /100)
所以原数据变为:
又因为:投入产出比 = 净收入/在线时长,所以很快我们便能得出效率最高/最低的司机的基本情况
- 效率最高的司机一天只在线了不到两小时,就接了18单,赚了六百块钱
- 效率最低的师傅一天累死累活在线14个小时,也才接了3单,净收入50块左右(长此以往,一个月才1500??)
疑问与猜想:
- 虽然这只是一天的数据,但是否也足以说明该平台的司机存在虚假运力的情况,即:长时间在线,平台也派单了,但ta就是不接,可以混在线时长补贴(业务知识:有些网约车平台会对在线时间长的司机提供在线时长补贴),又或者这是挂着,兼职而已,想接的时候才接。
- 有没有可能是平台的派单系统出了问题,导致特定情况时派单效率很低,一些司机长时间在线却没被派到单
- ......
总之,这里只是反映出了初步问题,我们对之提出猜想,具体结果如何,我们还需要更多的数据(后续推文会继续深入)
这些数据反映了什么问题?
要想回答这个问题,我们依然可以从投入产出比 = 净收入/在线时长入手,这里我们对净收入和在线时长这两个指标进行切分
- 净收入:标准按照6000/月来估算
- 在线时长:每4个小时为一档
综合投入产出比求解效率最高/最低的司机,以及对日收入和在线时长这两个指标进行维度切分(数据 标准=结论,这里切分的标准是比较明确的),我们可以得出综合结论:
只观察一天的话
- 司机们的收入还行,只有少数没什么生意:日收入层级中等 较高 高的比例=14% 16% 49%=79%
- 大部分司机都比较辛苦:日在线时长超过8小时(中等及以上的)的比例=22% 26% 30%=78%
可能存在虚假运力的情况:效率最高的司机一天只在线了不到两小时,就接了18单,赚了六百块钱;效率最低的师傅一天累死累活在线14个小时,也才接了3单,净收入50块左右。
我们还需要进一步结合更多的数据和业务背景知识来探究平台与司机两者背后的值得改进的问题。
03
分析方法总结
单维度切分可以很好地将一个指标分成多类,计算该指标下每一类所占整体的比例,可在一定程度上反映潜在的问题。本文便是以司机效率作为引子,通过对决定投入产出比的两个指标:在线时长和净收入进行切分,最后对该数据集中司机们的收入和工作强度情况做出了基本的推断和描述,也发现了可能的潜在问题。
为什么不对其他指标进行单维度切分?
留到下一篇推文--两维度分类,那时候会继续推进细说。