- 1. 问题 -
最近在一个数据分析项目上遇到一个比较有意思的问题:
针对一个设备的计划作业时间段,要剔除一些特殊情况下占用的时间,最终得到该设备的实际作业时间,简化后数据如下图所示:
当然,对于特殊情况占用时间,不存在交叉占用的情况。
但是,对于每一个特殊情况时间段,和计划时间段之间的相对位置可能有以下6种:
比如第1种,特殊时间在计划时间之前,那么,需要剔除的时间为0;
情况2,特殊时间与计划时间在开始段有交叉,那么,需要提出的时间为特殊时间结束点减去计划时间开始点;
……
那么,难道要对每一个特殊时间段,分6种情况写if判断,才能确定它和计划时间的交叉时间吗?
【此处建议先自行思考几分钟】
……
……
……
……
……
……
……
……
……
……
……
……
……
……
……
……
……
……
……
……
- 2. 算法 -
实际上,对于2/3/4/6四种特殊时间段,它和计划时间的交叉部分,可以统一为一个逻辑:
两者结束时间的最小值 - 两者开始时间的最大值
以情况2为例,如下图所示:
而对于1/5两种情况,开始时间最大值超过结束时间最小值(相减为负数),实际为没有交叉时间,所以为0。
那么,经过上面的归纳,我们可以统一逻辑如下:
代码语言:javascript复制两个时间段的交叉时间
= Max(
0,
Min(计划结束时间,特殊情况结束时间)
-Max(计划开始时间,特殊情况开始时间)
)
- 3. 实践 -
因考虑到这种时间计算问题最终需要动态统计或展示,因此,主要考虑使用DAX实现:
1、将数据加载到数据模型后,建立两表间的关系:
2、计算列的实现方式
3、度量的实现方式
(思考一下,为什么度量里要多那么多个min,或者可以用其他什么函数代替?同时要按照实际模型情况修改使用哦。)
度量写好后,自然可以通过透视表的方式动态(如果有更多维度筛选影响的话)地展示出来:
交叉时间得到了,剔除这个交叉时间的问题应该就迎刃而解了,动手练一练?