文章目录
-
- 1. 驾驶行程采样入库
-
- 1.1 驾驶行程采样逻辑
- 1.2 添加行程划分水位线(最大乱序时间为30秒)
- 1.3 根据vin进行分组
- 1.4 驾驶行程分析创建会话窗口(15分钟划分一个行程)
- 1.5 指定window function,处理行程划分采样逻辑
- 1.6 驾驶行程采样入库(hbase)
1. 驾驶行程采样入库
l 驾驶行程数据筛选入库,为第五节的行程指标采样分析的数据
行程指用户在一定时间内,连续的、不间断的驾驶车辆进行移动行为。根据停车时间超过15分钟划分行程。驾驶行程采样指的是从一份数据里面取部分数据,这部分数据作为驾驶行程数据的样本。
1.1 驾驶行程采样逻辑
l 驾驶行程数据的采样的目的:
n 确定行程划分的划分时间段(t检验与f检验样本数据)
n 对样本数据进行分析(核对行程划分的对应指标分析结果)
n 对车辆打标签,进行车辆画像(用户画像处理)
l 驾驶行程采样结果数据字段:(都是字符串类型,同一个车辆采样数据放一个字段