实时即未来,大数据项目车联网之驾驶行程采样入库【十五】

2023-02-01 17:36:19 浏览数 (1)

文章目录

    • 1. 驾驶行程采样入库
      • 1.1 驾驶行程采样逻辑
      • 1.2 添加行程划分水位线(最大乱序时间为30秒)
      • 1.3 根据vin进行分组
      • 1.4 驾驶行程分析创建会话窗口(15分钟划分一个行程)
      • 1.5 指定window function,处理行程划分采样逻辑
      • 1.6 驾驶行程采样入库(hbase)

1. 驾驶行程采样入库

l 驾驶行程数据筛选入库,为第五节的行程指标采样分析的数据

行程指用户在一定时间内,连续的、不间断的驾驶车辆进行移动行为。根据停车时间超过15分钟划分行程。驾驶行程采样指的是从一份数据里面取部分数据,这部分数据作为驾驶行程数据的样本。

1.1 驾驶行程采样逻辑

l 驾驶行程数据的采样的目的:

n 确定行程划分的划分时间段(t检验与f检验样本数据)

n 对样本数据进行分析(核对行程划分的对应指标分析结果)

n 对车辆打标签,进行车辆画像(用户画像处理)

l 驾驶行程采样结果数据字段:(都是字符串类型,同一个车辆采样数据放一个字段

0 人点赞