快手活跃用户预测_哈工大团队解决方案

2019-10-28 17:08:48 浏览数 (1)

“快手”新注册用户脱敏和采样后的数据30天,预测未来7天活跃的用户。

解决方案:滑窗法

特别特征:因为注册必登陆,行为能体现用户的某种本质,所以对注册当天提取了特征,注册本身是一种异常,所以去除注册当天记录后再提取特征

主要使用lgb模型,xgb、catboost提升微小。另外使用了三个NN模型(keras tensorflow)。前两个NN结构相似,都是把mlp,lstm,cnn集合在一个网络中。

lgb线下0.8905~0.891,三个NN线下都可以0.891

第一个NN训练方式非常对新手友好,

第二个NN训练比较正常。

第三个NN为GBDT特征(使用xgb提取) deepFM,主要是对网上的开源代码做了点修改,以个人理解实现。

滑窗法对近期用户预测不准:

另外对26-30的用户使用单天滑窗,单独提取特征,使用5个lgb模型进行单独预测

AI项目体验地址 https://loveai.tech


0 人点赞