解决方案:滑窗法
特别特征:因为注册必登陆,行为能体现用户的某种本质,所以对注册当天提取了特征,注册本身是一种异常,所以去除注册当天记录后再提取特征
主要使用lgb模型,xgb、catboost提升微小。另外使用了三个NN模型(keras tensorflow)。前两个NN结构相似,都是把mlp,lstm,cnn集合在一个网络中。
lgb线下0.8905~0.891,三个NN线下都可以0.891
第一个NN训练方式非常对新手友好,
第二个NN训练比较正常。
第三个NN为GBDT特征(使用xgb提取) deepFM,主要是对网上的开源代码做了点修改,以个人理解实现。
滑窗法对近期用户预测不准:
另外对26-30的用户使用单天滑窗,单独提取特征,使用5个lgb模型进行单独预测
AI项目体验地址 https://loveai.tech