简介:杰少,南京大学硕士,天池数据科学家,就职于阿里。KDD19, NIPS18, JDD19第二名,天池竞赛5次Top3,其他数据竞赛平台奖项20余项。
import xgboost as xgbimport numpy as npimport pandas as pdfrom sklearn.model_selection import train_test_split if __name__ == '__main__': iris_feature_...
7月中旬答辩结束,大概三个月后才抽空完成这篇比赛总结,争取参加过比赛都有一个总结分享。
参考:https://xgboost.readthedocs.io/en/latest/get_started.html
这句话,说起来很简单,看起来也很容易,但真的是这样吗?我列举几点,扩展一下上面这句话:1、label符合业务场景吗?label准确吗?能够校准吗?放在哪张表里,怎么正确关联特征?2、特征合理吗?预处理流程正确吗?有效吗?特征会泄露标签信息吗...