最新 最热

专栏 | 基于 Jupyter 的特征工程手册:数据预处理(一)

特征工程在机器学习中的重要性不言而喻,恰当的特征工程能显著提升机器学习模型性能。我们在 Github 上整理编写了一份系统的特征工程教程,供大家参考学习。...

2022-01-14
1

干货 | 机器学习正在面临哪些主要挑战?

红色石头给大家介绍了《Scikit-Learn 和 TensorFlow 机器学习指南》第1次学习笔记。内容很干,翻译的质量红色石头自认为还是不错的,翻译的同时也会取舍或增加一些内容,尽量把主要内容提炼出来,希望能帮到大家学习这本书。...

2022-01-12
0

伴鱼:借助 Flink 完成机器学习特征系统的升级

在伴鱼,我们在多个在线场景使用机器学习提高用户的使用体验,例如:在伴鱼绘本中,我们根据用户的帖子浏览记录,为用户推荐他们感兴趣的帖子;在转化后台里,我们根据用户的绘本购买记录,为用户推荐他们可能感兴趣的课程等。...

2022-01-12
0

特征工程-使用随机森林填补缺失值

特征工程在传统的机器学习中是非常重要的一个步骤,我们对机器学习算法的优化通常是有限的。如果在完成任务时发现不管怎么优化算法得到的结果都不满意,这个时候就可以考虑回头在做一下特征工程。...

2021-12-30
0

Python中的时序分析工具包推荐(1)

时间序列分析是一类经典问题,常见的场景需求包括时序预测、时序分裂、时序聚类、异常检测等。作为一名算法工程师,当调包遇上时间序列,有哪些好用的工具包呢?本篇首先介绍3个:tsfresh、tslearn、sktime。...

2021-12-27
1

一文梳理2017腾讯广告算法大赛决赛方案

时隔两年,这篇决赛方案梳理悄然登场,主要针对前十名的方案进行学习,17的腾讯赛算法是比较早的ctr比赛,很多方法都值得借鉴,同时也不乏有经典的操作。当时的我还没有开始参加数据竞赛,不过在之后的比赛中,也常分析这场经典赛...

2021-12-24
1

TIANCHI-全球城市计算挑战赛-完整方案及关键代码分享(季军)

首先很幸运能和杰少、林有夕成为队友,与你们一起比赛真是件无比轻松的事情。同时希望我的分享与总结能给大家带来些许帮助,并且一起交流学习。...

2021-12-24
0

公积金贷款逾期预测

维持和发展信用关系,是保护社会经济秩序的重要前提。随着金融市场的发展,信贷业务日益增多,金融机构迫切需要了解信贷主体的信息情况,对信贷资产的安全性、信贷主体的偿债能力给与科学评价,最大限度地防范贷款逾期风险。...

2021-12-22
0

推荐系统中的自动化特征工程

在机器学习的各个子领域中,特征工程都扮演着重要的角色。业界有这么一句话,数据和特征决定了机器学习算法的上限,而模型、算法的选择和优化只是在不断逼近这个上限。通过运用领域知识,在原始数据集中构造解释变量,有利于机...

2021-12-14
0