最新 最热

数值数据的特征工程

数据馈送机器学习模型,越多越好,对吗?好吧,有时数字数据不太适合提取,因此,本文将介绍多种方法,可以将原始数字转换为更可口的东西。

2020-12-14
0

通俗易懂讲解机器学习中的特征工程

特征工程目的:从特征集合中挑选一组具有统计意义的特征子集,从而达到降维的效果。流程:找一个集合,然后针对某个学习算法,测试效果如何,一直循环找到最优集为止。...

2020-12-14
0

最通俗易懂的——如何将机器学习模型的准确性从80%提高到90%以上

数据科学工作通常需要大幅度提高工作量才能提高所开发模型的准确性。这五个建议将有助于改善您的机器学习模型,并帮助您的项目达到其目标。

2020-12-14
0

【论文解读】DeepFM论文总结

本次要总结分享的是 推荐/CTR 领域内著名的deepfm[1] 论文,参考的代码tensorflow-DeepFM[2],该论文方法较为简单,实现起来也比较容易,该方法在工业界十分常用。...

2020-12-11
0

文本分类六十年

文本分类是自然语言处理中最基本而且非常有必要的任务,大部分自然语言处理任务都可以看作是个分类任务。近年来,深度学习所取得的前所未有的成功,使得该领域的研究在过去十年中保持激增。这些文献中已经提出了许许多多的...

2020-12-09
0

吃透论文——推荐算法不可不看的DeepFM模型

今天选择的这篇叫做DeepFM: A Factorization-Machine based Neural Network for CTR Prediction,翻译过来就是DeepFM:一个基于深度神经网络的FM模型。这篇paper的作者来自哈工大和华为,不得不说在人工智能领域的很多论文...

2020-12-08
0

机器学习在高德起点抓路中的应用实践

导读:高德地图作为中国领先的出行领域解决方案提供商,导航是其核心用户场景。路线规划作为导航的前提,是根据起点、终点以及路径策略设置,为用户量身定制出行方案。...

2020-11-27
0

广告行业中那些趣事系列:推荐系统中不得不说的DSSM双塔模型

摘要:本篇主要介绍了项目中用于商业兴趣建模的DSSM双塔模型。作为推荐领域中大火的双塔模型,因为效果不错并且对工业界十分友好,所以被各大厂广泛应用于推荐系统中。通过构建user和item两个独立的子网络,将训练好的两个“...

2020-11-25
0

Python的9个特征工程技术

https://github.com/NMZivkovic/top_9_feature_engineering_techniques

2020-11-20
0

SQL和Python中的特征工程:一种混合方法

在了解Pandas之前,我很早就了解SQL,Pandas忠实地模拟SQL的方式使我很感兴趣。通常,SQL是供分析人员使用的,他们将数据压缩为内容丰富的报告,而Python供数据科学家使用的数据来构建(和过度拟合)模型。尽管它们在功能上几乎是...

2020-11-19
1