最新 最热

移动腾讯网 | 推荐系统 embedding 技术实践总结

当前主流的推荐系统中,embedding 无处不在,从一定意义上可以说,把 embedding 做好了,整个推荐系统的一个关键难题就攻克了。因此,本文总结了移动腾讯网推荐系统中的 embedding 技术实践,力图达到娱人娱己的目的。...

2020-05-28
1

【机器学习基础】一文详尽之支持向量机(SVM)算法!

寄语:本文介绍了SVM的理论,细致说明了“间隔”和“超平面”两个概念;随后,阐述了如何最大化间隔并区分了软硬间隔SVM;同时,介绍了SVC问题的应用。最后,用SVM乳腺癌诊断经典数据集,对SVM进行了深入的理解。...

2020-05-26
0

通过空气质量指数AQI学习统计分析并进行预测(上)

AQI(空气质量指数),用来衡量空气清洁或者污染的程度。值越小,表示空气质量越好。近年来,因为环境问题,空气质量也越来越受到人们的重视。

2020-05-26
0

经典中的经典--泰坦尼克号的乘客生存预测

数据分析/挖掘是以概率论、线性代数、统计学、信息论为基础,根据之前接触到的数据挖掘流程,可定义为:数据准备-->数据探索--> 数据预处理-->特征工程-->模型建立-->模型评估,其中数据探索、数据预处理、特征工程针对某一...

2020-05-25
0

使用Python线性回归预测Steam游戏的打折的幅度

上篇文章我们解决了Steam是否打折的问题,这篇文章我们要解决的是到底打折幅度有多少,这里我们就不能使用分类模型,而需要使用回归的模型了。

2020-05-20
0

来自G胖的微笑:使用python监督学习预测Steam游戏打折的概率

本期文章分为两期,第一篇我们先解决是否Steam平台的游戏会不会打折?下一期我们会详细分析影响Steam的打折因素

2020-05-20
0

精品教学案例 | 金融诈骗数据分析与预测

本案例适合作为大数据专业数据科学导引、数据清洗或机器学习实践课程的配套教学案例。通过本案例,能够达到以下教学效果:

2020-05-19
0

一文详尽之支持向量机算法!

寄语:本文介绍了SVM的理论,细致说明了“间隔”和“超平面”两个概念;随后,阐述了如何最大化间隔并区分了软硬间隔SVM;同时,介绍了SVC问题的应用。最后,用SVM乳腺癌诊断经典数据集,对SVM进行了深入的理解。...

2020-05-16
0

写给初学者的LASSO回归

LASSO回归是对回归算法正则化的一个例子。正则化是一种方法,它通过增加额外参数来解决过拟合问题,从而减少模型的参数、限制复杂度。正则化线性回归最常用的三种方法是岭回归、最小绝对值收敛和选择算子(LASSO)以及弹性网...

2020-05-15
0

归一化vs标准化,哪个更好

众所周知,特征工程是将原始数据转换为数据集的过程。有各种可用的功能工程技术。两种最广泛使用且最容易混淆的特征工程技术是:

2020-05-09
0