最新 最热

GitHub最著名的20个Python机器学习项目

摘要: 开源是技术创新和快速发展的核心。这篇文章向你展示Python机器学习开源项目以及在分析过程中发现的非常有趣的见解和趋势。我们分析了GitHub上的前20名Python机器学习项目,发现sc...

2018-03-28
0

python数据分析师面试题选

python数据分析部分1. 如何利用SciKit包训练一个简单的线性回归模型利用linear_model.LinearRegression()函数 # Create linear regression objectregr = linear_model.LinearRegression()# Train ......

2018-03-15
0

分别用sklearn和tensorflow做房价预测

本篇是后面用tensorflow做回归时的一个参照,忍不住要说的是sklearn真是简单好用,要不是他没有卷积cnn等时髦模型,真是不想用其他家的了。经典的sklearn集成模型结果:真是又快又...

2018-03-15
0

scikit-learn的五种机器学习方法使用案例(python 代码)

对于一些开始搞机器学习算法有害怕下手的小朋友,该如何快速入门,这让人挺挣扎的。在从事数据科学的人中,最常用的工具就是R和Python了,每个工具都有其利弊,但是Python在各方面都相对胜出一些,这是因为scikit-learn库实现了...

2018-03-14
0

使用sklearn做特征工程

目录1 特征工程是什么?2 数据预处理  2.1 无量纲化    2.1.1 标准化    2.1.2 区间缩放法    2.1.3 标准化与归一化的区别  2.2 对定量特征二值化  2.3 对定性特征哑编码  2.4 缺失值计算  2.5 ...

2018-03-14
0

数据处理的统计学习(scikit-learn教程)

Scikit-learn 是一个紧密结合Python科学计算库(Numpy、Scipy、matplotlib),集成经典机器学习算法的Python模块。一、统计学习:scikit-learn中的设置与评估函数对象(1)数据集scikit-learn 从二维数组描述的数据中学习信息...

2018-03-14
0

用python做微博情感偏向分析

自然语言处理(NLP)中一个很重要的研究方向就是语义的情感分析(Sentiment Analysis)。例如IMDB上有很多关于电影的评论,那么我们就可以通过Sentiment Analysis来评估某部电影的口碑,(如果它才刚刚上映的话)甚至还可以据此预测...

2018-03-13
0

数据大师Olivier Grisel给志向高远的数据科学家的指引

原文:http://www.dataiku.com/blog/2015/09/28/interview-grisel-part1.html译文:http://www.csdn.net/article/2015-10-11/2825882(编译/刘帝伟 审校/朱正贵、赵屹华 责编/周建丁)译者简介:刘帝伟,中南大......

2018-03-13
0

线性回归:预测上海车牌成交价格

上海是全国最早实行私人轿车牌照拍卖方式来控制交通流量的城市,需要通过投标拍卖的形式购买车牌。而车牌的拍卖并不是简单的价高者得,服务器只接受最低可成交价上下300元区间内的出价,意思就是说,如果现在最低成交价是600...

2018-03-13
0

Python机器学习库scikit-learn实践

一、概述 以最广泛的分类算法为例,大致可以分为线性和非线性两大派别。线性算法有著名的逻辑回归、朴素贝叶斯、最大熵等,非线性算法有随机森林、决策树、神经网络、核机器等等。线性算法举的大旗是训练和预测的效率比...

2018-03-13
0