最新 最热

盘点 | Python自带的那些数据集

在学习Pandas透视表的时候,大家应该注意到,我们使用的案例数据"泰坦尼克号"来自于seaborn自带的在线数据库,我们可以通过seaborn提供的函数load_dataset("数据集名称")来获取线上相应的数据,返回给我们的是一个pandas的Da...

2020-07-21
1

[Hands On ML] 2. 一个完整的机器学习项目(加州房价预测)

范数的指数越高,就越关注大的值而忽略小的值。这就是为什么 RMSE 比 MAE 对异常值更敏感。但是当异常值是指数分布的(类似正态曲线),RMSE 就会表现很好。...

2020-07-13
1

用 Scikit-learn Pipeline 创建机器学习流程

使用 Scikit-learn Pipeline 可以很容易地将机器学习中的步骤串联起来,简化流程大幅度减少代码冗余,方便结果复现。

2020-07-07
1

Python机器学习算法随机森林判断睡眠类型

本案例通过对多导睡眠图(Polysomnography,PSG)数据进行睡眠阶段的分类来判断睡眠类型。训练:对Alice的睡眠数据进行训练;

2020-06-29
1

Python机器学习:通过scikit-learn实现集成算法

在现实生活中,常常采用集体智慧来解决问题。那么在机器学习中,能否将多种机器学习算法组合在一起,使计算出来的结果更好呢?这就是集成算法的思想。集成算法是提高算法准确度的有效方法之一,本文将会介绍以下几种算法:...

2020-06-11
1

使用 Auto-sklearn 开启自动机器学习之旅

定义1 自动机器学习 AutoML: 对于 ,令 表示特征向量, 表示对应的目标值。给定训练数据集

2020-05-20
1

Automatic cross validation自动交叉验证

We've looked at the using cross validation iterators that scikit-learn comes with, but we can also use a helper function to perform cross validation for use aut...

2020-05-06
1

Using many Decision Trees – random forests使用多棵决策树--随机森林

In this recipe, we'll use random forests for classification tasks. random forests are used because they're very robust to overfitting and perform well in a vari...

2020-04-29
1

类别不平衡学习:论文/代码/框架/库

今天向大家介绍一个跟踪不平衡学习问题的Github资源仓库,文末附其中 7 篇相关综述论文下载。

2020-04-27
1

Probabilistic clustering with Gaussian Mixture Models

用基于概率的高斯混合模型聚类In KMeans, we assume that the variance of the clusters is equal. This leads to a subdivision of space that determines how the clusters are assign...

2020-04-24
1