最新 最热

30个数据科学工作中必备的Python包!

来源丨数据STUDIO在本文中,云朵君将介绍一些非常独特的并且好用的 Python 包,它们可以在许多方面帮助你构建数据的工作流。Python 可以说是最容易入门的编程语言,在numpy,scipy等基础包的帮助下,对于数据的处理和机器学习...

2022-08-26
1

在表格数据上,为什么基于树的模型仍然优于深度学习?

机器之心报道机器之心编辑部为什么基于树的机器学习方法,如 XGBoost 和随机森林在表格数据上优于深度学习?本文给出了这种现象背后的原因,他们选取了 45 个开放数据集,并定义了一个新基准,对基于树的模型和深度模型进行比...

2022-08-25
1

机器学习特征数据预处理

关于特征值离散化的相关内容下面直接进行举例,主要是标签处理、特征处理和OneHot。

2022-08-18
1

脑电分析系列[MNE-Python-5]| Python机器学习算法随机森林判断睡眠类型

本案例通过对多导睡眠图(Polysomnography,PSG)数据进行睡眠阶段的分类来判断睡眠类型。训练:对Alice的睡眠数据进行训练;

2022-08-17
1

机器学习之KNN最邻近分类算法[通俗易懂]

KNN(K-Nearest Neighbor)最邻近分类算法是数据挖掘分类(classification)技术中最简单的算法之一,其指导思想是”近朱者赤,近墨者黑“,即由你的邻居来推断出你的类别。...

2022-08-10
1

机器学习模型太慢?来看看英特尔(R) 扩展加速 ⛵

我们在应用机器学习模型时,除了最终效果,也非常关注它们的性能。而机器学习模型的性能,不仅仅取决于我们的应用方式(特征多少、模型复杂度),也和硬件息息相关。...

2022-08-09
2

dataset数据集有哪些_数据集类型

​ sklearn的数据集库datasets提供很多不同的数据集,主要包含以下几大类:

2022-08-03
1

实验一:鸢尾花数据集分类「建议收藏」

利用机器学习算法构建模型,根据鸢尾花的花萼和花瓣大小,区分鸢尾花的品种。实现一个基础的三分类问题。

2022-08-02
1

机器学习基础篇_1/2

将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对位置数据的预测准确性

2022-07-25
1

一行代码加速sklearn运算上千倍

❝本文示例代码已上传至我的Github仓库https://github.com/CNFeffery/DataScienceStudyNotes❞

2022-07-06
1