最新 最热

python中三个不常见但是非常有用的数据科学库

如果你从事数据科学研究有一段时间了,那么pandas, scikit-learn seaborn和matplotlib这些库你都应该非常的熟悉。

2021-08-20
1

用于时间序列分析的 5 个Python 库

时间序列分析是数据科学家最常见的问题之一。大多数时间序列解决方案涉及经济预测、资源需求预测、股票市场分析和销售分析。

2021-08-20
1

TODS:从时间序列数据中检测不同类型的异常值

时间序列异常值检测旨在识别数据中意外或罕见的实例。作为数据分析最重要的任务之一,异常值检测在时间序列数据上有多种应用,例如欺诈检测、故障检测和网络安全攻击检测。例如,雅虎 [1] 和微软 [2] 已经建立了自己的时间...

2021-07-23
1

pandas简单应用---近邻分析

GIS中有个专业术语最邻近分析,属于空间统计或空间分析的范畴。Arcgis中有近邻分析,生成近邻表,计算紧邻点距离等相关功能。

2021-07-15
1

机器学习专题

随着人工智能的火热,机器学习和深度学习技术再一次进入了大众的视野。python的scikit-learn模块专注于机器学习领域,提供了数据集构建,数据预处理,模型算法,效果评估等各个环节的接口,是入门机器学习的最佳模块。...

2021-07-06
1

提高回归模型精度的技巧总结

在这篇文章中,我们将看到如何处理回归问题,以及如何通过使用特征转换、特征工程、聚类、增强算法等概念来提高机器学习模型的准确性。

2021-07-01
1

Chefboost:一个轻量级的决策树框架

我在Twitter上偶然遇到了chefboost,因为我之前从未听说过它,所以我决定快速查看并测试它。在本文中,我将简要介绍这个库,并提到它与常用库scikit-learn的主要区别,并展示一个在实践中使用chefboost的快速示例。...

2021-07-01
1

如何消除多重共线性

机器学习是一种解决不能明确编码的问题的方法,例如,分类问题。机器学习模型将从数据中学习一种模式,因此我们可以使用它来确定数据属于哪个类。...

2021-07-01
1

使用Scikit-Learn的HalvingGridSearchCV进行更快的超参数调优

如果你是Scikit-Learn的粉丝,那么0.24.0版本你一定会喜欢。里面新特性包括model_selection模块中的两个实验性超参数优化器类:HalvingGridSearchCV和HalvingRandomSearchCV。...

2021-07-01
1

当Sklearn遇上Plotly,会擦出怎样的火花?

Plotly:协同 Python 和 matplotlib 工作的 web 绘图库官网链接:https://plot.ly/python/

2021-06-24
1