如果你从事数据科学研究有一段时间了,那么pandas, scikit-learn seaborn和matplotlib这些库你都应该非常的熟悉。
时间序列分析是数据科学家最常见的问题之一。大多数时间序列解决方案涉及经济预测、资源需求预测、股票市场分析和销售分析。
时间序列异常值检测旨在识别数据中意外或罕见的实例。作为数据分析最重要的任务之一,异常值检测在时间序列数据上有多种应用,例如欺诈检测、故障检测和网络安全攻击检测。例如,雅虎 [1] 和微软 [2] 已经建立了自己的时间...
GIS中有个专业术语最邻近分析,属于空间统计或空间分析的范畴。Arcgis中有近邻分析,生成近邻表,计算紧邻点距离等相关功能。
随着人工智能的火热,机器学习和深度学习技术再一次进入了大众的视野。python的scikit-learn模块专注于机器学习领域,提供了数据集构建,数据预处理,模型算法,效果评估等各个环节的接口,是入门机器学习的最佳模块。...
在这篇文章中,我们将看到如何处理回归问题,以及如何通过使用特征转换、特征工程、聚类、增强算法等概念来提高机器学习模型的准确性。
我在Twitter上偶然遇到了chefboost,因为我之前从未听说过它,所以我决定快速查看并测试它。在本文中,我将简要介绍这个库,并提到它与常用库scikit-learn的主要区别,并展示一个在实践中使用chefboost的快速示例。...
机器学习是一种解决不能明确编码的问题的方法,例如,分类问题。机器学习模型将从数据中学习一种模式,因此我们可以使用它来确定数据属于哪个类。...
如果你是Scikit-Learn的粉丝,那么0.24.0版本你一定会喜欢。里面新特性包括model_selection模块中的两个实验性超参数优化器类:HalvingGridSearchCV和HalvingRandomSearchCV。...
Plotly:协同 Python 和 matplotlib 工作的 web 绘图库官网链接:https://plot.ly/python/