最新 最热

随机森林回归算法_随机森林算法的优缺点

随机森林回归模型由多棵回归树构成,且森林中的每一棵决策树之间没有关联,模型的最终输出由森林中的每一棵决策树共同决定。 随机森林的随机性体现在两个方面:1、样本的随机性,从训练集中随机抽取一定数量的样本,作为每颗回...

2022-09-24
0

快速入门Python机器学习(20)

2001年Breiman把分类树组合成随机森林(Breiman 2001a),即在变量(列)的使用和数据(行)的使用上进行随机化,生成很多分类树,再汇总分类树的结果。随机森林在运算量没有显著提高的前提下提高了预测精度。...

2022-09-23
0

快速入门Python机器学习(19)

不管是决策树分类还是决策树回归,过拟合现象是决策树算法的最大问题,但是从“9.4.2分析有噪音make_regression数据”可以看到,决策树还是一种非常有效的方法,解决过拟合现象有以下两种方法:...

2022-09-23
0

快速入门Python机器学习(18)

信息熵(约翰·香农 1948《通信的数学原理》,一个问题不确定性越大,需要获取的信息就越多,信息熵就越大;一个问题不确定性越小,需要获取的信息就越少,信息熵就越小)...

2022-09-23
0

利用机器学习改善深对流参数化方案中的对流触发函数

大气环流模式(GCM)中深对流参数化的对流触发函数的缺陷对气候模拟具有关键影响。本研究利用机器学习分类模型XGBoost开发新的对流触发函数。对流事件相关的大尺度环境信息来自南部大平原(SGP)和Manaus(MAO)站点的大气...

2022-09-23
0

机器学习十大经典算法之随机森林

随机森林是机器学习一种常用的方法。它是以决策树为基础,用随机的方式排列建立的,森林里每个决策树之间都是没有关联的。 在得到森林之后,当有一个新的输入样本进入的时候,就让森林中的每一棵决策树分别进行一下判断,看看...

2022-09-23
0

机器学习十大经典算法之AdaBoost

集成学习大致可分为两大类:Bagging和Boosting。Bagging一般使用强学习器,其个体学习器之间不存在强依赖关系,容易并行。Boosting则使用弱分类器,其个体学习器之间存在强依赖关系,是一种序列化方法。Bagging主要关注降低方...

2022-09-23
0

机器学习十大经典算法之决策树

机器学习/人工智能的子领域在过去几年越来越受欢迎。目前大数据在科技行业已经炙手可热,而基于大量数据来进行预测或者得出建议的机器学习无疑是非常强大的。一些最常见的机器学习例子,比如Netflix的算法可以根据你以前...

2022-09-23
0

「技术」基于机器视觉的缺陷检测方法与机器学习的表面缺陷

基于机器视觉的缺陷检测方法目前,基于机器视觉的表面缺陷方法主要分为基于图像处理的缺陷检测方法和基于机器学习的缺陷检测方法。两种方法具体介绍如下。...

2022-09-22
0

决策树学习笔记

计算得到每个属性的基尼系数后,在候选属性集合A中,选择使划分后基尼指数最小的属性作为最优划分属性。

2022-09-22
0