Excel具有非常强大的功能,能够满足大多数情况下的数据分析和图表可视化,其丰富的插件体系也让Excel在数据处理、数据挖掘、可视化、机器学习等方面如虎添翼。这些插件跟Excel完全互补,不用学习额外语法,可以快速实现清洗...
如果你还不知道决策树算法,你可以选择和韩梅梅同学一起边相亲边学习决策树(手动狗头):
这是一个新的系列,主要讲机器学习的相关算法,希望想入门的你能耐心看完《写在前面的话》
本文介绍了XGboost模型。首先在GBDT的基础上介绍XGboost,然后对比了XGboost与GBDT的不同之处,最后介绍了XGboost的损失函数和学习过程。
本文介绍了提升树模型中的梯度提升树算法GBDT (Gradient Boosting Decision Tree) 。首先介绍了提升树通过拟合残差来提升学习器的设计思想。然后介绍了基于梯度提升的GBDT算法,核心在于学习器本身不再拟合残差,而是学...
决策,指决定的策略或办法。是人们为各种事件出主意、做决定的过程。它是一个复杂的思维操作过程,是信息搜集、加工,最后作出判断、得出结论的过程。...
机器学习(Machine learning)是关于计算机系统执行特定任务的算法和统计模型的科学研究,它不使用明确的指令,而是依靠模式和推理来完成任务。(Wikipedia)...
本文介绍了结合集成学习思想的随机森林算法。首先介绍了集成学习中两种经典的集成思想Bagging和Boosting。然后介绍了Bagging的两个关键点:1)样本有放回随机采样,2)特征随机选择。最后介绍了Bagging的代表学习算法随机森...
本文介绍了 ID3,C4.5,CART三种基本的决策树模型。首先介绍了决策树的特征选择,包括信息增益,信息增益率、基尼指数、最小均方差分别对应分类树ID3、C4.5、CART、回归树CART。然后介绍了决策树建树的一般流程、对比分类树...
在之前的系列中。我们学习了DFS、BFS,也熟悉了平衡二叉树,满二叉树,完全二叉树,BST(二叉搜索树)等概念。在本节中,我们将学习一种二叉树中常用的操作 -- 剪枝。这里额外说一点,就本人而言,对这个操作以及其衍化形式的使用会比...