最新 最热

信用评分建模时的坑

实际工作中,清晰的数据分析流程是保证模型质量的重要手段,属于工艺的范畴。数据分析流程没有统一固定的标准答案,只有业界领先的经验,需要结合实际业务的特点进行不断调整与优化。...

2019-07-15
0

我眼中的数据挖掘算法

数据挖掘算法可以解决生活中很多问题,例如垃圾邮件的标记识别、欺诈交易用户的识别、品牌档次的判断定位、文章是否真的出自某位作家之手以及癌症细胞的判定等等,灵活的理解并应用数据挖掘算法可以高效的解决这些看似繁...

2019-07-15
1

如何构建一个好的数据挖掘模型

1 首先要保证数据质量,特征值需要选择好,其次需要弄明白业务需求,确立你的分析目标是分类还是预测

2019-07-15
0

建模前需要面对的问题

统计更加在乎的是模型应用的完善,即数据必须要符合模型的假定。任何一个模型都有假定。数据挖掘中,如决策树和神经网络做的时候很少会提到假定,实际上他们的假定和回归差不多。很多时候,我们用R或者SAS建立一个决策树会发...

2019-07-15
1

应该掌握的30个数据挖掘重要知识点!

4. 一般地说,KDD是一个多步骤的处理过程,一般分为问题定义、数据抽取、数据预处理,数据挖掘以及模式评估等基本阶段。

2019-07-15
0

决策树学习笔记(三):CART算法,决策树总结

推荐导读:本篇为树模型系列第三篇,旨在从最简单的决策树开始学习,循序渐进,最后理解并掌握复杂模型GBDT,Xgboost,为要想要深入了解机器学习算法和参加数据挖掘竞赛的朋友提供帮助。...

2019-07-15
0

决策树学习笔记(二):剪枝,ID3,C4.5

推荐导读:本篇为树模型系列第二篇,旨在从最简单的决策树开始学习,循序渐进,最后理解并掌握复杂模型GBDT,Xgboost,为要想要深入了解机器学习算法和参加数据挖掘竞赛的朋友提供帮助。...

2019-07-15
0

决策树学习笔记(一):特征选择

相信很多朋友已经对决策树很熟悉了,决策树是机器学习中的一种基本的可用于分类与回归的方法,它是一些集成学习如GBDT,XGboost等复杂模型的基础。这些高级模型比如XGboost可以非常好地拟合数据,在数据挖掘比赛以及工业界中...

2019-07-14
0

Python AI 教学 |决策树绘制函数介绍

前面的推文Python AI 教学 | 决策树算法及应用中我们已经介绍了如何从数据集中创建树,我们是用字典类型来存储决策树的,然而字典的表示形式非常不易于理解,决策树的主要优点就是直观易于理解,如果不能将其直观地显示出来,...

2019-07-10
0

Python AI 教学 | 决策树算法及应用

决策树是一种简单高效并且具有强解释性的模型,广泛应用于数据分析领域。其本质是一颗由多个判断节点组成的树,可以是二叉树或非二叉树。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的...

2019-07-10
0