最新 最热

探索MLlib机器学习

实用工具:线性代数,统计,数据处理等工具 特征工程:特征提取,特征转换,特征选择 常用算法:分类,回归,聚类,协同过滤,降维 模型优化:模型评估,参数优化。...

2021-01-26
0

普华永道全息图解机器学习

几十年来,人工智能研究者的各个「部落」一直以来都在彼此争夺主导权。现在是这些部落联合起来的时候了吗?他们也可能不得不这样做,因为合作和算法融合是实现真正通用人工智能(AGI)的唯一方式。这里给出了机器学习方法的演...

2021-01-21
0

【技术创作101训练营】2021年战胜机器学习纸老虎-第一周 关于模型的思考

接触机器学习已经3年多,书是看了几本,网课也上了不少节,但由于没有真实应用,还停留在抄代码的阶段,一直没能进步。到了21年立flag的日子,就拿出它来,与自己约定,做一个系列,坚持每周一篇,从学习到应用。...

2021-01-20
0

树状图js的实现方法

本文是基于决策树的需求做的前期demo实现,所以以二叉树为实现目标。基本术语如下:

2021-01-19
0

机器学习入门 12-3 使用信息熵寻找最优划分

在上一小节中介绍了一个新指标:信息熵。通过信息熵可以计算当前数据的不确定度。构建决策树时,初始状态下,根节点拥有全部的数据集。在根节点的基础上,根据划分后左右两个节点中的数据计算得到的信息熵最低为指标,找到一个...

2021-01-18
0

机器学习测试笔记(14)——决策树与随机森林

在介绍决策树之前我们先来介绍下信息熵,信息熵是约翰·香农根据热力学第二定律,在 1948《通信的数学原理》一书中提出,主要思想是:一个问题不确定性越大,需要获取的信息就越多,信息熵就越大;一个问题不确定性越小,需要获取的...

2021-01-18
0

机器学习测试笔记(13)——决策树与随机森林

在介绍决策树之前我们先来介绍下信息熵,信息熵是约翰·香农根据热力学第二定律,在 1948《通信的数学原理》一书中提出,主要思想是:一个问题不确定性越大,需要获取的信息就越多,信息熵就越大;一个问题不确定性越小,需要获取的...

2021-01-18
0

Python每日一记42>>>机器学习中特征重要性feature_importances_

在进行机器学习算法中,我们常用的算法就像下面的代码形式类型 经历导入数据-预处理-建模-得分-预测  但是总觉得少了点什么,虽然我们建模的目的是进行预测,但是我们想要知道的另一个信息是变量的重要性,在线性模型中,我们...

2021-01-15
0

基于系统日志分析进行异常检测

日志解析:https://github.com/logpai/logparser 异常检测:https://github.com/logpai/loglizer 预备知识:需要对逻辑回归、决策树、SVM、PCA、聚类等有一些了解 论文原文: https://github.com/AmateurEvents/art......

2021-01-14
1

R语言统计知识以及常用方法实例

文章目录统计平均值中位数众数线性回归一元多元回归逻辑回归正态分布决策树随机森林生存分析卡方检验统计平均值语法mean(x, trim = 0, na.rm = FALSE, ...)x - 是输入向量。trim - 用于从排序的向量的两端删除一些观...

2021-01-14
0