最新 最热

【机器学习】--决策树和随机森林

决策树是一种非线性有监督分类模型,随机森林是一种非线性有监督分类模型。线性分类模型比如说逻辑回归,可能会存在不可分问题,但是非线性分类就不存在。二、具体原理...

2018-09-13
0

2018.02.04.一周机器学习周记

(临近春节,亲朋好友来往频繁,昨日还应邀前往潮州宾馆参加了校友会举办的会议,进度相对受制)

2018-09-13
0

2018.01.21.一周机器学习周记

3.根据提示,在官网下载对应的CUDA版本,下载完成后进行安装(安装之前先卸载本地的旧版本)

2018-09-13
0

第14周Python机器学习周记

(2)新增一个键值(maybe),计算香农熵,观察其变化(熵越高,则混合的数据也越多);

2018-09-13
0

吾爱NLP(3)—我对NLP的理解与学习建议

简单来说,NLP = Nature Language Process = 自然语言处理 ≈ 语言信息(文本/语音)+机器学习 。

2018-09-12
0

如何快速入门成为厉害的数据分析师,一份完整书单

“一切都被记录,一切都被分析”就了一个信息爆炸的时代,人类过去两年产生的数据占据了整个人类文明中所产生的数据的90%。而在这些无限丰富的数据中,蕴藏着巨大的价值,数据分析在数据爆炸式增长的前提下变得炙手可热,数据...

2018-09-12
0

决策树实现鸢尾花三分类

Iris(鸢尾花)数据集是多重变量分析的数据集。 数据集包含150行数据,分为3类,每类50行数据。 每行数据包含4个属性:Sepal Length(花萼长度)、Sepal Width(花萼宽度)、Petal Length(花瓣长度)和Petal Width(花瓣宽度)。可通过这4个属...

2018-09-10
0

基于决策树的鸢尾花分类

原文链接:https://www.jianshu.com/p/c09beac9f955 本文经过潇洒坤重新编辑,感谢原文作者的辛勤工作。

2018-09-10
0

Spark MLlib知识点学习整理

MLlib的设计原理:把数据以RDD的形式表示,然后在分布式数据集上调用各种算法。MLlib就是RDD上一系列可供调用的函数的集合。

2018-09-06
0

数据挖掘10大算法详细介绍

在一份调查问卷中,三个独立专家小组投票选出的十大最有影响力的数据挖掘算法,今天我打算用简单的语言来解释一下。

2018-09-06
0