机器学习工程师应当掌握的四大算法,你学会了吗?

2018-07-20 15:15:41 浏览数 (1)

作者 | Allerin

编译 | 聂震坤

机器学习在过去几年取得了惊人的进步。机器学习算法旨在将人工智能与真实的人类智能无缝融合,提供最高水准的准确性和理解。

近年来,机器学习系统已经发展到模仿人类大脑模式进行思考的模式。开发机器学习的算法目的是教授计算机如何识别对象的特征。例如,像电脑展示一张猫的图片并告诉电脑这是一只猫,电脑会使用刚刚获得的各种信息来辨别猫的各种特征。刚开始,电脑会认为有四条腿和一条尾巴的东西都是猫,然而随着鹿的信息被插入进来,它可能更改认为猫是一种小体积的宠物动物。随着更多的动物被添加进来,这些特征会越来越准确,精确。多亏了这种机器学习算法,电脑才能够给每一个模型定义提供一个预测性的值,用来判定他对此物体的判别有多大把握。例如,黄色会增加对判定香蕉的把握值;绿色会提高对绿叶的判定值。

本文将会分享几种最常使用的机器学习算法。这些算法基本可以解决所有的数据问题。

机器学习算法1:线性回归

线性回归有助于基于连续变量估计实值。使用此算法,通过拟合最佳行来建立独立变量和因变量之间的关系,这个最合适的线被称为回归线。这个回归线是使用线性表达式, 其中包括:

  • Y —— 因变量
  • a —— 斜率
  • X —— 自变量
  • B —— 截距

通过最小化数据点和回归线之间的距离的方差的和来导出系数a和b。

线性回归包括两种类型:简单线性回归和多线性回归。简单线性回归包括一个自变量,而多线性回归则由多个独立变量表现。

机器学习算法2:决策树

决策树是一种主要用于分类问题的监督学习算法。它可以用于分类和连续因变量。在该算法中,样本群被分为两个或多个均匀集合。这种分类是基于变量最重要的属性,以尽可能划分出更多更细的组。

机器学习算法3:SVM(支持向量机)

在本机器学习算法中,可以将每个数据项目绘制为n维空间中的一个点,并且每个要素的值由特定坐标的值表示。

例如,如果您只具有两个特征(如个体的身高和体重),则可以先在二维空间中绘制这两个变量。在这个二维空间中,每个点都有两个坐标,称为支持向量。接下来应该找到一条将数据分成两组不同分类的线,这条线是两组中最近点的最远距离。

机器学习算法4:朴素贝叶斯

这是基于贝叶斯定理的分类算法,假设预测器之间是独立的。简单来说,朴素贝叶斯分类器假设一个类中特定特征的存在与任何其他特征无关。例如一件物体如果是黄色,细长,长约6英寸,则可能被认为是香蕉。即使有些特征之间的联系很紧密,一个幼稚的贝叶斯分类器也将认为这些特征是独立的,并分别推测出此物品是香蕉的概率。

机器学习具有多种实际应用,有助于推动实际业务成果,包括节省时间和金钱。机器学习实施将对未来的企业产生巨大影响的潜力。上述算法将帮助您进行复杂的决策,从而提供正确的解决方案。

原文:Artificial Intelligence And Machine Learning: What’s The Difference? 审校:屠敏


0 人点赞