机器学习是人工智能(AI)的核心,是使计算机具有智能的根本途径。
本文整理了一下机器学习领域常用的15个术语,希望可以帮助大家更好的理解这门涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多个领域的庞杂学科。
1. AdaBoost(Adaptive Boosting)
AdaBoost是Adaptive Boosting的缩写。AdaBoost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。
2. 随机森林(Random Forest)
随机森林属于集成学习中Bagging(Bootstrap AGgregation的简称)的方法。在机器学习中,随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别树输出的类别的众数而定。
3. 无监督学习(Unsupervised Learning)
无监督学习是机器学习的一个分支,它从未经标记或分类的测试数据中学习。它本质上是一个统计手段,在没有标签的数据里可以发现潜在的一些结构。无监督学习不是响应反馈,而是根据每个新数据中是否存在这种共性来识别数据中的共性并做出反应。
4. 监督学习(Supervised Learning)
监督学习是指利用一组已知类别的样本调整分类器的参数,使其达到所要求性能的过程。
监督学习是从标记的训练数据来推断一个功能的机器学习任务。在监督学习中,每个实例都是由一个输入对象(通常为矢量)和一个期望的输出值(也称为监督信号)组成。监督学习算法是分析该训练数据,并产生一个推断的功能,其可以用于映射出新的实例。
5. 深度学习(Deep Learning)
深度学习是机器学习中一种基于对数据进行表征学习的方法。
深度学习与人工智能、机器学习的关系其属于机器学习的范畴,可以说是在传统神经网络基础上的升级,约等于神经网络。它的好处是用非监督式或半监督式的特征学习和分层特征提取高效算法来替代手工获取特征。深度学习是机器学习研究中的一个新的领域,其动机在于建立、模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本。
6. 强化学习(Reinforcement Learning)
强化学习(Reinforcement Learning),又称再励学习、评价学习,是一种重要的机器学习方法,在智能控制机器人及分析预测等领域有许多应用。在强化学习中,机器达到预期效果时会得到正强化,没有达到预期结果时会得到负强化。
7. K均值聚类(K-means Clustering)
K均值聚类算法是先随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算。这个过程将不断重复直到满足某个终止条件。终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,没有(或最小数目)聚类中心再发生变化,误差平方和局部最小。
8. 聚类分析(Cluster Analysis)
聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。聚类分析的目标就是在相似的基础上收集数据来分类。聚类源于很多领域,包括数学、计算机科学、统计学、生物学和经济学等。
9. 集成学习(Ensemble Learning)
集成学习是使用一系列学习器进行学习,并使用某种规则把各个学习结果进行整合从而获得比单个学习器更好的学习效果的一种机器学习方法。
10. 支持向量机(Support Vector Machine)
在机器学习中,支持向量机(SVM,还支持矢量网络)是与相关的学习算法有关的监督学习模型,可以分析数据,识别模式,用于分类和回归分析。支持向量机是目前最流行和最受关注的机器学习算法之一。
11. 决策树(Decision Tree)
决策树算法是一种逼近离散函数值的方法。它是统计、数据挖掘和机器学习中使用的预测建模方法之一。
12. 逻辑回归(Logistic Regression)
逻辑回归是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。逻辑回归主要解决分类问题,用来表示某件事情发生的可能性。
13. 朴素贝叶斯(Naive Bayes Classifier)
朴素贝叶斯是一种简单但令人惊讶的强大的预测建模算法。朴素贝叶斯被称为朴素,因为它假设每个输入变量是独立的。这是一个强有力的假设,对于实际数据是不现实的,然而,该技术对于大范围的复杂问题非常有效。
14. 线性回归(Linear Regression)
线性回归本来是统计学里的概念,现在经常被用在机器学习中。如果两个或者多个变量之间存在“线性关系”,那么我们就可以通过历史数据,摸清变量之间的“套路”,建立一个有效的模型,来预测未来的变量结果。
15. 机器学习(Machine Learning)
机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域,它主要使用归纳、综合而不是演绎。