概要
- 主要展示常用的机器学习算法。
- 涵盖的算法 - 线性回归,逻辑回归,朴素贝叶斯,kNN,随机森林等。
- 学习使用python语言实现这些算法。(放在后面的文章总演示每个算法的使用,本文只介绍常用的机器学习算法)
介绍
谷歌的自动驾驶汽车和机器人得到了很多新闻,但该公司真正的未来是机器学习,这种技术使计算机变得更聪明,更个性化。 - Eric Schmidt(谷歌主席)
我们可能生活在人类历史最具决定性的时期。计算从大型主机转移到PC到云的时期。但是,它的定义并不是发生了什么,而是未来几年将会发生什么。
是什么让这个时期令人兴奋和迷人的像我这样的人是各种工具和技术的民主化,随着计算的推进。欢迎来到数据科学的世界!
从广义上讲,有3种类型的机器学习算法,让我们来看看每一种类型的算法。
监督学习(Supervised Learning)
工作原理:该算法由目标/结果变量(或因变量)组成,该变量将从给定的一组预测变量(自变量)中预测。使用这些变量集,我们生成一个将输入映射到所需输出的函数。训练过程继续,直到模型在训练数据上达到所需的准确度。监督学习的例子:回归,决策树,随机森林,KNN,Logistic回归等。
无监督学习(Unsupervised Learning)
工作原理:在此算法中,我们没有任何目标或结果变量来预测/估计。它用于聚类不同群体的人口,广泛用于分割不同群体的客户进行特定干预。无监督学习的例子:Apriori算法,K-means。
强化学习(Reinforcement Learning)
工作原理:使用此算法,机器经过培训,可以做出具体决策。它以这种方式工作:机器暴露在一个环境中,它通过反复试验不断地训练自己。该机器从过去的经验中学习,并尝试捕获最佳可能的知识,以做出准确的业务决策。强化学习的例子:马尔可夫决策过程。
常用机器学习算法列表
- Linear Regression(线性回归)
- Logistic Regression(Logistic回归)
- Decision Tree(决策树)
- SVM(支持向量机)
- Naive Bayes(朴素贝叶斯)
- KNN(K-临近算法)
- K-Means(K均值算法)
- Random Forest(随机森林)
- Dimensionality Reduction Algorithms(降维算法)
- Gradient Boosting algorithms(渐变Boosting算法)
- GBM
- XGBoost
- LightGBM
- CatBoost
今天的机器学习算法介绍就到这里,接下来的文章会具体介绍每一种算法,以及用每一种算法实现的python案例。