原文:https://medium.com/machine-learning-101/chapter-0-what-is-machine-learning-ad136361c618
让我们进入机器学习的世界!这是介绍。您可以跳过这一步以深入了解直接技术部分。虽然,我建议你快速浏览一下,以便它可以让你清楚,在什么方向上课程将继续。
输入未知数
一个机器学习涉及的工具或算法是数据驱动的。他们的主要工作是根据提供给他们的过去 /训练数据进行猜测。与传统算法不同,它们的输出是数据驱动的。
例如,您可以为公寓设置价格预测模型。用过去的趋势和价格训练他们。接下来你问算法未来五年的价格是多少!或者,您可以训练一个包含 10 万封垃圾邮件的系统,然后根据机器进行的分析筛选出新邮件。
简而言之,我们用巨大的测试数据训练机器,然后要求输入我们不知道的结果。
信任问题。那么我们如何确定正确性呢?
准确率:准确率是我们确定任何机器学习算法的正确性的值。
它预测的是正确的值与总值的比率。因此,为了计算准确率,我们预留了一部分训练集(我们知道其输入和输出!)可以说 10%。我们用 90% 的数据训练模型,并要求预测 10% 。接下来我们匹配我们的实际答案。可靠模型的准确度更高。
注意:在整个系列中,我们将使用 python 作为编码语言。因此,在解释这些内容时,您可能会遇到 python 中的代码段。
这是衡量模型质量的首要参数。
两大类
机器学习涉及两大类:监督学习和非监督学习。最初在这个博客系列中,我们将深入监督学习,然后探索无监督学习。
监督学习是我们提供具有一组输入和与之相关的输出(训练模型)的模型,然后机器参考该训练集来预测输入要求的值。
相反,如果我们只为机器提供一组输入,并让机器弄清楚所有的关系,特征和行为,那么就属于无监督学习。
那么我们从哪里开始呢?嗯..先监督学习。
监督学习的第一个垫脚石是获得关于朴素贝叶斯分类器的知识。朴素贝叶斯分类器是用于标记输入的概率算法。在下一章第1章:朴素贝叶斯分类器中,我们广泛地研究了朴素贝叶斯分类器并编写了一个小项目。