机器学习的类别

2019-03-04 17:33:46 浏览数 (1)

监督学习从训练资料中学到或者建立一个模式，并依此模式推测新的实例。训练资料是由输入数据和预期输出数据组成。模式的输出可以是一个连续的值（称为回归分析）或者分类标签（称为分类）。
非监督学习没有给定事先标记过的训练示例，自动对输入的数据进行分类或分群。
强化学习智能体以“试错”的方式进行学习，通过与环境进行交互获得的奖赏指导行为，目标是使智能体获得最大的奖赏。在强化信号上，强化学习中由环境提供的强化信号是对产生动作的好坏作一种评价，而不是告诉强化学习系统(reinforcement learning system, RLS)如何去产生正确的动作。由于外部环境提供的信息很少，RLS必须靠自身的经历进行学习。通过这种方式，RLS在行动-评价的环境中获得知识，改进行动方案以适应环境。

0 人点赞