热烈庆祝2020年的第一个周末即将完结撒花,今天我们聊分类与回归。
最近聊到有监督学习,有监督学习用得最多,概念不少,含义还容易混,今天就看到有同学提问:
房价走势预测属于分类问题,还是回归问题?
这是个好问题。这两个问题,可都是有监督学习的头牌。
前面我们说,机器学习可分为有监督学习和无监督学习两大门派,有监督学习目前占据主流地位,无监督学习则一直稳稳把控着非主流的交椅。当然,现在又出来了个和稀泥的半监督学习,不过今天的主角不是它,还是回到有监督学习。
机器学习都是问题导向的,在有监督学习门下,最热的问题就是这两个,分类问题和回归问题。这两个问题关系很暧昧,既有区别又有联系,联系还异常紧密,不过今天只说区别。
怎么区别一个问题到底是分类问题还是回归问题呢?方法很简单,看待预测的值的类型——如果是离散的属于分类问题,如果是连续的则属于回归问题。
就说房价走势预测,光这点描述是不够的,还得看预测最终要给出怎样的结果。如果要给出的是房价将是升或者是跌,这是离散类型,属于分类问题,而如果要给出一个具体的值,则是回归问题。
下回再聊。