这天聊Logistics回归。
Logistics回归是大多数初学者接触机器学习时,要学习的第一款分类学习算法。中文一般译作逻辑回归。
实话实说,这个名字很容易引起错乱。
我们知道,机器学习主要分为有监督学习和无监督学习,颇有点天生万物分出了人界和妖界的意思,当然现在又出现了半人半妖的半监督学习,我们另外再聊。
有监督学习呢,又具体分几类问题,最最主要的有两类,一类叫回归问题,一类叫分类问题。
看到这里,看明白了吧?
回归问题和分类问题根本是两类问题。那么,这个用于解决分类问题的Logistics回归,究竟算身在曹营心在汉呢,还是反过来呢?烧脑。
总之,这个Logistics回归虽然叫逻辑回归,但既无逻辑,又非回归,有些中译取音译叫逻辑斯蒂回归,看了让人直挠头。
那我们就不由得想问了,为啥两样八字对不上的玩意非要凑到一起呢?
其实,Logistics回归作为分类问题的新手装,说也简单,结构就是线性回归套上Logistics函数,图像是这样:
Logistics函数是非线性函数,图像呈S型,看着简单,里面大有文章。
要知道,线性回归只能输出线性变化的值,这是肯定没法预测需要输出离散值的分类问题,但套上了Logistics函数,输出就呈非线性了,特别是放大坐标轴尺度后,Logistics函数的图像非常类似阶跃函数,特别适合用于做二元分类问题的预测。
这样做还有一个好处:线性回归好用呀,本身是一款成熟的机器学习模型,拟合数据的能力那称得上有口皆碑,和具有阶跃能力的Logistics回归强强联手,Logistics回归自然也就具备了拟合数据的能力,也就是学习能力,这样一来Logistics回归立马就变成一款经得住实践检验的机器学习模型。
下次再聊。