前言
线性回归模型可以用于回归模型的学习,当我们需要用线性模型实现分类问题比如二分类问题时,需要用一个单调可微函数将线性回归的连续结果映射到分类回归真实标记的离散值上。
推导过程
考虑二分类任务,其输出标记:
但是线性回归模型产生的预测值是实值z,因此我们需要将实值
转化为
的离散值,最理想的函数就是“单位阶跃函数”unit-step function
:
即当预测值
大于
就判为正例,预测值
小于
就判为负例,预测值为
即可任意判别。
然而单位跃阶函数本身不连续,我们希望找到能在一定程度上近似单位阶跃函数的“替代函数”,并希望它单调可微。对数几率函数logistic function
正好能满足这个要求:
从而因变量y与自变量x的表达式为:
也可以写作:
注:若将
视为样本
作为正例的概率,那么
就是其作为反例的概率,那么两者的比值:
称为“几率”(odds),反映了
作为正例的相对可能性,对几率取对数则得到“对数几率”(log odds
,也叫做logit
)
由于“对数几率”的取值是实值,因此我们相当于用线性回归方法的预测结果去逼近真实标记的对数几率。
参数估计
前面我们已经解释过
相当于样本
作为正例的概率,那么模型可改写成:
根据:
我们可以得到:
给定数据集
:
我们通过极大似然法maximum likelihood method
估计
和
,即令每个样本属于其真实标记的概率越大越好:
逻辑回归优点
- 直接对分类可能性建模,无需实现假设数据分布,这样就避免了假设分布不准确所带来的问题
- 不仅能够预测类别,而且可以得到不同分类的概率预测,对许多需利用概率辅助决策的任务很有用。
- 对率函数是任意阶可导的凸函数,有很好的数学性质