逻辑回归(Logistic Regression,简称LR)
名为“回归”却是用来分类工作、在线性数据上表现优异的分类器。
核心思想是把原线性回归的取值范围通过Logistic函数映射到一个概率空间,从而将一个回归模型转换为一个分类模型。
主要通过寻找最优参数来正确地分类原始数据。
逻辑回归数学目的:求解能够让模型对数据拟合程度最高的参数
的值,从此构建预测函数y(x),然后将特征矩阵输入预测函数来计算出逻辑回归的结果y。
逻辑回归是一个受工业商业热爱、使用广泛的模型,因为它有着不可替代的优点:
1、逻辑回归对线性关系的拟合效果好到丧心病狂,特征与标签之间的线性关系极强的数据,如金融领域中的信用卡欺诈,评分卡制作,电商中的营销预测等等相关的数据,都是逻辑回归的强项。逻辑回归在金融领域,尤其是银行业中的统治地位依然不可动摇。
2、逻辑回归计算速度快:对于线性数据,逻辑回归的拟合和计算都非常快,计算效率优于SVM和随机森林,在大型数据上区别尤其明显。
3、逻辑回归返回的分类结果不是固定的0或1,而是以小数形式呈现的类概率数字,因此可以把逻辑回归返回的结果当成连续型数据来利用。比如在评分卡制作时,不仅需要判断客户是否会违约,还需要给出确定的“信用分”,信用分可使用类概率计算出的对数几率。
另外,逻辑回归还有抗噪能力强的优点。
逻辑回归应用
逻辑回归适合用来学习需要大规模训练的样本和特征,对于广告亿量级特征来说,逻辑回归有着天然的优势ÿ