感知机模型是机器学习二分类问题中的一个非常简单的模型。它的基本结构如下图所示:
感知机的运算过程分为两个部分:线性部分和非线性部分。
其中, xi 是输入, wi 表示权重系数, b 表示偏移常数。感知机的线性输出为:
为了简化计算,通常我们将 b 作为权重系数的一个维度,即 w0。同时,将输入 x 扩展一个维度,为 1。这样,上式简化为:
非线性部分,引入符号函数 sign,输出为:
也就是根据 scores 值与 0 的关系进行判断:
- 若 scores ≥ 0,则预测为正类
- 若 scores < 0,则预测为负类
优点:感知机模型简单易懂,原理清晰,便于直观理解。
缺点:感知机模型中 sign 函数不易求导,不方便直接使用梯度下降算法来迭代求解参数 w。
扩展:将感知机模型中的非线性输出部分 sign 函数改成 sigmoid 函数就变成了逻辑回归模型。sigmoid 函数相比 sign 函数便于求导,所以逻辑回归模型是感知机模型的一种改进!