12.4 核函数与标记点- Kernels and landmarks
问题引入
- 如果你有以下的训练集,然后想去拟合其能够分开正负样本的非线性判别边界。
- 然而类似于
等人为定义的特征是不是最好的呢?我们能不能通过函数来进行学习得到更复杂拟合度更高的特征来解决非线性问题呢?此时我们可以借助于待定系数法,把不同的特征看做是待定的未知的目标进行确定 , 使用
表示待定的目标特征。
- 即新的表达式为:
特征构建
- 假设此处需要构建 3 个新特征。
- 首先在坐标
上选取三个 地标(landmark)
- 然后给定一个样本 x, 定义特征
为样本 x 和地标
的相似度
- 同样的 定义特征
为样本 x 和地标
的相似度
- 类似的 定义特征
为样本 x 和地标
的相似度
- 此处的 相似度函数 即
就是所说的 核函数 ,而核函数有很多种,即有很多种不同的定义相似度的方法,此处的核函数被称为 高斯核函数(Gaussian Kernel)
核函数和相似度
- 公式的展开项如下图所示,从图中可以看出
- 当 x 和 landmark 十分接近时,特征值为约等于 1
- 当 x 和 landmark 距离很远时,特征值为约等于 0
高斯核函数(Gaussian Kernel)
- 假设 地标 1 的坐标为(3,5),使用 3D 图中,即时水平面上对应的坐标为(3,5),核函数使用高斯核,其中
- 等高线表示函数下降的速度 ,以下显示不同
对高斯函数陡峭程度的影响,很明显看出
时下降更快,而
时下降速度减缓:
特征点及边界确定过程
- 规定当
时输出 1
- 假设已经得到参数为
- 当你对 大量 的训练样本都进行这样的处理,最终会发现一条由大量点组成的 边界 ,显示 距离各个地标何种距离下 输出预测 y 会为 1,否则 y 会为 0.
- Note在预测时,采用的不是训练实例本身的特征,而是通过核函数计算出的新特征
参考资料
[1]
吴恩达老师课程原地址: https://study.163.com/course/courseMain.htm?courseId=1004570029