讲述了回归模型的基本原理和算法,并结合回归介绍了交叉验证的方法
1 预测房价
1.1 通过相似的房子预测你的房子
2 线性回归
2.1 应用线性回归模型
那么哪条线才是最好的呢?
2.2 应用一条线的成本
2.3 预测你的房价
3 加入更高阶的因素
3.1 用直线拟合房价或者…?
3.2 如果用二次函数怎么样?
3.3 更高阶的多项式
4 你相信这个模型吗?
显然,相比二次函数并不好!!! 过拟合
5 通过训练-测试分离来评估过拟合
你相信这个拟合吗?
二次函数怎么样呢
如何选择模型阶数 / 复杂度
训练 / 测试分离
- 训练集 用于模型构建
- 测试集 用于检测模型构建,此数据只在模型检验时使用,用于评估模型的准确率
训练误差
- 蓝色点为训练集数据
测试误差
6 训练测试曲线
7 加入新的特征
仅仅通过房屋大小预测
加入其他的特征
应该选择多少特征
8 其他回归示例
薪资预测
股票预测
微博流行度
智能房屋
9 回归总结
机器学习流水线