机器学习实战-3-KNN算法实战
本文中介绍的是《机器学习实战》一书中关于KNN算法的一个实战案例:海伦约会案例
<!--MORE-->
海伦约会
整体过程
- 收集数据:提供文本文件
- 准备数据:通过pandas来读取数据
- 分析数据:通过matplotlib来绘制散点图
- 测试算法:将海伦提供的数据随机分成训练集和测试集
背景
海伦女士一直在使用约会网站来寻找适合自己的约会对象。尽管约会网站会推荐不同的人选,但是海伦不是喜欢每个人。经过一番的总结,她发现自己喜欢过3个类型的人:
- 完全不喜欢的人
- 魅力一般的人
- 极具魅力的人
海伦自己通过一段时间搜集一份数据,她将这些数据存放在文本文件datingTestSet中,每个样本数据占据一行,总共有1000行,主要包含以下3种特征:
- 每年获得的飞行常客里程数
- 玩视频游戏所消耗时间百分比
- 每周消费的冰淇淋公升数
真心吃货,冰淇淋都能成为其找对象的指标