作者|Syed Danish 选文|姚佳灵 翻译|吴怡雯 姚佳灵 校对|黄念简介本文主要关注在Python中进行数据预处理的技术。学习算法的出众表现与特定的数据类型有密切关系。而对于没有经过缩放或非标准化的特征,学习算法则会给...
安装 scikit-learnScikit-Learn是基于python的机器学习模块,包涵聚类、分类、回归等数学分析模型,可以用于数据预处理、数据处理及数学模型检验等多种用途,是Python机器学习的必备选择。Scikit-learn 要求Python (>= 2....
机器之心整理参与:思源Scikit-learn 中文文档已经由 ApacheCN 完成校对,这对于国内机器学习用户有非常大的帮助。该文档自 2017 年 11 月初步完成校对,目前很多细节都已经得到完善。该中文文档包含了分类、回归、聚类和...
选自kdnuggets机器之心编译参与:王宇欣、吴攀本文介绍了如何通过 Python 和 scikit-learn 实现垃圾邮件过滤的。对比和分析了两个分类器的结果:多项式朴素贝叶斯和支持向量机。文本挖掘(text mining,从文本中导出信息)是一...
推荐理由对于机器学习算法的盘点,网上屡见不鲜。但目前,还没人能结合使用场景来把问题说明白,而这一点正是本文的目的所在。在文章中,作者将结合他的实际经验,细致剖析每种算法在实践中的优势和不足。本文的目的,是务实、简...
每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客...
---- 本书翻译已加入ApachCN的开源协作项目,见 https://github.com/apachecn/hands_on_Ml_with_Sklearn_and_TF/tree/dev/docs。 我负责翻译的是第一章和第二章。 ApacheCN_飞龙转载了后面的章节,大家可以去他的页面...
看了《Scikit-Learn与TensorFlow机器学习实用指南》(Hands-On Machine Learning with Scikit-Learn and TensorFlow)一书的序言
在过去的几个月里,我一直和一些人交流,他们已经开始切入数据科学领域并积极使用机器学习(ML)技术来探索统计规律、或构建完善的数据驱动产品。然而,我发现很多情况下统计分析结果不尽人意的原因是是缺乏必要的数学直觉和知...
编者按:本书节选自图书《Python与机器学习实战》,Python本身带有许多机器学习的第三方库,但本书在绝大多数情况下只会用到Numpy这个基础的科学计算库来进行算法代码的实现。这样做的目的是希望读者能够从实现的过程中更...