两章前,在 OSEMN 数据科学模型的第一步,我们看到了从各种来源获取数据。这一章讲的都是第二步:清理数据。你看,你很少能立即继续探索甚至建模数据。您的数据首先需要清理或清理的原因有很多。...
在整本书中,我将向您介绍许多基本上适合一行的命令和管道。这些被称为一行程序或管道。能够只用一行程序执行复杂的任务是命令行的强大之处。这是一种与编写和使用传统程序截然不同的体验。...
本章讨论 OSEMN 模型的第一步:获取数据。毕竟,没有任何数据,我们就没有多少数据科学可以做。我假设你已经有了解决数据科学问题所需的数据,第一步你需要把这些数据放到你的电脑上(也可能放到 Docker 容器里)。...
在这一章中,我需要确定你能够利用命令行做数据科学,为此你需要能满足一些条件。条件主要分为三个部分:(1)拥有与我在本书中使用的相同的数据集,(2)拥有一个适当的环境,拥有我在本书中使用的所有命令行工具,(3)了解使用命令行时的...
这本书是关于如何利用命令行做数据科学的。我的目标是通过教你使用命令行的力量,让自己成为一名更高效和多产的数据科学家。
整理 | Tina 字节回应员工因没年终奖与 HR 互殴;乐视实行 4 天半工作制:不降薪无 996,研发可准点下班;Salesforce 宣布重组计划:裁员 10% 并削减办公空间;Twitter 解雇 40 名广告团队的工程师;亚马逊 CEO 发全员信,拟裁员超过 ...
他们之所以要阅读代码,是因为代码是真相所在。他们也会在其他多种情况下阅读代码。当他们想要学习如何使用 API 时,他们会阅读。当他们需要找到一个地方添加新功能时,他们会阅读。当他们在查找导致 bug 的根本原因时,他们...
机器学习的很多算法理论非常枯燥乏味,但有许多有趣且有用的网站,您可以像游戏一样交互式操作,并同时学习机器学习概念、模型和应用知识。以下是 ShowMeAI 为大家整理的18个交互式机器学习网站,快快来一起体验一下吧,好玩又...
这本书是同事推荐的,是图灵图书数据科学书单的一部分,英文标题是《Practical Statistics for Data Scientists》,副标题是 50 Essential Concepts。
来源:专知本文为书籍推荐,建议阅读5分钟本书探讨了数据科学的基本原理。本书探讨了数据科学的基本原理。它考虑了现代数据科学的发展方式和原因。这本书在将数据应用于决策方面比现有的书籍走得更远。这本书不仅对本科...