新Wolfram U 幕课《探索数据可视化》

2021-11-04 15:52:28 浏览数 (2)

经过几个月的头脑风暴、开发笔记本和脚本以及通过多轮编辑和重新拍摄来完善视频,我们很高兴地宣布,数据科学中的视觉探索大规模开放在线课程 (MOOC) 现已推出。(https://www.wolfram.com/wolfram-u/visual-explorations-in-data-science/)

本课程的两个指导原则是可视化和示例驱动的方法。我们采用动手实践的方法来教授数据科学,并通过示例慢慢介绍各种技术特征,所有这些都辅以对可视化的强调。该课程包括十几个案例研究,涵盖地理到工程以及分析标志与周期性趋势的相似性。

课程中强调的另一点是数据实际上无处不在。这就是为什么它的主题包括广泛的领域,包括社会和文化、工程、天气、物理科学、地理和地质,最后但同样重要的是金融和金钱。在这篇文章中,我们将仅探讨几个介绍课程风格和独特方法的示例。

哪些语言的单词最长

与任何数据科学挑战一样,第一步——通常也是最令人头疼的——是找到干净的和(如果您幸运的话)有组织的数据。为了回答哪些语言的单词最长的问题,我们将从跨语言的单词列表开始。而且,正如我们在课程中反复强调的那样,Wolfram 语言的一个特点是它可以随时访问庞大的Wolfram世界知识数据库。

在这种情况下,您可以使用内置函数WordList提取干净、有组织的数据。然而,在我们这样做来解决这个问题之前,让我们先看一下跨语言的词长分布:

下一步是根据这些直方图构建概率分布。粗略地看一下英文直方图,就会发现超过 15 个字母的单词很少。因此,让我们将“很长”单词的阈值设置为 15:

少数语言有很大比例的长词:日耳曼语(包括德语、丹麦语、法罗语和瑞典语)和乌拉尔语(如芬兰语和匈牙利语)最长;罗曼语(如西班牙语、法语和意大利语)长度适中;和闪米特语言(如阿拉伯语和希伯来语)是最短的。如果您仔细研究这些数字,就会发现您在德语或芬兰语中遇到一个很长的单词的可能性是希伯来语或阿拉伯语的数百倍。

通过像这样的有趣例子,我们希望对如何在不同场景中使用数据科学提供独特的视角,并表明它是一门非常实用的科学。在所有课程视频中,我们鼓励好奇心,甚至要求学生进行自己的侧面探索,并提出一些可能的调查问题。

现在让我们探索一个完全不同的概念,它需要完全不同类型的数据。

美国哪个城市风最大

当然,每个人都说是芝加哥。但是我们开始使用 2019 年的天气数据寻找真正风最大的城市,结果令人震惊!从一开始,可视化像芝加哥这样的大城市的风速分布就表明它不是风最大的城市。

只需几行 Wolfram 语言代码,您就可以生成以下富有洞察力的可视化。这里我们获取了整个 2019 年美国最大城市的风速数据,并将每个城市的风速分布可视化为箱线图:

经过更多分析,很明显旧金山的风比芝加哥要大得多——至少在 2019 年是这样。也许我们应该将旧金山命名为新的风城!

哪些同位素是稳定的

最后一个示例更具技术性。探索同位素稳定性的课程视频使用各种可视化来展示同位素稳定性及其背后的趋势。

一个例子是稳定性的“带”或“带”的流行插图,原子与中子数图中的一个区域包含特别稳定的同位素:

如您所见,几行代码即可生成清晰的可视化效果。

从像这样的技术科学探究到有趣的文化参考探索,课程的内容经过精心设计,以迎合所有不同的品味和兴趣,并展示数据科学的多功能性。

本着这篇博文的精神,我们鼓励您使用 Wolfram 语言来调查您感兴趣的事情。Wolfram 语言的内置知识涵盖从国家和名人到神奇宝贝角色的所有内容。谁知道您可能会开发出哪些新见解?尝试一下,探索世界的数据!如果您需要这方面的指南,我们鼓励您在数据科学中进行可视化探索,并为您的下一次数据冒险学习宝贵的技能。

最后,如果没有 Wolfram 的许多主题专家和不同团队的出色团队合作,就不可能创建这门课程。我们要感谢Michael Trott对可能示例的见解、Wolfram U团队的不间断支持和视频团队的技术反馈。

查看Wolfram U以获取丰富的免费互动课程、视频课程和特别活动。

本文由Wolfram中国代理商:北京哲想软件有限公司 翻译

北京哲想软件邮箱:sales@cogitosoft.com

0 人点赞