在当今这个大数据的时代,越来越多的领域需要通过数据分析及科学方法来提取出有价值的信息,帮助我们理解问题、突破瓶颈。对于互联网公司而言,数据更是他们的立足之本。Kotlin 做为一门新兴编程语言,是否也适用在据科学领域呢?答案是肯定的,虽然目前仍处于早期发展阶段,但社区已经开始采用 Kotlin 进行数据科学,且正在快速发展中。在这一篇观影指南里,将为同学们整理出 KotlinConf 2019 演讲里,跟数据科学有关的内容。
别忘了我们已经将所有 KotlinConf 2019 的录影上传到腾讯视频及哔哩哔哩,并依据不同主题写了这一系列的观影指南。每一篇指南都会给出几个关键字,并依关键字抓出 3-5 部精选,还会再列出其他值得一看的相关视频清单,表示若你对这个些关键字有兴趣的话,不可错过这些视频。
关键字:数据科学(Data Science)、大数据(Big Data)、机器学习(Machine Learning)、Jupyter、Zeppelin、Spark、NumPy
Using Kotlin for Data Science
Kotlin 的特性让其可以同时适用于数据科学及数据工程,成为数据驱动(Data Driven)的绝佳选择。在这场演讲里,Roman Belov 介绍了应用于数据科学的 Kotlin 生态系统,包括工具和库。然后通过一个实际示例,介绍在多维数组上的操作、处理数据框、创建图表以及在群集上进行部署。演示的工具包括 Jupyter、Zeppelin 和 JetBrains 的大数据工具。
视频链接:
Kotlin for Science
在这场演讲里,Alexander Nozik 探讨 Kotlin 在粒子物理学中的一些应用(分析自动化、蒙特卡洛模拟及通用计算),介绍用 Kotlin 开发科学相关库的最新成果(kmath 和一些其他的项目),并说明为何 Kotlin 是一个很适合科学,特别是物理学的编程语言。
视频链接:
看完以上的介绍,是不是对运用 Kotlin 在数据科学领域感到激动?在 Kotlin 文档里有针对数据科学方面的应用做介绍。关于 KotlinConf 2019 在数据科学上的讨论,我们的博客上也有深入的报导,里面还提到历年 KotlinConf 几场跟数据科学有关的演讲,有兴趣的同学可以研究一下。另外,Thomas Nield 这位 KotlinConf 2017 的讲者也曾经在这篇博文介绍了由其开发的 Kotlin-Statistics 库,文章的一开头也说明了为何 Kotlin 适合用在数据科学领域。以上这些就做为这份观影指南的补充,希望对各位同学有所帮助。