哪种深度学习框架发展最快? TensorFlow&PyTorch?

2019-06-21 17:01:49 浏览数 (1)

作者 | Jeff Hale

来源 | Towards Data Science

编辑 | 代码医生团队

TensorFlow是深度学习框架无可争议的重量级冠军,PyTorch是年轻的新秀。

在过去六个月中,领先的深度学习框架的情况如何变化?

为了回答这个问题,查看了Indeed,Monster,LinkedIn和SimplyHired上的职位列表数量。还评估了Google搜索量,GitHub活动,Medium文章,ArXiv文章和Quora主题关注者的变化。总的来说,这些来源描绘了需求,使用和兴趣增长的全面情况。

集成和更新

最近在TensorFlow和PyTorch框架中看到了几个重要的发展。

PyTorch v1.0于2018年10月发布,同时fastai v1.0发布。这两个版本都标志着框架成熟的重要里程碑。

TensorFlow 2.0 alpha于2019年3月4日发布。它增加了新功能并改善了用户体验。它更加紧密地集成了Keras作为其高级API。

方法

在本文中,将Keras和fastai包含在比较中,因为它们与TensorFlow和PyTorch紧密集成。它们还提供了评估TensorFlow和PyTorch的比例。

不会在本文中探索其他深度学习框架。Caffe,Theano,MXNET,CNTK,DeepLearning4J或Chainer虽然这些框架各有其优点,但似乎没有一个框架可能成为可能将它们放在TensorFlow或PyTorch附近的增长轨迹。也没有与这两个框架紧密结合。

搜索在2019年3月20日至21日进行。源数据在此Google表格中。

https://docs.google.com/spreadsheets/d/1Q9rQkfi8ubKM8aX33In0Ki6ldUCfJhGqiH9ir6boexw/edit?usp=sharing

使用了绘图数据可视化库来探索流行度。对于交互式图表图表,请在此处查看Kaggle Kernel 。

https://www.kaggle.com/discdiver/2019-deep-learning-framework-growth-scores

更改在线职位列表

为了确定在当今的就业市场中需要哪些深度学习库,在Indeed,LinkedIn,Monster和SimplyHired上搜索了工作列表。

用术语机器学习搜索,然后是库名。所以TensorFlow通过机器学习TensorFlow进行评估。此方法用于历史比较原因。没有机器学习的搜索没有产生明显不同的结果。搜索区域是美国。

TensorFlow的列表增幅略大于PyTorch。Keras也看到了增长 - 大约是TensorFlow的一半。Fastai仍然没有显示任何工作列表。

除了LinkedIn之外,PyTorch在除了TensorFlow之外的所有求职网站上都有更多的附加列表。从绝对意义上讲TensorFlow的工作列表数量几乎是PyTorch或Keras的三倍。

平均Google搜索活动的更改

在最大的搜索引擎上进行网络搜索是衡量人气的指标。查看过去一年Google趋势中的搜索记录。搜索了全世界对机器学习和人工智能类别的兴趣。Google不提供绝对搜索数字,但确实提供了相对数据。

采用了过去六个月的平均利息分数,并将其与前六个月的平均利息分数进行了比较。

在过去的六个月中TensorFlow的相对搜索量有所下降,而PyTorch的相对搜索量却在增长。

下面谷歌的图表显示了过去一年的搜索兴趣。

TensorFlow为蓝色; Keras以黄色,PyTorch以红色,fastai以绿色

新媒体文章

Medium是数据科学文章和教程的热门位置。

在过去的六个月里,使用了对Medium.com的谷歌网站搜索,发现TensorFlow和Keras发布了相似数量的文章。PyTorch相对较少。

作为高级API,Keras和fastai受到新的深度学习从业者的欢迎。Medium有许多教程展示了如何使用这些框架。

新的arXiv文章

arXiv是大多数学术深度学习文章发布的在线存储库。搜索了过去六个月使用Google网站搜索结果提及arXiv上每个框架的新文章。

TensorFlow的新文章出现率最高。

新的GitHub活动

最近关于GitHub的活动是框架流行度的另一个指标。在下面的图表中打破了明星,分叉,观察者和贡献者。

TensorFlow在每个类别中拥有最多的GitHub活动。然而PyTorch在观察者和贡献者的增长方面非常接近。此外Fastai看到了许多新的贡献者。

毫无疑问Keras的一些贡献者在TensorFlow库中进行了研究。TensorFlow和Keras都是由Google员工带头的开源产品。

新Quora粉丝

添加了新的Quora主题关注者的数量 - 一个之前没有数据的新类别。

TensorFlow在过去六个月中添加了最多的新主题粉丝。PyTorch和Keras每个都增加了很多。

获得所有数据后,将其合并为一个指标。

成长分数程序

以下是我创建增长分数的方法:

1.缩放0到1之间的所有功能。

2.聚合在线职位列表和GitHub活动子类别。

3.加权类别根据以下百分比。

4.可理解性乘以加权分数100。

5.将每个框架的类别分数汇总为单个增长分数。

工作列表占总分的三分之一多一点。这种分裂似乎是各种类别的适当平衡。与2018年功率分数分析不同,没有包括KDNuggets使用情况调查(没有新数据)或书籍(六个月内发布的数量不多)。

结果

以下是表格形式的变化。

Google Sheet

这是类别和最终得分。

以下是最终的增长分数。

TensorFlow是最需求的框架,也是增长最快的。它不会很快到达任何地方。PyTorch也在迅速发展。它在工作列表中的大量增加证明了其使用和需求的增加。在过去的六个月里,Keras也有了很大的发展。最后fastai从低基线发展而来。值得记住的是,它是最年轻的。

TensorFlow和PyTorch都是很好的学习框架。

结论

已经看到TensorFlow和PyTorch都在增长。两者现在都有很好的高级API - tf.keras和fastai--它们降低了深入学习入门的障碍。还听说过最近的发展和未来方向。

要以交互方式使用本文中的图表或分叉Jupyter笔记本,请前往Kaggle。

https://www.kaggle.com/discdiver/2019-deep-learning-framework-growth-scores

0 人点赞