当可视化一个DataFrame时,选择使用哪个可视化库确实是一个头疼的事情。
这篇文章云朵君将和大家一起学习每个库的优点和缺点。到最后,对它们的不同特点有更好的了解,在合适的时候更容易选择合适的库。
将通过专注于几个具体的属性来评价一个可视化工具的优缺点:
互动性
你想要交互式可视化吗?像Altair、Bokeh和Plotly这样的库允许你创建交互式图表,用户可以探索和互动。
另外,一些库(如Matplotlib)将可视化渲染成静态图像,使其适合在论文、幻灯片或演示中解释概念。
语法和灵活性
不同库的语法有什么不同?低级别的库,如Matplotlib,提供了广泛的灵活性,可以完成几乎任何事情。然而,API也是很复杂的。
像Altair这样的声明式库简化了数据到可视化的映射,提供了一个更直观的语法。
数据类型和视觉化
是否在处理专门的用例,如地理图或大数据集?考虑一个特定的库是否支持绘图类型或有效处理大型数据集。
数据
为了探索每幅图表,将使用GitHub用户的数据:
代码语言:javascript复制import pandas as pd
# 强烈推荐关注@公众号:数据STUDIO,更多优质内容等你~
new_profile = pd.read_csv('https://gist.githubusercontent.com/khuyentran1401/98658198f0ef0cb12abb34b4f2361fd8/raw/ece16eb32e1b41f5f20c894fb72a4c198e86a5ea/github_users.csv')
new_profile
Matplotlib
Matplotlib[1]可能是最常见的用于可视化数据的Python库。几乎所有对数据科学感兴趣的人都可能至少使用过一次Matplotlib。推荐阅读(点击阅读