昨天我们介绍了使用Excel进行直方图的绘制,今天我们来介绍R语言和Python下的绘制方法。
R语言篇
首先我们来介绍R语言下的直方图绘制,因为R语言是专门用于的统计分析软件,所以在不调用任何包的情况下就可以进行直方图的绘制。然而默认情况下绘制的图像往往比较难看,因此我们很多时候会调用ggplot2或者ggstatsplot等可视化的包进行绘制。
为了便于理解(对初学者来说好看不好看的问题可以缓一缓再说),本次教程中的直方图绘制就采用不加载包的形式进行绘制,数据还是采用和昨天一样的实例数据。完整的绘制代码如下:
前面的代码之前有说过了,这里就不再赘述了,我们来看一下hist这个函数的用法。可以通过【help(hist)】查看hist函数的用法:
我们可以通过设置其他的参数来对绘制出来的图像进行修改,例如我们设置颜色(col)等于红色(2),就在代码中添加一句:
其他参数的设置都是类似的,大家如果有兴趣可以研究研究。
Python篇
接下来我们看Python下的实现,相对来说也比较简单,完整代码如下:
相对于R来说,我们在Python中进行直方图的绘制要略复杂一点,需要调用matplotlib这个第三方库进行绘制。matplotlib这个第三方库中的hist函数的参数和R中基本的一致的,也有col(颜色)xlab(x轴标题)等。
查看函数参数的使用说明的方法和R也是类似的,输入【help(plt.hist)】就可以了。
总结
R&Python VS Excel
结合昨天的内容,大家已经发现了,在R和Python中,绘制直方图的时候,我们并不需知道数据的取值范围情况,软件会帮我们自动分好组。分组的组数也可以非常容易地通过bins=XX进行设置,这一点相较于Excel来说可以生省了不少事。
R VS Python
R语言和Python相比,R不用导入任何包就可以绘制图形,Python会略差一些(不调用第三包其实也可以,但是非常麻烦)。
在R语言中,我们想看data这个数据中的x这一列用的语句是data$x,而Python中用得是data.x;读取数据的时候R语言是read.csv而Python是pd.read_csv。这样对比来看,是不是两个软件一起学并不难?
从绘图的风格上来看,R默认的图片风格比较偏学术研究一些,而Python的风格则偏向于商业分析一些。
本文首发于微信公众号:HR大数据,欢迎扫码关注了解更多