17,玩转pivot_table数据透视表

2020-07-20 11:31:22 浏览数 (2)

数据透视表是将数据进行分类汇总,统计分析的强大工具。通过设置新的行标签index和列标签columns,指定需要被统计分析的数值values,指定采用的统计聚合函数aggfunc等,利用数据透视表可以对原始数据表进行多种视角的分析和不同方式的重塑,因而称之为透视表。 在Python的Pandas中,可以用groupby方法或pivot_table函数完成分类汇总,实现数据透视表的功能。groupby是先分组,然后选择聚合函数,生成透视表。pivot_table则是直接通过设置index,columns,values,aggfunc等参数生成透视表。

一,Excel中的数据透视表

Excel中的数据透视表可以设置行(index),列(columns),值(values),并通过值字段设置选择聚合函数。图形界面操作相对简单,但不够灵活和强大。

二,pivot_table数据透视表

相比较Excel中的数据透视表,使用pandas的pivot_table函数来实现数据透视表,将十分灵活和强大。

构造dataframe数据

1,index参数

2,columns参数

3,values 参数

4,aggfunc 参数

5,pivot_table参数总览

三,groupby数据分组功能

利用groupby方法分组功能配合聚合函数也能够实现数据透视表效果,这也是数据分析中非常常用的方法。示范操作如下。

0 人点赞