批量描述性统计-以价位带分析为例

2021-09-27 10:52:12 浏览数 (1)

描述性统计常用来揭示数据的基本特征,常见的指标有最大值、最小值、中位值、平均值、标准差等。在Power BI产品线价格带分析:以耐克、阿迪达斯、安踏和李宁为例中,笔者展示了价位带分析的图表制作方式,涉及的分析维度包含了描述性统计指标。

很多读者倾向于表格。在Excel中的数据分析选项卡(不同版本位置有所区别)下,可以很方便的不使用任何公式生成描述性统计结果,下图揭示了某品牌的价位带分布。

这种方式有个缺点,每次需要手动操作,且无法批量生成。Power Query提供了一个函数,可以在Power BI和Excel中解决此问题,以下以Excel为例说明。

例如需要同时分析四个品牌的价位带,将数据如下图导入Power Query:

默认导入的数据和Excel界面相同,此处需要将数据不展开。

在分组依据中,选择所有行,按照品牌进行分组:

添加自定义列,输入Table.Profile:

展开自定义列,并筛选零售价后,可以得到以下统计结果,包含最大值、最小值、平均值、标准差等。

后期数据更新鼠标右键刷新即可。

当然,你也可以使用Excel函数或者一大票DAX,如DISTINCTCOUNT、MAX、MIN、AVERAGE、MEDIAN等。

0 人点赞