个人永久性免费-Excel催化剂功能第14波-一键生成零售购物篮/搭配率分析

2021-08-19 15:29:33 浏览数 (1)

在如今知识大爆炸的年代,每天听到无数的概念,到处是知识传播、概念传播,随处可见马爸爸们的新零售、区块链、生态化反等等等,就是数据分析界也是概念多多,python/R/数据挖掘/人工智能如此这般,对于一般人的我们,表示听不懂,无影无踪地眼前飘过没留下什么。今天Excel催化剂致力于为普通人带来看得见摸得着,按照我们常识想知道的方式来给大家带来零售行业的经典分析之购物篮分析,不要怕,这不再是一个概念,而是可以在Excel上直观可视,低门槛高收益的任何一名普通的Excel用户都能玩得转的一键生成。

文章出处说明

原文在简书上发表,再同步到Excel催化剂微信公众号或其他平台上,文章后续有修改和更新将在简书上操作, 其他平台不作同步修改更新,因此建议阅读其他出处的文章时,尽可能跳转回简书平台上查看。

视频演示

https://v.qq.com/x/page/a0620lea5ls.html

视频内容

背景知识

购物篮分析最普遍为大从所知的就是逢人必知、逢书必讲的沃尔玛啤酒尿不湿故事,具体了解可自行百度,实现方式,本人不才,不懂高大上的统计分析工具如SPSS/R/Python等,唯一亲手玩弄过的,傻瓜式的操作的是微软官方提供的数据挖掘Excel插件,对我这样的普通人来说,也表示压力山大,统计学概念还是好多,玩不转。最要命的是它是基于Sqlserver的分析服务才能操作的,这样的前提条件,估计没几个人能拥有,一句话,还是离大众世界太遥远了 https://msdn.microsoft.com/zh-cn/library/dn282369(v=sql.120).aspx

微软官方插件购物篮分析截图

功能介绍

此次Excel催化剂的购物篮分析,对用户环境0要求,只要插件安装成功了即可使用,准备好一份数据源(尽可能地规范的数据源、首行是标题行,首列开始就是数据区,中间无断行断列的出现),简单配置一下

  • 哪一列属于父项列(仅标记一列,统计订单连带率就是订单编号,统计用户连带率就是用户编号),
  • 哪一列属于子项列(仅标记一列,一般指商品编码,可以颗粒度为款,不必细到SKU的级别,插件会自动分组汇总一次再进行购物篮分析,不必担心同一个款用户在一个订单上购买了多个色或码,会统计成有多种组合的情况),
  • 哪些列需要求和汇总(可标记多列,一般指销售量、销售额、销售成本等,本次功能实现仅对其进行求和处理,暂时也没想到有其他的聚合汇总的需要或者说再细分实现程序复杂度又高出不少)。

操作步骤

  1. 选定数据源(选择任一单元格即可),数据规范性要求见上文,数据可进行简单的自动筛选操作,过滤掉一些不必要分析的子项,例如一些赠品、饰品或其他不想参与购物篮分析统计的商品可在源表中作筛选过滤,无需删除操作,方便数据源可二次使用在其他分析需求上。如下图,我使用了一个随机数,把随机的部分行作了自动筛选来演示效果
  1. 点击功能区的【购物篮分析】按钮,在打开的任务窗格面板中进行简单的配置操作,配置参数详细说明如下:
  • 数据源区域说明:若数据源区域自动识别有误,可使用【选择数据源数据区域】按钮重新手动选择。
  • 最小/大组合数 在一个订单中购买了多件商品,在排列组合中,会出现好多组合方式,如一个订单有8件商品,会出现2、3、4、5、6、7、8共七种的商品组合数,最终返回的数据结果可通过此两个参考作为控制。一般一说越大的组合数出现的概率越小,也没有什么分析价值,可对其进行限制,不用返回,如最多返回4个商品组合的记录即可。
  • 记录数返回最大值 因Excel的处理效率问题,若返回的记录数过多,数据写入单元格的速度会很慢,一般也没有太大必要看到所有的组合数,可适当返回商品组合频率较高的数据即可,数据处理过程中,将会进行出现组合频率高的降序排列后再提取前N条记录返回。
  • 是否提取源数据全表,此处为了能处理行数多于65535行(没亲测是否这个数)的数据而使用的,因读取方式的必方糖,需对整个工作表的数据进行读取,对数据源的要求是数据源的工作表仅包含需要读取的数据,首行是标题行,左列开始首列就是数据区域,右列结束后不含其他零星的数据(若数据源满足此要求建议勾选它,可能一次生成的结果表不合预期,对数据源时行筛选操作过后,源数据区域被改变,但后面的字段映射不需改变时,可复用后面的字段映射,快速进行下一次的购物篮分析查询)
  • 字段映射,如上文所述,按实际需要,配置好父项列、子项列、汇总列,不参与运算的列可不保留为空,如下图的随机数列
  1. 按需点击下方不同的查询按钮
  • 购物篮分析查询_现有智能表 此项生成的内容覆盖现有的智能表(上次生成过的数据结果表),方便对于查询条件的改变,需要生成的数据覆盖回原生成的数据结果表,因数据结果表可能有透视表对其进行引用,覆盖上次的结果表,透视表仅需刷新操作即可对新的数据进行引用。
  • 购物篮分析查询_新建智能表 首次生成一份数据结果,程序会新建一个工作表,在此工作表中填充数据数据。
  • 购物篮分析查询_新建工作薄 因Excel的写入数据的性能问题,若在原工作薄上生成数据结果,数据量大会比较慢,此时可选用此按钮,将数据结果导出至新的工作薄中(程序会提示保存的路径操作),此种方式速度很慢。或直接就想把数据生成在新的工作薄中也可使用此按钮操作。

数据前后对比

  1. 无隐藏数据行的效果,SO01的订单编号中P01出现3次,但结果表中,不会出现P01|P01|P01这样的组合结果,且组合后的销售量、销售额均为数据源的汇总求和数P01|P05的销售量:446=137 95 112 16 86

源数据-无隐藏数据行

结果表-无隐藏数据

  1. 隐藏数据行效果,P07为不统计的商品,在自动筛选隐藏掉后,生成的结果表中,也同样不进行统计在内。

源数据-隐藏数据行.png

结果表-有隐藏数据.png

总结

以上为简单的购物篮分析中,将数据源转化为经过组合后的结果表的效果,后续可使用简单的数据透视表操作即可快速统计出不同的商品组合下总共出现的销售单数和对应的此组合产生的各类指标数据如销售量、销售额等,可快速找到搭配销售效果显著的商品组合,无需复杂的统计学知识和各类复杂高深的统计工具,仅使用Excel即可完成整个的分析过程,流畅、轻便、所见即所得,希望大家喜欢。

以上是最好的在Excel上做购物篮分析的方法吗?

留下小许悬念,小编有更震撼的更先进的的Excel模板工具,更智能更方便地进行分析,你相信吗?相信的话,就给予多多关注本人的公众号:【Excel催化剂】,进QQ群,并且多多地举手之劳,转发朋友圈一下,俗气点地求积赞一下,本人在感受到热烈回应时会逐步发放更先进震撼的购物篮分析工具给到您!

0 人点赞