数据分析的前半部分数据处理、转换等工作是一个又脏又累的活,默默地干着,却又不出彩让人看到过程的艰辛和成果。如何让这个过程可以更加轻松一点,是Excel催化剂为大家所想的,今天带来一大刚需的数据转换功能,将多个项目列转多行单项目。
业务场景
在一些系统导出的数据里,或者一些表单采集到的多选项目的数据,很常见到的是将某一列的内容,多个项目合并成一行,如下图所示。
数据结构示例
某些场景下统计某些指标会有用,但若未能将其还原回其应有的原子级别的项目,对某些分析工作来说,将是一场灾难。
例如需要统计下上图中某类阅读如文学的出现次数。期待的数据结构如下图。
转换后的数据结构
当然更复杂的将会是多个多项目列的两两组合的结果,如下图所示
多个项目组合的数据结构
如上图,可以分析到不同组合下的出现频次,在某些场景下还是有必要进行不同组合的频次分析。
功能实现
此篇功能已实现对源数据进行任意组合的灵活度,几乎可覆盖所有的不同数据源的需求。仅需简单配置一下,即可按根据不同需求生成不同样式的数据结构表。
功能入口位置
具体步骤
步骤1:选择需要处理的数据源
老规矩,仅需定位到数据源任意单元格即可。
步骤2:对数据源列进行配置
- 可对返回列进行控制,某些列不需要返回时,去勾选
- 可对拆分列进行选定,多个拆分列勾选多个
- 可对拆分列分隔符进行多个设定,中间只需用|隔开,若有|作为分隔符,同理需要书写|||,如设置为、|||/。
- 是否重复行数列,若需要按指定列的数字进行多行重复填充,可利用此功能实现。
数据源列转换配置
步骤3:生成结果表
根据步骤2设置的内容,生成结果表,如下图,其中重复数一列内容用原数字作填充,如下图所示重复A姓名行在拆分列两两组合基础上再重复6次。
结果表示例
结语
需要Excel已经使用了PowerQuery这样的轻量化ETL工具进行数据处理、转换,但往往在非界面化操作外的使用M语言来实现,对普通人要求门槛还是过高,不妨使用插件,一键完成既定的有清晰逻辑关系的数据转换,将所有步骤封装在黑箱中进行,无需额外的技术能力,单单聚焦于业务逻辑的提取与实现。