数据表是由表名、表中的字段和表的记录三个部分组成的。设计数据表结构就是定义数据表文件名,确定数据表包含哪些字段,各字段的字段名、字段类型、及宽度,并将这些数据输入到计算机当中。
数据分析的源数据应该是规范的,否则将数据表导入Banber等数据可视化平台时,就会因表结构错误,不利于统计和分析,无法生成可视化图表或可视化图表错误。
PART ONE
什么是规范的表结构?
合乎数据可视化规范的表结构设计包含以下要素:
1. 第一行为表头,即表格列标题。很多人喜欢在第一行合并单元格,填写***表,这是不利于后期数据分析的;
2. 单一表头,没有多层级的表头和合并单元格;
3. 数值列建议不要有空值;
4. 没有小计行、小计列;
5. 不支持有宏算法或函数算法数据表格;
如上图所示,就是在Excel中常见的是二维表。虽然更符合我们日常的阅读习惯,信息更浓缩,适合展示分析结果,但作为源数据进行数据分析时,就需要一维表。如下图所示,将二维表导入可视化工具中,字段无法识别。
一维表的每一列是一个独立的维度,列名或者字段名就是数据分析的基础,比如利用列名与其他表建立关系;数据可视化时直接把字段拖入到某个属性框中等。
此外,有些假的Excel,后缀命看起来是.xlsx或者.xls。其实不是真正Excel,无法正常导入可视化工具中,需要通过Office或WPS打开存为真正的.xlsx或者.xls格式。
PART TWO
如何将二维表转化为一维表?
二维表转化为一维表,当然可以自己手动复制粘贴调整表结构,聪明人直接借助Excel中的Power Query,主要使用逆透视功能,就可以将上图的二维表,转换成下图的一维表。
1. 选中需要转换数据的表格区域,点击数据——来自表格/区域;
2. 此时,就弹出了Power Query编辑器,上图的二维表较为复杂,行标题和列标题均带有层次结构。
3. 因为对合并单元的拆分,表格中有很多null空值,选中第一列,点击转换——填充——向下,对空值数据进行向下填充;
此时,第一列的空值数据就会被补齐。
4. 将年度列和季度列合并,生成年度季度列,简化表格结构。选中年度和季度两列,点击转换——合并列。
在弹出的“合并列”弹出框中,可选择用分隔符隔开两个合并字段,也可以不选。
得到如下图所示,年度和季度合并的年度季度列。
5. 点击转换——转置,对表格进行转置处理;
6. 此时纵向的表格就转置成横向,同样的方法,点击转换——填充——向下,对第一列null空值进行补齐。
7. 选中第一行,点击主页——将第一行用作标题。
此时,最顶端的一行字段,就被第一行代替。
8. 选中第一列和第二列,点击转换——逆透视列——逆透视其他列;
9. 如下图所示,二维表就已经转换成了一维表,点击转换——拆分列,可在下拉列表中按需求拆分之前合并的年度和季度列,如果之前选择了分隔符,可以按分隔符拆分。
之前我们没有选择分隔符,可以按字符数进行分割,年份(2015)是4个字符。
10. 点击开始——关闭并上载,就完成了一维表的转换。
转换好的一维表,就自动上传至原数据表中,生成一个新的工作表,手动对第一行表头字段进行调整,就可以啦!
PART THREE
用一维表生成可视化图表
打开Banber数据可视化云平台(https://www.banber.com/library),点击左侧图表,将需要的可视化图表拖到编辑区域,这里我们以柱形图为例。
表格的上传,这里不再赘述,我们直接进入数据表编辑,此时就可以随心所欲选择左侧字段,拖拽到相应的区域,如下图所示,这个可视化柱形图,展现的就是两个区域,每年销售额汇总对比。