数据可视化能准确而高效、精简而全面地传递信息和知识。可视化能将不可见的数据现象转化为可见的图形符号,将错综复杂、看起来没法解释和关联的数据,建立起联系和关联,发现规律和特征,获得更有商业价值的洞见和价值。
利用合适的图表直截了当且清晰而直观地表达出来,实现数据自我解释、让数据说话的目的。而人类右脑记忆图像的速度比左脑记忆抽象的文字快100万倍。因此,数据可视化能够加深和强化受众对于数据的理解和记忆。
然而数据可视化有4大痛点一直困扰着很多数据需求人员,大部分人还在图表技巧上摸索着前行,目前暂无行之有效的方法。
难点1
看代码像看天书
目前比较常见的是用Python的可视化技术,Python中也有两个专用于可视化的库 matplotlib 和 seaborn 能较为容易的完成任务。
例如,上图这样一张折线图的实现代码是:
def lineplot(x_data, y_data, x_label="", y_label="", title=""):
# Create the plot object
_, ax = plt.subplots() # Plot the best fit line, set the linewidth (lw), color and
# transparency (alpha) of the line
ax.plot(x_data, y_data, lw = 2, color = '#539caf', alpha = 1) # Label the axes and provide a title
ax.set_title(title)
ax.set_xlabel(x_label)
ax.set_ylabel(y_label)
这张箱线图的实现代码是:
def boxplot(x_data, y_data, base_color="#539caf", median_color="#297083", x_label="", y_label="", title=""):
_, ax = plt.subplots()
# Draw boxplots, specifying desired style
ax.boxplot(y_data
# patch_artist must be True to control box fill
, patch_artist = True
# Properties of median line
, medianprops = {'color': median_color}
# Properties of box
, boxprops = {'color': base_color, 'facecolor': base_color}
# Properties of whiskers
, whiskerprops = {'color': base_color}
# Properties of whisker caps
, capprops = {'color': base_color})
# By default, the tick label starts at 1 and increments by 1 for
# each box drawn. This sets the labels to the ones we want
ax.set_xticklabels(x_data)
ax.set_ylabel(y_label)
ax.set_xlabel(x_label)
ax.set_title(title)
Python的学习难度因人而异,只能说难者不会、会者不难,没基础的人自学会非常慢,道路很曲折,就跟学开车需要教练盯着一样。
痛点2
古典BI学习上手难
有个用户朋友这样形容:Excel突破几个点就能搞定很多事,可能学5%就可以成为高手了,但是古典BI知识点太散,要学习的东西很多,数据清洗、数据建模,尤其是还得学习DAX代码(相当于Excel自带公式的升级版),可能学50%还不一定能做出什么报告,更别提成为高手了。
痛点3
选择正确的图表不容易
各类图表都有自己的优势和局限性,光柱状图就有一般柱状图、分组柱状图、堆积柱状图、横线柱状图、双向柱状图等。
此外,图表细节处见真功夫,图表需要考虑细节实在是太多,布局、元素、刻度、单位、图例等等都需要合理。细节处理不到位,影响可视化的效果,例如:折线太细不便于观察线太粗又抹平了趋势细节; 更严重问题可能误导受众;刻度选取不合理折线过于陡峭 。
痛点4
快被美感整疯了
数据可视化能做到简单、充实、高效、兼具美感才是好的可视化。美感除了准确、充实高效外,也需要美观。美观分为两个层次,第一层是整体协调美,没有多余元素,图表中的坐标轴、形状、线条、字体、标签、标题排版等元素是经过合理安排的 ,UI设计中的四大原则(对比、重复、对齐、亲密性) 同样适用于图表。
第二层才是让人愉悦的视觉美,色彩应用恰到好处。把握好视觉元素中色彩的运用,使图形变得更加生动、有趣,信息表达得更加准确和直观。色彩可以帮助人们对信息进行深入分类、强调或淡化,生动而有趣的可视化作品的表现形式,常常给受众带来视觉效果上的享受。协调美是视觉美的基础。
—————————————————————
好的数据可视化作品不是一件容易的事情,是专业产品经理、UE、UI、开发完美配合的产物,还需要具备一定的数据分析能力、熟练使用可视化操作、较好的美术素养、良好的用户体验感觉,还能够换位到受众角度审视自己的作品,光有理论远远不够,还需要大量的实践磨炼,把理论固化成自己的感觉。
如果用上述的方式去实现数据可视化,的确数据可视化的门槛会较高。工具解放生产力,一个好的数据可视化工具可以让你的工作事半功倍,这里给大家推荐一个免费的数据可视化云平台——Banber,更快更简单地实现数据可视化分析,帮助大家快速上手数据分析。1天即可自己做出数据可视化简报/大屏,1周即可学会高级可视化组件。
直击痛点1
免代码开发的可视化平台
无代码的可视化开发一定程度上大大方便了业务人员,Banber数据可视化云平台的数据和流程都是通过可视化组建的,无需编写代码,只需要通过鼠标拖、拉、点、拽平台内的功能组件就能够完成可视化的开发。
通过可视化表单和模板化应用,帮助管理或业务人员快速搭建业务分析,透明呈现业务进度,实时展现精准数据,完整沉淀管理信息,同时支持第三方系统集成,让管理与业务随心而变、随需而配。
Banber更偏向于业务人员的数据可视化工具,适合不懂技术的业务人员。同时帮助开发者和企业技术开发团队增加软件开发速度,降低开发成本,达到降本增效的目的。
直击痛点2
轻量级的可视化平台
Banber不是操作繁琐的古典BI产品,而是一个活泼灵动的、所见即所得的数据呈现平台。Banber放弃了古典BI中大量的数据交互治理,专注于最终要表达的KPI数据模型,直接向业务工作者靠拢,并以可视化结果的形式呈现给业务决策者。
此外,Banber提供数据指标模型用于判断业务,并大胆地加入全新的协同、讨论、批示、分发、决策等业务工作模式对报告进行可视化结果和决策联动。支持主流网页和H5技术,展现更多丰富的数据形态分析,呈现结果既新颖又美观;使用体验和交互优异,独特的操作体验帮助客户快速实现项目开发和定制,和古典BI项目相比,Banber开发效率高,上手容易。
直击痛点3
海量数据模型及图表
常用的数据关系分为4类:
(1)对比。常用的对比关系可以分为3类。
①静态比较,又称为横向比较,即同一时间(时期或时点)条件下的数量比较。
②动态比较,也称为纵向比较,是同一统计指标不同时间上统计数值的比较,它反映随历史发展而发生的数量上的变化。
③综合比较,也可理解为静态比较 动态比较,是不同统计指标不同时间上统计数值的比较。
(2)构成。常用的构成关系也可以分为3类。
①静态结构,即同一时间(时期或时点)条件下,构成事物要素的数量比例和排列次序。
②动态结构,即构成事物要素的数量比例和排列次序在一定期间内发生的变化。
③综合比较(结构 对比),即构成事物要素的数量和数量比例在一定期间内发生的变化。
(3)分布。将总体中的所有单位按组归类整理,形成总体单位在各组间的分布。单个变量的分布可称之为“次数”,两个变量的分布可称之为“位置关系”,三个变量的分布可称之为“次数 位置关系”。
(4)联系。是分布关系的升级,反映两个事物的分布是否具有相关性,比如两类项目中,一类项目是否随着另一类项目的变化而有规律地变化。
觉得复杂的话,也可以参照下图。
这个难点具体可以参见之前的推文:如何用指标分析维度精准定位可视化图表?
Banber内置了海量的业务分析模型,对于实在有选择困难症,无法快速定位用何种图表表达数据的同学,可以直接将合适的模型拖拽至编辑区域修改数据使用。
直击痛点4
一键配色美化,
丰富格式修改
对于图表的图表中的坐标轴、形状、线条、字体、标签、标题排版等元素,Banber提供了丰富的格式修改自定义,可以对格式进行合理的安排。
一键切换主题字体,一键切换主题色的效果,图表和背景气质瞬间变化,再也不用为配色头疼。