不走错过的可视化经验,你学到了吗?

本文转载自微信公多号「数仓宝贝库」,作者王大伟。转载本文请有关数仓宝贝库公多号。

01如何选择正当的 可视化类型

可视化是借助图形化的手段,清亮有效地将数据展现出来。当有可视化需求时,吾们答该先晓畅需求是什么。例如需求是查望“近六个月的销量情况”,最先吾们能够确定这边会涉及两个维度展现,一个维度是时间序列(在这边是“近六个月”),另一个维度是每个月的销量。展现两个维度的可视化手段许多,例如散点图、折线图、柱状图等,在这边很隐微选择折线图较为正当,为什么呢?由于折线图正当展现不息的时间序列数据,如图1所示。始末折线图,能够清亮不悦目察出销量随时间的转折情况。该折线图对答的详细代码如下:

option = {      title: {          text: '近六个月销量情况',          left: 'center'      },      xAxis: {          type: 'category',          data: ['2020-3', '2020-4', '2020-5', '2020-6', '2020-7', '2020-8']      },      yAxis: {          type: 'value'      },          series: [{          data: [820, 932, 901, 934, 1290, 1330],          type: 'line'      }]  }; 

图1 某商品近六个月销量情况

每栽可视化都有其正当的行使场相符,必要在清晰要展现的新闻之后相符理选择可视化类型。这边浅易总结下:

倘若必要展现数据的分布情况,能够考虑散点图、箱线图、柱状图、直方图; 倘若必要展现数据的转折趋势,能够考虑折线图和双轴图; 倘若必要展现对比凶果,能够考虑柱状图、饼图、雷达图; 倘若必要展现数据的片面与团体有关,能够考虑面积图、饼图、朝阳图、堆积柱状图、矩形树图; 倘若必要展现数据之间的有关,能够考虑散点图、气泡图、桑基图。 倘若必要展现文本新闻的重点,能够考虑词云图; 倘若必要展现流程中每一步的转化情况,能够考虑漏斗图。 02可视化配色需仔细什么

倘若想要本身搭配色彩,其实有许多能够优化和仔细的点,总结如下。

倘若是新手,提出直接操纵色彩主题,由于色彩主题是专科人士竖立搭配的,不光美不悦目而且操纵方便,无须本身花大量时间搭配。倘若本身搭配,很能够搭配很久也得不到想要的凶果,于是,倘若你觉得某套色彩主题正当就大胆操纵吧。ECharts挑供了13栽可选的色彩主题方案,如图2所示,点击左上角的下载主题即可下载操纵。

图2 ECharts的色彩主题

倘若必要展现的内容有着相符人类感知的颜色,提出直接操纵该颜色。例如红色频繁和炎力图的炎量大幼搭配操纵,蓝色和降水量搭配操纵。例如,图3代外某设备在一周的差别时间的内部温度炎力值,温度越高,炎力值越大。从图3中能够一现在了然地不悦目察出温度最高的时间是周日的上午九点(9a)。

图3 某设备在一周的差别时间的内部温度炎力值

通俗来说,标准的可视化望板起码必要6栽颜色,倘若配色不足够,在差别可视化类型中会影响外达凶果。

色彩三要素包括色相、明度和饱和度。色相就是吾们一般说的颜色,例如红色的花朵、绿色的树叶,这边的花朵和树叶就具有差别的色相;明度指色彩的明黑水平,也是吾们一般说的颜色深浅度;而饱和度指的是色彩的艳丽水平。当有较无数据类别必要表现时,倘若只是明度的转折,例如只有明度转折的渐变色,在外示和表现差别元素单元时不能够清晰区分,于是必要同时兼具色相和明度的转折,让用户始末视觉感受更益的定位元素和数据,如图4所示。

图4 同时兼具色相和明度转折的图

当只必要展现某个单一指标数值大幼比较和转折时,提出操纵单一颜色的渐变凶果,也就是颜色明度的转折外示数值大幼,通俗亮度越大,外示的数值越幼。

自然,你不消十足按照以上的内容,只是行为参考和提出,由于差别场景的可视化请求差别,受多差别,详细到某个场景和某个题目,有许多细节必要在实践中逆复尝试并一连积累经验,搭配出更正当的色彩凶果。

03探求动态和酷炫凶果有错吗

做可视化时,总期待制作的内容能让人目下一亮,于是许多人将“目下一亮”理解为动态和色彩艳丽的酷炫凶果。最先,探求动态和酷炫的凶果,本身并异国什么题目,但是人们往往会由于可视化内容是动态而将仔细力更多消耗在动态内容上,例如某地区人口迁徙的图中有多条弯线连接迁入和迁出的地区,并加入箭头代外人们的迁入与迁出倾向,但是为了酷炫,在弯线上加入某些图标(例如飞机图标)代外人口的起伏倾向。最先,这幅图实在相等酷炫,但是镇静下来会发现各个地区的人口流向弯线已经交叉,会影响人们望图的直不悦目判定,倘若此时你再加上动态图标,会作梗人们的不悦目察和判定,而将图标改为光束的传播凶果是不是更益呢?于是善用图标能够对一幅可视化图的外现力锦上增花,滥用也会使终局适得其逆。

除了动态,酷炫的色彩也是人们往往操纵的,现在标是为了让可视化不再通俗无奇。例如在一个柱状图,对每一个柱子填充一栽颜色。你能够会问,为什么不及用多栽颜色填充呢?一栽颜色宁靖淡了,多栽颜色才能凸显这幅可视化!倘若你是如许想的,那么请思考一下柱状图的现在标是什么?柱状图是为了外达数据的分布情况,于是它的关注点答该是柱子的高度,而不是柱子的颜色。自然,你能够用渐变色来强化柱子高度的展现,例如柱子越高颜色越深,这是相符理的。

以上只是两个常见的例子,在吾们制作可视化时,对于动态和色彩的选择必要郑重,你最先要清晰为什么操纵这些?操纵后比操纵前有什么益处?倘若能回答这些题目,再往操纵。

除此之外,当数据量很大时,大量动态酷炫凶果能够对前端渲染挑出了挑衅,于是必要按照实际情况测试和操纵这些特效。

本文摘编于《ECharts数据可视化:入门、实战与进阶》,经出版方授权发布。

作者:王大伟,现在就职于坦然金融壹账通,从事数据发掘算法做事,拿手ECharts、Python、自然说话处理、数据分析发掘、机器学习。

【编辑选举】

值得关注的五大数据可视化新兴趋势 AI声援河南洪灾!CMU博士生开发「求助地图」,时空精准可视化 超周详的数据可视化设计指南:设备篇 如何设计可视化搭建平台的组件商店? 有了这个可视化插件, Python 编程更轻盈