* F \- H q: [/ f+ w' x. c7 A! R
大数据时代,数据驱动决策。处理不好庞大、复杂的数据,其价值将大打折扣。
1 G: t- W" }: _/ a% s+ f* c 可以想象一本没有图片的教科书。没有图表、图形或是带有箭头和标签的插图或流程图,那么这门学科将变得更加难以理解。人类天生就是视觉动物,而视觉效果对于分析数据、传达实验结果甚至做出惊人的发现至关重要。
0 o% M* {# {& m* o( e! F: q 工作中我们可能会接触到很多业务数据,需要在总结汇报中展示呈现,俗话说“字不如表,表不如图”,那么如何缩短数据与用户的距离?让用户一眼Get到重点?让老板赞同你的汇报方案呢?
* J6 c& y' z3 G% s3 h3 d
『《大西洋古抄本》是达芬奇的手稿集册中最大的一部,共 12 卷,1119 张,年代分布为 1478 年到 1519 年。每个方块代表一页手稿,上面的颜色代表涉及的主题,包括几何与代数、物理学与自然科学、工具和机器、建筑与应用艺术和人文科学。点开每一个小方块还可以看到每一页上面达芬奇写了什么,涉及了 36 个小话题,包括了马、食谱、绘画、灵魂、童话故事、笑话等很多有意思的小话题。』
: O) @2 Z3 z# e

$ M0 d( ~. a: ^; r
是这样的么?
7 G" p# R3 L2 [' Z. n 这样炫酷的数据可视化,小编真的不会。开个玩笑,其实工作中我们并不需要作出很炫酷的视觉呈现,数据可视化主要旨在借助于图形化手段,清晰有效地传达与沟通信息,有效地传达思想概念,美学形式与功能需要齐头并进,通过直观地传达关键的方面与特征,从而实现对于相当稀疏而又复杂的数据集的深入洞察。因此在设计过程中,每一个选择,最终都应落脚于读者的体验,而非图表制作者个人。
+ c/ o @! H7 r( F3 `% N# _( c9 u 你不得不注意的图表制作小技巧
* Q0 c; r+ z7 M% D+ }
条形图的基线必须从零开始
) T4 b1 y8 a' n) t) x# A) ?9 }* I) f
Y轴不从零开始,可以使数据看起来具有比实际存在的更大的差距。这使得可视化会误导传输信息。条形图的原理就是通过比较条块的长度来比较值的大小。当基线被改变了,视觉效果也就扭曲了。
) t& W1 o; }0 r0 x

+ w8 T7 I+ m& Q! J7 Q 使用简单易读的字体
8 n3 s3 u/ i, I7 ^ 有些时候,排版可以提升视觉效果,增加额外的情感和洞察力。但数据可视化不包括在内。坚持使用简单的无衬线字体(通常是Excel等程序中的默认字体)。无衬线字体即是那些文字边缘没有小脚的字体。字体选择可以影响文本的易读性,增强或减损预期的含义。因此,最好避免艺术字体并坚持使用更基本的常用字体。
) ^4 U% u* C! e2 k
6 `$ s% b, T+ D, ^
: i2 ^% P, m$ m* R% \# V 打开凤凰新闻,查看更多高清图片
) ?8 |! O2 X3 C# U. f; f) A
7 ]+ I0 g& @1 `0 O3 N/ N3 T
. l* a( O: r1 m% L g 条状图宽度适度
: Y/ d- v, u. Q
条形图之间的间隔应该是1/2栏宽度。
$ T m0 N, J" n: E

) d9 X8 H) ?, W& r% k2 F
使用2D图形
/ U! h- B: c( C; x
虽然他们看起来很酷,但是3d形状可以扭曲感知,因此扭曲数据。坚持2 次元,确保数据准确。
; ^! ]* _- j8 f

: v! }+ x% D: I9 Q% a 使用表格数字字体
' D* S+ l" r0 `$ l
表格间距赋予所有的数字相同的宽度,使它们排列时能彼此对齐,使比较更容易。大多数流行字体都内置了表格。不确定字体是否正确?就看小数点(或任何数字)是否对齐就行。
$ V2 ^5 B0 A, P& e" Q" V- a, L* F

7 r# b" w% L" V( O0 x$ } 统一感
6 O) `0 |2 m2 @% h0 N3 P+ ]# v) { 统一感使我们更容易接收信息:颜色,图像,风格,来源……
% z0 Q- U0 g; `! M9 q* r. L; z
连贯的设计将有效融入背景,使用户能够轻松处理信息。最佳可视化帮助观众快速得出数据所呈现的结论
( w( X6 p! q* W, Z, f/ M$ Q% y

+ g8 }; T% w' e) S. ]
不要过分热衷于饼图
y3 f; }% S8 ]9 K7 e3 r! z
展示多个区块比例大小,所有区块(圆弧)的加和等于 100%。但最好避免使用这个图表,因为肉眼对面积大小不敏感。
5 b9 n# J8 m) G3 a: H5 P 
- a: ? I/ g5 r+ S/ O 折线图中使用连贯的线条
+ K5 z( L5 ?8 v5 [! D: [
虚线,虚线容易分散注意力。相反,使用实线和颜色,反而容易区分彼此的区别。
" e5 h% v; C6 o4 p* ~

) s l) R! A, X( p/ e' q3 g 尊重部分所占整体的比例
2 i; F7 }; d+ i& T
在人们多选的问题上就会出现比例的重叠,不同选项的百分比之和大于一。为了避免这种情况,不能直接把比例做成统计图。相较于呈现数值,有些图更着重于表现部分与整体的关系。
% D# _; Z/ r8 C% v! n9 ]

7 g; Q" U% a1 p! j( r2 m9 k1 H; C8 T 面积、尺寸可视化
* l! ?7 ~ R' y0 o/ a 对同一类图形(例如柱状、圆环和蜘蛛图等)的长度、高度或面积加以区别,来清晰的表达不同指标对应的指标值之间的对比。制作这类数据可视化图形时,要用数学公式计算,来表达准确的尺度和比例。
3 Q- f6 }) W* S0 Q& Y

+ e1 Y7 K6 l) F2 _9 \2 Z( s. K
使用大小来可视化值
4 q/ p# {! E9 B1 |' x
大小可以帮助强调重要信息并添加上下文提示,使用大小来表示值配合地图使用的效果也非常好。如果您的可视化中有多个大小相同的数据点,它们会混在一起,很难区分值。
4 Q! ~; l- o/ {; F }* d- o" e6 V! y

D5 N" ]9 i5 ? 使用相同细节
6 d* z0 B9 V/ {9 P; [# q" I
添加的细节(和数字)越多,大脑处理的时间就越长。想想你想要用你的数据传达什么,以及最有效的方式是什么。
9 J- l* w* k9 Z# z1 Y
使用基础图形
0 x7 i! G: I% `' v
一个很好的经验法则是,如果你不能高效理解,你的读者或听众可能也难理解。因此,坚持使用基础图形:直方图、条形图、维恩图、散点图和线形图。
# a! i; C5 K8 l' k

3 v. @$ H @# \
视图数量
3 l' h/ J% I1 T
将您的可视化中的视图数量限制为三到四个。如果您添加太多视图,大局会被详细信息所淹没。
9 v) {# s1 D: i7 S+ n# h( V m' f5 T 关于图表配色,你可以参考的5条准则
7 `2 p) J3 [1 M" D+ X8 |0 d
颜色深浅
1 G) q* e: f- n7 c 通过颜色的深浅来表达指标值的强弱和大小,是数据可视化设计的常用方法,用户一眼看上去便可整体的看出哪一部分指标的数据值更突出。
: Q% _9 I; `4 M F: R 
2 h: ]3 d; v4 {1 N, A 使用同一色系
4 T( R6 C- Z, L3 V- r1 L* E
颜色用得太花,会给数据增加不可承受之重,相反,设计师应该采用同一色系,或者类比色。
6 o+ o% E8 j- W' w- v

3 c+ f# \: ]2 @# W
避免使用鲜艳的颜色
4 b% u* \, L2 m9 o7 G 明亮鲜艳的颜色就像是把所有的字母都大写想要强调一样,你的听众感觉你在对他们大声推销。单调的颜色,反而能很好地用于数据可视化,因为它们可以让你的读者理解你的数据,而不至于被数据淹没。
9 o! _: G W, s0 B6 ?9 z
% m3 j) S5 e9 K 标签使用不同颜色区分
9 e5 K4 \2 u9 d 在某些情况下,在一段时间或一系列的值中,我们可能测量了不同种类的物体。例如,假设我们测量 6 个月以来狗和猫的体重。在实验结束时,我们想画出每只动物的体重,分别用蓝色和红色区分猫和狗。
$ j0 p3 e, z$ v/ p
/ J; V8 n7 }8 Z$ w: d
颜色数量
$ i& g9 z3 V# C
不要在一张图上使用6种以上的颜色。
" f9 [8 c% {' P' {* `
+ B6 Y% N @) c9 {5 g
建议:
9 T; q5 T6 g) l) V
使用具有高对比度的颜色
3 n+ G$ {5 r2 c6 o4 _
使用带有图案或纹理的颜色来传达不同类型的信息
0 v: H# ]( d* a0 x5 O 使用文本或图标标记元素
9 m5 _( }2 n$ |. k9 a$ ?6 U
标准的可视化图表一定有注释
. R" h; i7 ~. |5 s+ H8 t
解释编码
% X( @! `0 j' o) ? 通过一定的形状、颜色和几何图形的结合,将数据呈现出来。为了让读者能读清楚,图表设计者就要把这些图形解码回数据值。
! E" h. i3 z3 A 轴标签
2 @9 C* B' U& q+ i% Z
这可能看起来没有必要,或者不是很有帮助,但是你无法想象,如果你的图表有点混乱,或者看到数据的人对此不是很熟悉,你会被问多少次 x/y 轴代表的是什么。按照前面的两个绘图示例,如果要为轴设置特定名称。
0 k! T' u1 _& ^1 i. a/ H3 d6 ] 标题
K+ e& B q' S" G 如果我们要将数据呈现给第三方,另一个基本但关键的要点是使用标题,它和之前的轴标记非常相似。
/ d. H; C/ ~5 v
3 [! d, S( y8 C8 h) U4 F4 l5 L
重点元素做注释
) w- M! R& F7 f: n7 ~! x 通常情况下,仅仅在图表的左右两侧使用刻度本身并不是很清楚。在图上标注值对于解释图表非常有用。
+ M# _& z# Q0 h
% S, D7 {4 K2 C: I: S; v
重要视图位置
1 S! V8 T# O2 w1 J. z
将最重要的视图放置在顶部或左上角。眼睛通常会首先注意到该区域。
K1 c6 ^; [: ?9 F
2 ?* {8 e: M5 M0 `
优秀的可视化图表,遵守的6条原则
# B: n% a' E! w) h# p6 ~! Z
数据排序有序
& P$ j) v' s- Z8 x9 O
数据类别按字母顺序,大小顺序,或价值进行排序,以一种合乎逻辑的和直观的方式来引导读者了解数据。
& [: ~ J) q) s' \" p) Q/ F& A( Z7 H$ [+ h# j* c2 T
比较数据
$ a1 k, y7 z, U* q7 M 比较是展示数据差异的好法子,但是如果你的读者不容易看出差别的话,那么你的比较就毫无意义。确保所有的数据都是呈现在读者面前,选择最合适的比较方法。
4 i4 B2 {* y& |! l) u D) M: Z! m3 }1 j4 Z! H0 w; b% I9 d
不可扭曲数据
2 G F3 M0 b7 z( t( k/ H
确保所有可视化方式是准确的。例如,气泡图大小应该根据区域扩展,而不是直径。
$ ]: n# ~" _7 h6 ]. `( t: S9 a) n0 y r7 r
展示数据
0 r- n+ |+ u. p7 }; }9 D
让读者看到数据,这是可视化的重点。确保没有数据丢失或被设计。例如,使用标准的面积图时,可以添加透明度,确保读者可以看到所有数据。
* U( Z5 Y8 _0 n z3 ^% \1 z
删除变量
) ? h% v, S4 e& h7 O 很多时候,太多的信息会影响读者的注意,从可视化中删除隐含信息是一个好主意,在这种情况下,我认为我们不需要在轴中包含变量的名称。
/ v0 ]3 L. t0 z, L' Q- W& Q* l8 a 避免数据噪音
2 k! W! ?0 J3 F. M5 S 把不重要的东西减到最少或者去掉。这包括减弱或移除图形线,改变轴线、图形线的颜色,以及用浅灰色描绘电子表格行。使得“数据比率”可以达到一个很高的水平,听众会更容易明白其中的数据情况。
0 z& m- L, Q+ R1 Y# S5 l
) v7 T; H* q" c5 i8 S5 Z( r 良好的数据可视化应该通过使用图形,清晰有效地传达数据信息。最佳可视化使您可以轻松地一目了然地理解数据。他们将复杂的信息以一种简单的方式分解,使目标受众能够理解并以此为基础做出决策。
2 H2 Z& ]3 V" Z3 q2 T- E0 R
正如Edward R. Tufte指出的那样,“设计的基本考验是它有助于理解内容,而不是它的时尚性。”数据可视化尤其应该坚持这一理念。目标是通过设计增强数据,而不是引起对设计本身的关注。
; |2 w$ V0 M' a 各平台同名“职坐标在线”
( @4 H/ t: T+ Q& F: V