前一段,知名设计工作室 Pentagram (五角设计)高调宣布知名的可视化设计师 Giorgia Lupi 加入,在我看来,这标志着:数据作为现代品牌的重要组成部分的一天到来了。

Pentagram 如果有人不太熟悉的话,那提到他们代理的众多大品牌的品牌改版,比如:万事达 MasterCard、美国国会图书馆 Library of Congress、褒贬不一的 Slack 改版、甚至最近的 New Money Oppo,大家可能都有一定的印象,可以说他们属于品牌设计食物链的最顶端了。

Giorgia Lupi 是谁,知道的人恐怕就会少一些。我最早知道她,是知道她的 「 Dear Data 」这个项目。这是一个类似书信体的数据可视化的项目,她和另外一名设计师,通过明信片的形式,把自己的日常生活中产生的一些数据进行编码,形成一些规律的图形。

Dear Data: Dear Data 信息量是什么呢?也就是一些流水账,你也可以把今天吃了几包辣条画成数据可视化。

从这个项目(也算是她的代表作吧),也引出她后来所在的 Accurat 这家意大利工作室的数据可视化的一个流派的特点,就是:视觉形式优先,并不是说他们作为数据可视化不专业,而是他们在人文与科学的十字路口往人文这边拐得多一些。具体可以看看这篇专访

Giorgia Lupi

这张图看起来很有美感和韵律,但是他传递了什么信息呢?左侧非常显眼的「 How to Read It」就是非常反常识的一种方式。大家都听说过一句话: XXX is like humor, when you have to explain it, it’s not that good. 但是又有什么要紧呢,大家都记得了一张蒙德里安配色的,倾斜的数据可视图,大致讲了一些国家的区别…?

但是,「大家记住了 」这一点很重要,这正是品牌所需要的。

简单区分一下各种可视化形式

既然品牌需要数据可视化是一个趋势,那么数据可视化都有哪些形式呢?

从我个人不严谨的角度,可以把各种可视化根据信息量、传达信息的目的分成以下几个流派:

  1. Generative Art: 生成艺术
  2. Data Driven Art/Design: 数据参与的设计和艺术
  3. Visual Data Analytics: 数据的可视化分析
  4. Infographics: 数据信息图

可能还有一些其它维度的一些分类,但是今天我先争取把这几种能够讲明白,其它以后再说。

1. Generative Art / 生成艺术

如果你对 Processing 有一些了解,那么 Openprocessing 有非常多漂亮的动画、Demo。但是这些形式的背后,实际上是没有需要传递的信息存在的。

生成艺术的几板斧,包括:正弦波、Perlin噪声、Boid算法、粒子系统,基本上都是作为素材为生成艺术提供一些形式上的美感。没有办法,人就是有强迫症,喜欢那些有规律、有质感的形式。如果这些信号都不够用,可能就要再加一些传感器,比如触摸、Kinect 扫描再补充一些变量来互动。

有一个挺漂亮的例子:Colorpong 是专门提供非常有「 数字感」和「 科技感」的素材的,尤其是 Dataism 这个系列,看上去与我们日常所见的数据可视化形式很接近,但实际上只是设计师在 Illustrator 里,可能都没有写任何一行代码,只是操作节点,用笔刷、随机节点滤镜和一些变换操作营造的这种氛围。

Dataism by Colorpong Dataism by Colorpong

生成艺术,顾名思义,好看就行了,信息不重要(除非你在里面藏了彩蛋。)

苹果语音备忘录的波形是 Apple 的发音 苹果语音备忘录的波形是 Apple 的发音

2. Data Driven Art/Design/Research: 数据参与的设计、艺术和创新

数据可视化最基本的定义,是把数据通过编码(Data Encoding),变成长度、色彩、面积、形状、位置、甚至时间等量化的信息进行展示。(参见 Springer 的经典可视化理论著作 The Grammar of Graphics

一般情况下,我们会用长度编码做柱状图,用面积做饼图,用位置做散点图。这没有什么问题,大多数人直观可感知的量化信息无非也就是这几种。这些基本的图表,做季度汇报和科普是够用了,作为艺术品、体现高端的设计感、甚至在可视化领域发表新的见解和论文,需要再激进一些。

这时,在设计师/艺术家/研究者的手里,数据的编码方式需要更创新、更灵活,Giorgia Lupi 无疑是这里面做得很好的一名设计师,更多的可视化创新也会在各个高校、公司的人机交互部门展开。每年的 「 最棒的数据可视化排名 」可能是这个领域成果的集中体现,比如:Information Is Beautiful Award

这种不明觉厉,仿佛很有信息量的范 这种不明觉厉,仿佛很有信息量的范 后来被广泛认可的河流图,表现票房趋势 后来被广泛认可的河流图,用于表现票房趋势 Giorgia Lupi 在 Accurat 的另外的一个作品,You get the point Giorgia Lupi 在 Accurat 的另外的一个作品,You get the point

既然是创新,新最重要,其次是美。如果丑的话,可能也得不到太多的关注。但是目标不是为了让所有人懂,毕竟所有人都懂的形式大家都用过。

其实仔细看 Accurat 的主页提供的服务,它主打的是「 Data-driven art + design」。也就是说,他们是从数据出发去做一些设计和艺术,主语是设计和艺术,那么人们评判 Art 的标准就是 Aesthetic,只要长得好看,说什么都对。

3. 数据的可视化分析

数据的可视化分析,可能更多和统计、分析、数据的处理相关,Tableau 和各种 BI (Business Intelligence) 工具做的大多数就是这个领域。各种 Dashboard、大数据是这个领域的核心关键词。

Microsoft PowerBI Microsoft PowerBI

数据的可视化分析,是期望通过数据具象化,回答一些关注问题。比如数据的分布、数据的关联性、数据的特异性、数据的变化趋势等。有时统计性质完全一样的一组数据,实际上呈现的是截然不同的特征,这时如果没有好的展现形式,很可能就会错过对这些数据的洞察。

安斯库姆四重奏:数据具象化的一个经典头脑实验,x,y 的平均数、方差、相关系数等完全一致。 **安斯库姆四重奏**:数据具象化的一个经典头脑实验,x,y 的平均数、方差、相关系数等完全一致。

要达到「数据会说话 」的目的,需要做到以下几点:

  1. 数据是干净的。数据统计中,经典的一句话是 Garbage In, Garbage Out. 如果数据不干净,什么分析都是扯淡。
  2. 数据是多维度的。单一维度的数据,只能得到片面的信息。关联性不代表因果关系,只有足够多维度相互佐证,才有利于得到最终的分析结论。
  3. 数据的筛选、展现工具灵活、多样化。数据的分析都会带着一定的假设和前提来进行。从发现一个特征,锁定特征,到最终验证结论,这些过程都需要对数据精准的操作;每个展现形式也都有它适合的场景,有些数据的特点只有在特定的形式下才能体现出来。

各种数据平台,都会在这些方面做不同的尝试和努力。有一些从展现层面,支持小提琴图桑基图矩形树图旭日图弦图这样的高阶图表,寄希望能够让展现多样化让用户得到对数据特征的发现。

但是这只是故事的一个角度,如果没有干净、多维度的数据,仅仅依靠形式上的多样性来就能发现数据特征,那只能说是中彩票了。因此,更多 BI 软件开始做数据的清洗、关联工具,比如 Tableau Prep

4. Infographics 信息图表

信息图表也是最近很常见的一类信息可视化形式,比如「 一张图讲明白」系列,也有一些变种,比如短视频、动画、网页交互类型的信息图表。

《人体信息图》中的一页

这是最平易近人的一类图表,它的出现一般要讲述一个明确的故事或观点,数据可视化是为了加强效果,或者让读者有更直观的概念而出现的。比如「 如果月亮的大小是一像素」。

信息图中,很少能见到太复杂的图表。一般的数据展现形式还是中规中矩的柱状图、面积图、饼图结合插画的形式。如「人体信息图」。毕竟它的目标是让大家更好、更直观地理解,而不是当场开展可视化教学。每张图所表达的观点都比较单一和明确。

有时只是给数字配张图 有时只是给数字配张图

从更广义的角度,现在还有一类「互动故事讲述/ Interactive Storytelling」,其实在整个过程中,并不强调数据的存在,而是通过互动形式给人更直观的印象。因为它们的目标大体一致,也放在这里供大家参考吧。比如:

和我讨论

这里总结和分类还是我的一家之言,未必准确,希望大家面对五花八门的数据可视化项目的时候,能够分辨出来它们的特征,按图索骥。也希望大家补充和指正。

如果需要讨论,请直接 在 Twitter 上联系我