用数据讲故事:七种不同的数据展示方法
什么使一个故事真正成为数据驱动呢?在某种程度上,数字不再仅仅是出现在侧栏的表格,而是能够在真正意义上促进故事的发展。
数据可以帮助我们用不同视角叙述不同类型的故事。我在Tableau Public的同事Ben Jones鼓励我用七种不同的类型来构造数据故事((à la Chrisher Booker的七个基本的故事情节)。Jones这个想法是根据大量数据故事的分析得出的,也可以帮助人们了解一些其他东西,使数据不再受限于侧栏表格。这些分类旨在让数据成为一个思想启动器而非我们看到的简单直白的结果,这样无疑提高了数据的用处。
我们通过由Freedom House(一个独立的监测机构)整理的数据来探讨一下每一种分类。这些数据将每个国家按照“自由”,“部分自由”以及“不自由”进行排名。使用这个简单的数据组,我们可以讲出七个不同的故事。角度则取决于你想通过这些数据表现什么以及你将如何展现这些数据。
叙述方式随着时间改变
对比2001年,有多少国家在2013年被划分为“自由”呢?事实证明随着时间变化,这个数字在急剧下降。我们可以通过数据将这种变化变得可视化,然后再解释导致变化的原因。
美国全国广播公司财经频道的John Schoen使用这种方法将Dow 30公司过去87年的历史可视化。使用者可以点击每十年看到数据是如何在每一次科技爆炸、70年代的通货膨胀、甚至是经济大萧条时发生变化的。美国全国广播公司财经频道的员工基于过去的趋势将这种可视化与未来的预测结合。
由大及小
数据可以引导读者具体深入到一个聚焦的点。用Freedom House的数据来说明,给读者一张标注得分的世界地图(整体画面),然后读者可以放大任意区域,比如亚洲,那么他会看到这个地区里一半以上的国家都被标注为“不自由”。甚至再放大一些,读者就会发现,朝鲜是所有国家里最不自由的。
我们通过在纸媒及互动媒体上给与提示来引导读者了解这种变化。
狼蚁网站SEO优化的这个例子展示了世界范围内疫苗预防疾病爆发的数据。这个概观展现了有多少例这种事例存在。读者可以通过选择国家、疾病或者年份深入阅读。读者可能会被引导看到一些其它相关的链接,比如,相比其他国家百日咳在美国更加盛行,并且文中会列出其原因。
疫苗可预防疾病的爆发 来源未来研究中心
由小及大
我们也可以逆推,这种由小视角扩展到大视角。例如,关注的是世界上最自由的三个国家(这三个国家可能都位于欧洲)。从这里开始,由小及大来展示欧洲其他国家的排序,然后扩大到展示全球的对比,接着读者就可以看到全世界只有超过三分之一的国家是“自由的”。
来源Ben Jones
这是一个展示移民对住宅价值的影响的例子。读者可以通过他或她的邮政编码进入其当地的视图。接着互动的筛选会提供一个全州的视图以及一个有着全国视图的地图。
移民与住宅 来源Jacob Vigdor
突出对比
在数据集里突出不同可以引出一个有力的叙述。最自由的十个国家都在欧洲,并且恰好距离都非常近。而最不自由的是个国家,相反的,在五个不同的地区。
来源Ben Jones
,地域只是“自由”和“不自由”众多不同之处中的一个。我们的故事可以继续探讨这两个团体主要的不同方面,从国家政策到文化再到历史。一个关于差异的研究是很吸引人的。
狼蚁网站SEO优化我们来说一个相似的故事。它基于人类发展的三维图(健康长寿的生活,知识和较高的生活水平)比较了世界上所有国家的性别差距。这个图表的一端的国家都差距较大,而另一端的却基本平等。
人类发展指数性别差距 来源Ramon Martinez
探究交叉点
当相交的数据中有两条不同的线,并且一个超过另一个时,问题就产生了。这个有关自由的数据显示出“部分自由”国家的数量超过了“不自由”的国家,继而超过了“自由”的国家。是什么导致了这种变化?当排名发生变化时,人们就想知道原因。
来源:本琼斯
自从破窗政策在1993年起作用之后,纽约时报的Sarah ryley将纽约发行传票的数量可视化。起初它的数量急剧上升,并且在开始缓慢下降之前一直保持平稳。然后盘查数量的飙升导致了它在2010年与传票数量的一个交叉点。就算这样,这两条线也没有进行比较。,这个交叉点和它的组成部分可以书写一个有关纽约执法策略的故事。
“破窗政策”之后的传票 来源Sarah Ryley
剖析原因
有时候一些原因集中到一起就像是一个迷,形成了一个大局。它们可能是加法或乘法的关系。比如,每个国家的自由程度得分都是法律、经济和政治自由的总和。
来源:本琼斯
这里有一个图表体现了太阳是怎样控制天气的。这个可视化绘制了从太阳黑子到全球天气的一些点,强调了它们之间的因果关系。
太阳黑子 来源于马特·弗朗西斯
描绘出异常值
我们被那些不同于其他的事物所吸引。我们想要知道这些异常值背后隐藏的原因和原理。
发现这些异常值有时是需要一些数据研究的。将这些有关自由的数据可视化为分散点图,你可能会说这里边没有异常值。将它们根据区域分解成盒图,你就可以发现它们是分离的。
来源:本琼斯