在数据世界中,仅能为图表和报表计算数字是不够的。 每个优秀的分析师都需要提供可靠的数据故事-围绕数据的叙述给人们留下了持久的印象。
人们硬性渴望故事 。 故事驱动力(渴望聆听和创作故事)是我们语言发展的先河。 安东尼·德梅洛(Anthony de Mello)说过:“真理与人类之间的最短距离是一个故事。”故事具有无与伦比的力量,可以为我们提供信息,启发和说服。
如果传统讲故事是针对我们的心脏 ,则数据故事既涉及心脏也涉及脑 。 除了引人注目的叙述之外,数据故事还通过使用数字信息(例如数据新闻业)吸引了我们的推理。 在斯坦福大学教授珍妮弗·艾克(Jennifer L. Aaker)的下面视频中,她解释了视觉数据故事的力量在于它们能够吸引我们的情感和智慧。
h?v = AL-PAzrpqUQ&feature = yo
- 该死的儿子! 播客(小说)D16
- 欢迎来到叙事倡议
- 自相残杀是怎么回事?
- Banyak belajar Banyak lupa,Sedikit belajar sedikit Lupa。
- 想家的讲故事的人:自然语言
但是,将数据添加到我们的故事中可能是一把双刃剑:当观众看到大量数据时,正如数据专家阿尔贝托·开罗(Alberto Cairo)在他的著作《真实的艺术》中指出的那样,他们寻求已证实的固有偏见。在选择正确的可视化模型时,我们必须非常谨慎和真实 ,不仅要讲述观众想听的故事,而且要讲完整的故事,不要遗漏重要的事实。
既然我们已经选择了真实格式的数据,那么什么造就了一个好的数据故事呢? 现代数据可视化创始人爱德华·塔夫特(Edward Tufte)说,好的数据可视化是“以清晰,准确和高效的方式传达复杂的想法”。 在当今的消费文化背景下,广大受众对数据故事的消费越来越多,这也意味着我们需要做好教育大众受众的工作,并为他们描绘未来 。 简而言之,一个好的视觉数据故事具有以下特征:
- 这使复杂的问题变得有意义
- 令人吃惊的惊喜
- 它为未来指明方向
- 它激发了明智的行动
随着科技公司的规模扩大,他们收获了无数的用户数据 ,这些数据可以进行切片和切分以获取有意义的数据故事。 在这里,我们将了解领先的技术巨头正在处理其用户数据,以及他们如何制作可借鉴的精彩故事。
OkTrends(OkCupid)
Ok Cupid是使用内部数据讲述约会趋势和偏见的先驱。 以他们最受争议和引用最多的故事之一“竞赛与吸引力”为例,该标题本身就足够吸引人。 通过按种族和性别查看QuickMatch得分,他们得出了有意义的,令人震惊的结论,即种族在快速吸引力判断中的作用。

他们在这方面做得很好,是通过以彩色代码表显示数据来组织数据,从而得出有意义的结论。 这些表中的值是“首选项与平均值”。 因此,左上角的单元格值表示亚洲男性认为亚洲女性的吸引力比平均水平高11%,而在其右侧,我们可以看到亚洲男性将黑人女性的吸引力比平均水平低16%。
颜色通过分组规则帮助我们理解数据。 读者可以将相同的数据点按相同的颜色快速分组,并得出有意义的结论,例如,我们可以快速看出拉丁裔女性对拉丁裔和白人男性都有吸引力。 渐变可以帮助我们确定数值的差异,例如,较深的红色被认为比红色的浅色阴影更负。 在这种情况下,我们不需要记住确切的数字就可以知道,一般而言,白人女性发现亚洲男性不如黑人男性有吸引力。
OkCupid如何用数据讲述故事的另一个示例是通过简单的可视化揭示其数据趋势中的惊喜 。 折线图是一种简单的可视化技术,但是如果您的数据中存在明显的线性趋势,则效果惊人。 在下面的图表中,您可以看到,与我们所认为的相反,OkCupid用户随着时间的推移,在关键种族问题上的保护越来越多。 如果您的数据中包含意外内容,请以支持您的叙述而非矛盾的方式对其进行分组和可视化。

Spotify见解
Spotify具有大量的收听数据-人们何时收听,人们在听什么以及播放歌曲的频率等。
在这个有关50个州最独特的七月四日音乐的故事中,Spotify调查了人们在每个州七月四日听最多的歌曲,并在下面的彩色编码图中直观地显示了发现。 作为数据挖掘的结果,Spotify还为这个特殊场合提供了所有热门歌曲的播放列表。

好的可视化效果应该能够在没有太多上下文说明的情况下独立存在。 当面对庞大而复杂的地理数据集时, 十字路口图是一种出色的图形形式,可以清晰,令人难忘地讲述故事。 使用阴影突出显示每个州播放的歌曲的频率,我们很清楚“哪个州是最爱国的”。 该地图能够以清晰且令人难忘的方式压缩非常复杂的地理,定性和频率数据。
除了讲故事之类的具有决定性的见解之外,地图还可以是讲述探索性数据故事的一种好方法。 在下面的交互式地图中,Spotify以交互形式可视化了世界各地的城市音乐数据。 读者可以浏览世界地图,然后单击任何城市,然后查看该城市最“独特的歌曲”。 这种视觉数据故事没有显示封闭的结论,而是邀请访问者探索数据并自行决定有意义的要点。

确实的工作趋势
的确,Indeed收集了大量的职位发布数据,包括职位,行业,地理和季节性需求等。在“求职趋势”中,Indeed使用各种视觉叙事技术来了解与工作相关的数据,例如折线图,气泡图,
使用气泡图讲数据故事时,使用规范化的数据来确保气泡的大小与我们与之比较的组的关系值成比例非常重要。 在下面的此“人均职位发布”地图中,计算了人均职位发布以比较50个州的不同人口的值。
除颜色外,气泡的大小是帮助我们理解复杂数据的另一个视觉元素。 较大的气泡代表较高的人均就业机会,这使我们清楚地了解哪些州具有特定职位的最高工作机会。

在数据叙事中,危险是被一次展示所有内容的欲望所迷惑,使读者无所适从。 讲述重点数据故事的关键是选择正确的视觉格式,以清楚地指示您要测量的内容。 在下面的图表中,我们很清楚这里的重要指标是每个行业随时间变化的职位发布。
如果这里的作者没有显示“变化与之前”的百分比变化,而只是显示职位发布,则对于该数据集,我们将不会得出任何有意义的结论。 一种简单的可视化技术,即使用堆叠的条形图来表示百分比与颜色代码的组合所产生的百分比,这清楚而有效。

Fitbit博客
Fitbit在揭示其数据令人惊讶的方面做得很好。 借助众多用户生成的健身数据,例如运动时间,采取的步伐和休息时间,Fitbit能够查看大型地理区域的两种宏观趋势,并放大单个状态以了解人们在做什么。
在这篇关于美国最适合哪个州的文章中,Fitbit考虑了许多因素,并汇总了大数据以获得见解。 答案将挑战您的传统观念:是威斯康星州的麦迪逊,而不是瑜伽之都圣莫尼卡或素食天堂波特兰。

作为健身产品,最终目标是帮助人们保持活跃和健康。 自我监控您的健身数据可能会使您始终保持自己的目标,但更有动力的是,看看自己如何与同龄人抗衡。
Fitbit在按队列对他们的大量用户数据进行基准测试方面做得很出色,并通过引人入胜的数据故事来激发行动 。 在这篇文章中,人们敦促减少就座时间并增加出行次数,Fitbit着眼于各个国家的总就座时间,并说服了9-5名工人久坐不动,以及我们需要多少出行时间。
在Fitbit Alta中将“提醒移动”设置为号召性用语,这对产品参与度和用户个人健康均有益,这是双赢。 在最好的情况下,数据叙事应该达到共同利益的目的,并激发明智的决策。

Zillow门廊
Zillow博客的使命是“始终在线”并“引导您回家”,并通过提供数据支持的见解来帮助人们驾驭复杂的市场并做出购买/租赁决策。
在Zillow博客Porchlight的“市场趋势”部分中,读者可以找到大量有用的可视化市场数据,以便于解释。 这些数据故事是为购房者和租房者创建的,探讨了与消费者密切相关的主题,例如这篇文章介绍了在当今(有些令人沮丧)经济形势下千禧一代可以负担得起购房的地方。

这种视觉效果的最大作用就是牢记受众(千禧一代),并通过使用图形条形图使其有趣来吸引他们。 年轻的听众可能会被困难的市场数据所吓倒,这种可视化在与年轻听众友好方面做得很好。
同样,用高度表示数据的价值,对我们来说很清楚,圣路易斯和辛辛那提拥有房屋的机会比旧金山和圣地亚哥要高得多。 视觉叙事的力量可以将非个人数字转化为易于关联的事实。
公司可以用数据讲述精彩故事的另一种方法是使用数据来指导未来的行动,例如Zillow研究小组在这篇博文中所做的尝试,试图将美国顶级城市的浪漫前景排名。

研究小组决定了一些关键的排名因素,例如单身人士的百分比,可支配收入和人均娱乐选择的数量。 结果可能对某些人来说有趣或令人惊讶,但对于希望在情人节那天表达爱意的人来说,这却是有希望的。
轮到你了
贵公司是否收集了大量的用户数据? 无论如何,您是否可以挖掘这些数据以揭示令人震惊的事实或激发行动? 在下面与我们分享您的想法。
如果您准备在可视化数据方面迈出信心的一步,Visme可以免费开始讲故事。