有声读物的增强体验

亚马逊苹果公司如何升级数十年格式

自从磁带和CD时代以来,有声读物就已经存在。 利用每个新的技术浪潮,它们的传播分多个阶段进行。
三个关键转折点显着提高了它们的相关性:

  1. Audible推出时,互联网在90年代中期开始发展。 直到那时,有声读物仅在实体零售店有售。
  2. iPod和iTunes Store于2003年后扩展 ,可以轻松地将多本书籍放在口袋里,随时随地消费。
  3. 智能手机在2008年后的生态系统演变中 ,iPhone和Android设备为移动商店提供了购买和下载内容的可能性,而无需单独进行桌面操作。

我第一次介绍这种格式是在90年代后期,但是我从未被迷住过,因为它觉得坐在电脑旁听书可比印刷版受益匪浅。

直到2016年,我才决定再次尝试一下,此后,发生了什么……

开车和走路时聆听的能力解锁了一个庞大的每日“阅读”窗口,这是以前从未有过的。

在此期间,我无法阅读相同数量的印刷书籍。 除了实用性之外,一些解说员的声音和风格也使这些书令人惊奇地栩栩如生,并提供了更愉快的体验。

但是,有声读物确实有弊端,而核心问题在非小说类图书中最为明显。

在这篇文章中,我将分享一些有关如何解决最重要的缺点以及如何升级有声读物体验的想法。

自首款iPhone推出以来,智能手机的操作系统已发生了巨大的发展。 现在,我们拥有先进的框架来构建具有丰富媒体功能的应用程序,这些应用程序具有诸如增强现实这样的功能,几年前还很难想象。

但是,有声读物的格式与90年代完全相同。 普通的音频记录分成带有数字标记的章节。

最近,Audible开始添加实际的章节名称,从而解决了我的主要投诉之一。 现在,至少可以在本书中进行高级导航。

音频格式的不足之处随着内容丰富的数字数据,图表,草图或任何视觉表示而变得明显。 而且,问卷和任何需要输入的内容都不适合。

目前,通过提供包含额外材料的随附PDF文件解决了该问题。 该方法的缺点是:

  1. 需要其他设备才能下载文件。
  2. 内容周围的上下文丢失了。 您在收听时无法查看图表,并且一旦可以访问可视文件,就没有简单的方法可以导航回相关的音频部分。

过去曾尝试通过以音频,视频和交互式3D动画丰富大部分文本内容来构建eBooks 2.0。 像Inkling这样的公司从学术教科书开始,并围绕iPad设计其解决方案。 格式从未起飞。 他们不得不将其模型更改为企业内部培训手册的B2B软件平台。

“有声读物是新的电子书,除非它们可能会不断增长”

Boris Kachka的这篇文章总结了数字出版领域的历史和当前趋势,其中有声读物是增长最快的部分。

如果更有吸引力的格式要走相反的方向怎么办?

从主要是音频内容开始,并在相关部分中增加视觉效果和交互性。

让我们看一下Audible App的示例。

大部分展示广告资源尚未开发,仅显示该书的静态封面。

通过在与数字表,图表或其他视觉表示相关的部分中变得活跃起来,该区域将变得更加有用。

此外,非小说类标题通常包含Web链接。 手动为音频片段添加书签,返回,再次收听并记下地址很麻烦。 此外,长URL字符串不适合写下来。

以下是3种增强功能,它们可以极大地增强当前的有声读物体验。

1.活动链接

提及链接时,值得在App中央空间中显示同步通知,并提供以下各种操作供您选择:

  • 在浏览器中打开链接。
  • 添加到书签或收藏夹阅读器。
  • 对于媒体URL,请直接播放或单独打开。
  • 如果是对另一本书的引用,请在封面上显示一个选项,以添加到Audible / Amazon愿望清单。
  • 对于Podcast,建议将剧集/节目添加到默认/收藏夹客户端。
  • 即使提到别人,也可以显示带有Wikipedia或个人页面链接的书面姓名和照片。
  • 各种书籍在每章末尾都有一个摘要部分。 为什么不在应用程序中提供这些部分的实际文本? 回顾项目符号要点有时更容易以文本形式记住。

2.替代导航

当前,仅章节级别的导航可用。 浏览的另一种有用方法可能是来自视觉资产。

从图表,表格,照片或链接列表开始然后能够收听相关音频片段的选项非常方便,尤其是在完成本书之后。 这是一种查看感兴趣的部分或无法看屏幕时播放的音频部分的实用方法。

另一个方便的功能是“ The Lost Art of the Index”。 如文章所述,即使是电子书也很少有索引。 论点是,使用数字格式可以进行搜索。

只要确切知道要寻​​找什么,搜索就会很棒。

…依赖搜索而不是索引的另一个问题是您失去了同义词和相关术语的好处。 索引器将所有这些考虑在内,因此与简单的文本搜索相比,您更有可能通过良好的索引找到要查找的所有内容。 —乔·威克特

有声读物没有索引,也没有搜索功能。

录制音频的文本已经可用。 无需使用语音识别来使内容可搜索。 这是同步/映射两个源的问题。

如果做对的话,添加高级搜索将是巨大的:

…当您在电子书中搜索短语时,结果将按时间顺序显示。 您会看到从本书开始到结尾的所有事件。 想象一下Google是否采用这种方式。 因此,当您输入一个短语时,Google会告诉您第一个(最旧的)网站使用该短语,然后是使用该短语的下一个最旧的网站,依此类推。用户会大笑并拒绝它,但这正是我们被迫接受的内容。电子书搜索。

我真正想要的是基于相关性的结果。 请向我显示该词组中密度最高的位置,并在标题中优先出现该词组,而不要放在正文中。 我确定还有其他一些属性可以整合到有效的电子书搜索算法中,但对于入门者来说,我只需要采用这两个功能……— Joe Wikert

最后,为什么只将搜索限制在当前书中?

在数字格式中,书不必孤岛。

对于小说标题,跨多本书运行查询没有任何意义。 但是,当涉及到业务,参考指南和操作方法内容时,在个人图书馆中进行跨书搜索将非常有价值。

多本书涵盖了相似的主题,并且知识现在被隔离在各个书名中。 通过显示来自多个来源的见解,类似于Joe Wikert所建议的高级搜索排名将更加有效。

最后,我希望看到一个基于主题的播放列表动态创建者。 该功能可以利用跨书搜索功能。 当然,使用当前可用的NLP技术进行构建更具挑战性。 它需要从每本书中找出涵盖给定主题的部分的长度,然后找出最相关的部分进行组合。 另一个困难是,在某些情况下,内容从其原始书籍的上下文中取出时可能会失去其含义。 尽管如此,构建一个可以逐步发展的基本版本还是值得的。

3.语音笔记

电子书已经支持笔记记录和文本突出显示。 这些功能仍然缺少音频格式。

理想情况下,笔记应存储为语音备忘录,然后进行后处理成文本格式以进行搜索。 实时语音识别已得到显着改善,并且在许多情况下都可以正常工作。 然而,在存在背景噪声的情况下,质量会迅速下降。 例如,在汽车中,短命令确实有效,但是更长的命令格式几乎不可用。

转录后的语音可以稍后用作替代导航,以深入探讨本书的相关部分。

此外,当通过诸如Amazon Echo之类的家庭扬声器收听时,语音便笺将是记录个人见解的最自然的方法。

小说书的情况。

到目前为止,大多数建议的增强功能均与小说类型无关。

确实,在小说中增加视觉效果将开始进入电影制作领域。

但是,有一种丰富的内容可以使小说标题更具吸引力和娱乐性。 这是关于添加带有音乐和声音效果的配乐。

下面来自GraphicAudio的示例给出了结果的想法。

图形音频
GraphicAudio“您的电影” –完整的戏剧化有声读物娱乐 www.graphicaudiointernational.net

声音效果的存在和音量可以在设置中进行调整以适合个人喜好。