什么决定有声读物的等级?
Github 2016年,《华尔街日报》写道,有声读物是出版业中增长最快的格式。 为了理解出版行业的这一部分,我分析了英语有声读物,以确定有声读物的总体评价是由配音演员的表演还是由故事决定的。 数据来自2016年抓取的Audible.com网站。 Audible.com是一家技术公司,负责生产,销售和销售有声读物。 Audible的有声读物可以通过其在线平台购买,也可以通过其专有应用流式传输或下载。 Audible成立于1995年,并于2008年被亚马逊以3亿美元的价格收购。Audible的英语语言图书馆拥有超过20万本有声读物。 相对悠久的历史和广泛的目录使Audible成为理解有声读物的良好数据来源。 使用Scrapy Web抓取框架,我从Audible网站上收集了2016年1月可用的所有英语有声读物上的数据。从页面收集的数据如下所示。 从可听书本页面抓取的数据。 框显示哪些数据已记录。 刮板设置为从列出链接有声读物的第一页开始。 每个有声书链接都被跟踪,并且数据被下载并返回到原始页面。 使用递归跟踪到下一页的链接,直到到达最后一页。 使用此过程,生成了约203,000张有声读物的表。 其中,约有42,000本有声读物从未得到审查。 有数百个仅具有总体评价,而没有故事或表演评级的分数。…