粉丝小说社区探索

介绍

在华盛顿大学,我正在一个研究小组中工作,该小组使用数据科学技术来探索同人小说社区中的非正式学习。 为了进行分析,我使用了该研究小组以往参与者收集的数据。 具体来说,我探索了Who Doctor迷小说,因为它是准确的样本并且相对易于管理。

方法

在这个博客中,我探讨了故事的受欢迎程度和新章节的发布时间如何影响收到的评论的总数。 x轴表示评论日期,而y轴表示评论的累计总和。 情节上的每个点都是收到的评论。 红色圆圈表示新章节的发布。

我探索的Doctor Who数据集包含53,621个故事。 我创建了三个类别来区分故事的受欢迎程度-前5个百分位,其次是20个百分位,而长尾则是75个百分位。 在前5个百分位中,我抽样了以下三个故事:亲爱的Whovian作者(5,432条点评),《风雨如磐》(792条评论)和《我们最爱的时间》(549条评论)。

尊敬的Whovian作者(5,432条点评)
风化风暴(792条点评)
我们最爱的时光(549条点评)

在接下来的20%百分位数中,我抽样了以下三个故事:原型(250条评论),与医生的不幸经历(109条评论)和《五倍音速起子没用》(45条评论)。

原型(250评论)
与医生一起经历的不幸经历(109条点评)
声波螺丝起子没用了五倍(45条点评)

在最低的75%百分位数中,我抽样了以下三个故事:做人(29条点评),百年纪念(10条评论)和“让日子更快”,请? (5条评论)。

人性化(29篇评价)
百年纪念(10篇评论)
让一天变得更快,好吗? (5评论)

发现

  • 发行章节时,评论的数量会增加,因为新内容会吸引读者。
  • 故事发表一年后,评论数量趋于稳定。
  • 故事出版后,热门故事会吸引读者。 这可能是由于1)作者警报或故事警报,2)作者提供了吸引读者的先机或3)故事易于访问的缘故。

此外,我试图通过计算相关系数来确定评论数量与数据集中各种指标之间的关系。 相关系数是计算关系强度的统计量度。 相关性为0.0表示变量之间没有零相关或无相关性,而相关性为1.0则显示出完美的正相关性。 如下图所示,收藏夹与评论数的相关性最高。 这是因为读者密切跟踪更新,从而导致评论增加。 但是,章节数并不能保证获得更高的评价。 例如,原型有250条评论,但只有6章。

局限性和未来工作

为了进行此分析,我将对新章节的第一次评论用作该章节的发布日期。 将来,我想研究子社区的结构如何影响同构小说网络中的评论。 另外,我想为作者提供一个指南,以增加关注者和收藏夹,并因此增加评论数。