阅读与评分

每两个月,我会与同一群人聚在一起。 我们开会已有16年了,大多数都是15个人。 在那个时候,我们已经成为密友。 在工作,业务和职业的开始和结束之间,我们一直在一起。 我们分享了我们的孩子的毕业典礼和一些孙子的出生。 我们通过受伤,手术,沮丧和家庭死亡相互支持。 我爱这些家伙。

对于读书俱乐部来说还不错。 尤其是全联盟的读书俱乐部。

我们称自己为波波族,以大卫·布鲁克斯(David Brooks)的“天堂的波波族”为名,用舌头轻轻按了一下脸颊。这本书的书名描述了波西米亚资产阶级的生活,很多年前,经过了几分钟的沉思,他们对合理的品行进行了沉思,但是价格合理的西拉子或本地的精酿啤酒(可能是双重IPA),我们认为此描述合适。

波波族。 不管Phil现在卖什么,似乎都没有人买。

我们每天通过电子邮件列表交流有关的话题,这些话题涉及的内容远远超出了我们正在阅读的书籍,有时是体育活动,但频率却比您想象的要少。 电影,尤其是关于如何投射刚刚读过的书的讨论; 政治方面,我们讨论得最好和最坏的都是关于政治的; 遥不可及的美好,令人回味的回忆或生活或错过时刻的倒影。 我们谈论和开玩笑谈论许多主题,但我们对阅读的书很认真。 可能太严重了。

会议规则:首先吃食物。 然后,这本书。 然后,生活。

The Bobos与其他读书俱乐部的区别之一是我们保持得分。 也许这是个家伙,但我们不仅仅满足于讨论主题,情节,角色发展和文学功绩。 我们对选择权进行评分并保留统计信息。 我们将分数存储在Google表格中,并带有离线备份,以防俄罗斯人试图歪曲结果。

Google表格中的一些最新读物

很长一段时间以来,我一直认为挖掘其中一些数据会很有趣。 最近,我想通过UC Berkeley和edX开设数据科学课程,因为我想增强我的数据科学技能,为与AI合作打下基础,并获得我的初级数据科学家徽章。

我一直在学习使用Python处理数据并制作相当难看的图表。 我也一直在学习,编码主要是无休止地搜索缺少的逗号,括号和引号。 要想熟练掌握数据科学用Python,我需要的练习比课程实验室提供的还要多,所以我想:“为什么不在Bobos书评中使用我的新生技能? 也许我会发现挑选一本完美的Bobos书的秘诀。”


从顶部开始

我要做的第一件事是将Bobos评分表中的数据重新排列到表中。 该表包含了多年来每个Bobo的所有评分,因此其中包含大量数据。 我决定将其缩小,仅查看排名前10的书籍及其平均评分。

我们的十大精选书

那些看起来对我正确。 而且,我有前十名精选之一。 嗯,布希(Busch)的得分为2,而“耻辱”(99.5)的评价可能永远不会超过他。 我决定看底部10。

我们还读了一些臭鼬

好吧,废话 猜猜谁在名单上是绝对评分最低的书。 至少布希(Busch)接近了,从“耻辱”(Disgrace)中拉低了他的平均值,而伦格伦(Lundgren)则排在倒数10 中的两名来吧,还不错! 比“艾琳”还差吗?


我们午夜的孩子在学习吗?

有时我想知道,多年来我们在选书方面是否有所进步。 我决定创建一些图表以查看是否可以发现改进。

这些年来,我们的拣选技能没有太大改善

不。 几乎没有。

左边的条形图似乎没有显示任何明显的改善模式,右边的散点图显示随着时间的推移仅有轻微的改善趋势,但是十六年来的两点值得一提。 看来,波波族是学习缓慢的人。

现在,我承认,有时候我选择的是我想要波波族阅读的书,而不是我认为波波族想要的书。 我们都是直率的白人,出生在几十年内,住在中西部。 一点点的扩展不会有什么坏处。 也许其他人也做同样的事情。 也许他们会选择想要阅读的书或希望我们阅读的书,而不是思考他们认为我们会喜欢的书。 也许还有另一种解释说明我们无法从失败中学习。

永不放弃

也许是因为我们不坚持艰苦的工作。 通过查看我们的Google电子表格,我注意到的一件事是,阅读这本书的Bobos人数与该书的等级之间似乎存在相关性。 这本书越好,我们完成本书的人就越多。 当这本书不好的时候,我们放下它。 我决定查看数据以查看这种直觉是否成立。

这是评分和Bobos阅读次数的散点图。

相当强的相关性

读者数量与本书的等级之间似乎有很强的相关性,但我也知道这里的数据有些偏斜,因为我们的人数在早期就较小。 因此,当我们添加了最后一个成员时,我从书#51开始再次运行它。

对。 这是相关的。

这里看起来很清楚,但是只有两个读者有一个异常值。 我挖掘了数据,发现那个臭名昭著的是萨尔曼·拉什迪(Salman Rushdie)的“午夜之子”,我们早些时候在“倒数10名”列表中看到过。 我想知道它是否扭曲了结果,所以我将其取出并重新运行了图表。

仍然很明显的相关性

结果? 波波族是戒烟者。

我也很想知道我们的选股分布以及我们的评级是否形成了某种钟形曲线。

它们确实存在一些差距。 我从这张图表中得出的结论是,任何低于50的指标都是Bobos不会推荐的失败者,而高于80的指标则是一个了不起的指标。 因此,考虑到这一点,我再次运行了列表,并可以展示扩展的“最佳和最差的波波”:

波波族的最好

如果您不喜欢这些,就不能成为Bobo

耻辱的架子

将生活在臭名昭著的精选

废话 我有两个失败者 ? 布什也是如此。 隆格伦有三个! 我知道“在一个奇怪的房间”是个错误。 布克奖入围名单是一个诅咒。 另外,丹尼斯总是讨厌那些讨厌的主角。


真正重要的是

但是,当然,所有这些只是最终分析的序幕。 我们真正关心的是:谁赢了 ? 谁是最好的Bobo拾书器?

数据显示:

叹。 “鲜为人知的事实”正在杀死我。

女士们,先生们,我们这里面有个最好的Bobos拾书器是我们的创始成员之一David Earls。 伯爵!? 他如何跻身榜首? 花所有时间为鸟类拍照! 和霍华德? 那个新手? 我什至不应该包括他。 他从书51开始就来过这里! 至少我不是库恩斯。 虽然,他的妻子做的甜点确实很棒,但偶尔带些无麸质的食物会杀死他吗?


数据科学可能无法帮助我提高选书员的地位,但是我想做更多的分析和可视化工作。 当我扩展自己的技能时,我希望能够在Bobos的评级行为中找到相似之处和模式。 或者可能找到一个书籍属性数据库,看看我是否可以创建Bobos想要的书籍预测变量。 尽管我认为“鲜为人知的事实”和“在陌生的房间里”可能会永远降低我的评分,但这也许会帮助我提高分数。


我可能不是最好的选书人,但是波波什曾经参加过“ Being Mark Logan”纪念日