是中国古代的诅咒。 事实证明,它的词源根本不是中国人,但是出于这篇中篇文章的目的,让我们假装它是汉语。 我不记得我父亲第一次提起这个诅咒。 在我二十七岁的时候,爸爸和我经历了很多有趣的时期。 七届奥运会。 TSA,Pokemon和iPhone的发明。 互联网的出现。 动词“ Google”。萨克斯管总裁,石油商总裁和医疗保健总裁。
是什么使时代变得有趣? 这是一个有趣的问题,而且同样重要的是,这是我今晚一直在问自己的另一个问题的答案:“我能浪费些时间而不是打扫公寓吗?”
Google Ngram Viewer非常酷。 Google是世界上最大的信息仲裁者,可让您访问特定年份出版的图书中出现的频率词。 几个月前,我发现了这个工具,在看到“ Eric”一词多年来相对一致之后,我关闭了窗口,再也没有想到它。 如果Ngram查看器出现问题(我不是指Google),那就是您需要知道要查找的内容。 您可以将Eric与Alex进行比较,但是当前的设置方式使您无法提出这样的问题:“ 1800年最受欢迎的名字是什么?”
我敢肯定,您现在想知道的是“假中国诅咒和学术性的Google项目……往哪里去?”好吧,我告诉您。 在我看来,表示“有趣时间”的一种(可能不正确的)方法是测量单词流行度快速变化的频率。 如果我们的思考和交谈方式从一年到下一年发生变化,那么我认为这是有原因的。 我决定用这种思路运行,而不是用我的浴室水槽上的Clorox湿巾擦掉。
自开始以来,Google便提供了数以百万计的单词(以及发布的拼写错误)的原始数据。 我懒惰,计算机太慢,无法处理一万亿行(不夸张),加上吃我的作业的狗,使我找到了最常用的一万个英语单词。 从那里,我写了一个刮板,在Ngram网站上搜索这一万个单词。 按这万个单词中的每个单词的频率排列,这意味着我可以将它们彼此进行比较,并看到单词首次出现,单词获得流行以及单词死亡。 在很多单词诞生而很多单词濒临死亡的时候……这是有趣的时期。
如果您还不够讨厌,请继续阅读。 每隔十年,我都会按受欢迎程度对单词进行排名(有趣的事实是,下次您要在酒吧给某人留下深刻印象时,“ the”一直是自1700年以来最受欢迎的单词)。 在这一点上,我可以说“亚历克斯”比“埃里克”更受欢迎,而“约翰”比2000-2010年的任何一个都更受欢迎。 我发明了一个度量“ 单词流失 ”,即和(abs(rating(n-1)-rating(n)))。 单词流失率衡量的是列表中每个单词从十年到下十年的上下移动幅度。 如果“ a”从第六个最流行的单词到第八个最流行的单词,它将为该数字贡献“ 2”。
我决定计算每十年最流行的350个单词的流失率。 为什么是350? 不要问 我进入这篇文章的时候是有议程的,我可能还会写另一篇关于议程和偏见如何弄乱第一次的中型博客文章,但这是另外一次了。 您可以使用参数并在此处查看结果。

结果说明一切。 显示屏上的年份是十年的第一年。 在南北战争,世纪之交,第二次世界大战和70年代之后,单词流失率飙升。 自南北战争以来,最近的酒吧(我的数据仅记录到2008年)的单词搅动次数超过任何其他十年。 有趣的时代。
我不擅长介绍。 我的朋友知道我在高中开始和大学开始时就是个鬼。 与其发布我关于所有变化,疑惑和兴奋的第一篇文章,我觉得我在2016年已经二十七岁了,这似乎是一个更好的起点。 我将继续在此处发布信息,但不确定如何。 像这样的更多文化/数据帖子? 当然。 一个简短的故事还是两个? 如果我有勇气。 人造Clickhole文章? 大概。 不连贯的咆哮? 我希望不会,但我不能保证。 我喜欢写作。 世界上有很多事情。 我的世界上发生了很多事。 感谢您参与其中。
埃里克
PS,我应该上床睡觉了,但是接下来我还会进行一些可视化处理,并下载我整理的原始数据,以防其他人想玩这个。