我敢说你永远不会再使用tf-idf
朱莉娅·席尔格(Julia Silge)是天体物理学家,R大师和美丽图表的制造者,她是一位数据科学家,从任何角度来看,它们似乎都是舒适快乐的猫,他们团结了存在的最美好的祝福。 并且生活在这个世界上几乎没有什么让她烦恼或烦恼的。 我向你保证,亲爱的读者,让这样的灵魂烦恼不会令人感到高兴。 但是,我怀疑TF-IDF先生向她(和她,他!)展示的所有款待和友善对可怜的茱莉亚有危险。 如果她不注意的话,我担心她可能会被要求永远沉下去。 因为尽管她认为TF-IDF先生的陪伴非常愉快,但我确信这场比赛很少推荐。 乌夫,好吧,这很累。 我回到自己的声音,而不是尝试简·奥斯丁的。 你好 这篇文章对从事文本分析的人们可能有用,也许对于简·奥斯丁的粉丝们来说很有趣,他们想知道哪本小说是简·奥斯丁在她最接近奥斯丁的那一本书,以及她的先驱者/同时代人与她的风格最相似。 老实说,整个文章的主要对象是:茱莉亚·席尔格(Julia Silge),我很欣赏他的作品。她和戴维·罗宾逊(David Robinson)最近在一本有关文本挖掘的书中放了许多有用的R代码和解释。 这篇文章基本上是我和我交换的一些推文的后续。 如果您喜欢这里和/或Julia和David的书中的内容,您可能还想使用我在食物评论中探索的方法来检查Jason Kessler的github和Dan Jurafsky等人的东西。…