我们的中等统计

统计数据需要分析

Chris Liverani在Unsplash上​​拍摄的照片

中型读者统计为应用探索性数据分析工具提供了绝佳的机会。 有没有模式? 读者最喜欢哪些标签? 哪些故事很受欢迎? 故事的半衰期是什么? 因此,您需要了解统计信息!

重新发明东西是愚蠢的,浪费时间!

乔恩·卡塔赫纳(Jon Cartagena)在Unsplash上​​的照片

首先要记住的是发明东西,记住轮子已经按照设计进行了开发, 第一步研究该领域以前的任何工作。

人们不太可能会撰写有关“中等统计量”主题的科学论文。 鉴于普遍使用“中”一词,对“科学论文”的搜索将获得许多成功。 使用“读者人数统计”,Google学术搜索上有190,000篇文章,而这只是个入门。 科学论文可能有点枯燥,并且可能不会激发我们进行创新和创造东西。

接下来 ,使用Duckduckgo搜索引擎进行的“中等统计分析”搜索将返回许多索引网页。 通常,搜索结果与统计分析有关。 “中”一词只是一个非常普通的词。

最后是Blog,特别是对数据科学的出版物,发表在Medium上,并发表了出色的文章。 确实,威尔·柯尔森(Will Koehrsen)已就该主题撰写过文章。 经过一番列表搜索后,我们获得了强大的领先优势,一篇精彩的文章以及一个工作代码的Git存储库,以探索我们的统计信息。

http://piggymakesbank.com/wp-content/uploads/2016/05/templates-do-work.jpg

模板可以很好地工作,但是只要确保模板是用于圆形插头即可匹配圆孔! 做出明智的选择。

入门

使用Git存储库的第一步是分叉存储库并创建一个新分支。 然后发出咒语

git clone https://github.com/mlexperience/Data-Analysis.git

现在,您已拥有原始作者作品的工作副本,您可以通过找出更新,然后向作者打开“拉”请求来进行贡献。 重用他人的作品时,只要每个人都知道谁做了这项工作以及为什么要重复使用它,那就很好了。 因此,威尔·柯尔森(Will Koehrsen)做了这项工作,我们将把它重新应用到我们自己的出版物中。

Etienne Girardet在Unsplash上​​的照片

有了坚实的基础,我们就能充满信心地前进。

与原始设计整合

我们的方法是与原始设计集成,以使其在我们的替代数据上正常运行。 接下来评估输出并考虑我们的目标调整。

Jupyter笔记本—运行原始代码和一些统计信息

在经历了依赖地狱并四处游荡之后,原始代码和我们的统计信息现在正在集成,并且一切运行正常。

分析

Markus Spiske在Unsplash上​​拍摄的照片

在“依赖地狱”之后,最好还是休息一下。 清除头部,然后返回仔细阅读图表和统计信息。

现在来看一些漂亮的图

展望1.5年,我们预计将读取108,805次

到明年这个时间(2020年3月21日),我们的出版物将有13,178分钟的阅读时间

这就是为什么需要分析统计数据的原因 在Medium上写作非常有趣并且具有很大的潜力。

DAVIDSONLUNA在Unsplash上​​的照片

为了实现梦想,我们需要工人! 为什么不写mlexperience? 联系我们