成为福尔摩斯小说的艺术:熊猫综合指南
图片来源:视觉资本家 左图清楚地说明了2018年每分钟产生的海量数据。技术巨人(如图)维护您的每项活动的记录(在您同意的情况下),将其存储为原始数据,然后转换这些数据转化为有价值的信息并保持盈利。 但是,谁从原始数据中获得了如此宝贵的见解? 这些公司有机会雇用某种福尔摩斯吗!!! 好吧,可能是的! 因此,让我们学习如何使自己成为Sherlock (至少是一个自信的初学者)并从原始数据中检测隐藏的答案。 审查与安装之间的良好关系 首先,让我们使用对图或correlation heatmap pairplot可用定量特征之间的关系。 您可以从heatmap中观察到,应用程序完成的安装数量与应用程序获得的评论数量之间存在大量的相关性。 另外,如果可以去除异常值,那么我们可能会在pairplot观察到其他特征的良好相关性。 带走—安装与评论之间的差异化CI回归图 这是下面两个数字的代码- #相关图的热图 plt.figure(figsize =(7,5))…