发布者在Facebook上发布的内容

我从Facebook上带走了32个发布者,这些发布者代表了各个行业中最受欢迎的发布者页面,并分析了自2015年初以来他们的所有帖子。即742,490个帖子。 这是我的发现。 平均而言,发布商在2017年每月发布的帖子数量是2015年初的两倍。 实时视频的使用增长了四倍 。 供稿视频占总帖子的百分比从2015年1月的4%增加到2017年3月的21%: 在上图中,您几乎看不到任何帖子都是状态(纯文本)。 自2015年初以来,每月发布的照片​​数量已减少了55%。 尽管视频不断增长,但链接仍然是大多数帖子,Facebook上发布者帖子的75%链接到第三方页面(例如BBC通过Facebook共享到bbc.com的链接): 发布者于2017年4月发布的帖子 旁注:“视频”仅包含动态视频。 发布商通常会在自己的网页上共享视频,这将是归类为“链接”的帖子。 尽管发布者希望共享指向其自己页面的链接,但是在进行Feed互动时,链接的效果却很差。 平均而言,视频的份额比链接多16倍,图像的份额比链接多6.7倍 : 但这并不是说链接在非Facebook参与类别(例如页面浏览量或广告收入)中的效果不佳。 当我们从此数据中删除异常值时(即少数帖子大量传播而大量传播),供稿视频与其他帖子类型的共享和评论数量将减少到与图片相同的水平。 这表明视频比图像或链接更有可能“非常”具有病毒性。…

使大数据更具人性化

我真的很喜欢Cathy O’Neil的数学毁灭武器。 它需要看似非常抽象的东西-大数据-并使它与个人相关。 这让我开始思考讲故事对我们的理解乃至最终对技术更具破坏性的影响的重要性。 但是,要想讲述当今我们正在经历的由数据驱动的技术和社会变革等广泛领域的故事,还需要许多不同类型的讲故事的人。 技术破坏以多层次和非线性的方式影响着社会结构。 这使得很难将点连接起来并加以理解。 并非总是很明显的是,同一技术如何同时在一个领域内推动收益,在另一个领域内带来负面结果,或者在一个领域内发挥着全面的作用。 因此,例如,很难评估Airbnb是否像批评家所说的那样,对当地住房存量的负面影响是否很大。 同上,关于其不具有竞争优势的酒店和住宿加早餐旅馆的不公平优势的论点,因为它们必须支付Airbnb不需要的税(即使这是同一业务)。 而且,即使这些批评有一定的道理,但正如Airbnb所言,它是否超过了游客在当地企业和与作为房东的私人居民之间花钱的收益? 这些复杂的关系使我们很难完全理解我们正在处理的内容或如何公平地管理事情。 而这反过来又引发了人们对数据和技术及其背后的事物的复杂,矛盾的感觉-优步,有人吗? 如果没有以创新或有用的方式来处理和传达这种焦虑的框架,就有可能演变成愤怒或腐蚀性,愤世嫉俗的无助感。 技术变革的步伐比以往任何时候都要大,但是它可能造成的大规模破坏并不是全新的。 我们可以从人们如何适应和管理工业革命的影响中吸取教训。 而且更有意义的是(无论如何,对本博客文章而言),我们可以学习讲故事和讲故事的人如何帮助实现这一点。 讲故事的人试图吸引人们的情感以及他们的智力,并覆盖了广泛的人们。…

定性可视化:图表选择和设计过程

定性可视化:图表选择和设计过程 为了将数据用于学习和适应,数据本身需要易于访问。 评估人员和研究人员一直渴望获得有关如何有效呈现定性数据的资源,因此去年Evergreen Data推出了定性报告系列。 并且,我们最近发布了更新的定性图表选择器。 在这篇文章中,我将解释如何使用此工具并分享如何使用该工具的示例。 我们构建了该工具,使其与定性数据使用的所有级别都相关。 无论您是仅收集定性数据作为定量调查附带的开放性问题,还是正在进行全面的定性研究,此讲义都有望为您提供一些新的可视化想法。 在表格的顶部,您可以选择量化视觉数据中的定性数据。 在某些情况下,量化可以将大量定性发现分解为简单而有效的视觉效果,例如热图。 另一方面,当您量化数据时,您可能会失去上下文和定性数据的个人性质。 接下来,在图表选择器中,将其按想要包含在视觉中的内容进行分解,只需突出显示一个单词/短语或进行更高级别的分析即可。 在选择器的左侧,您可以看到另一个细分,具体取决于数据的性质。 例如它是否代表流程,比较,层次结构等。最后,建议将所有图表和视觉效果(以及可爱的小插图)作为选项。 您知道您的受众,数据和故事,因此可以使用此图表选择器来选择最适合您环境的视觉效果。 让我们将此图表选择器使用! 假设您正在与您所在地区的无家可归者服务社区合作。 使用混合方法,您已收集了有关无家可归者系统的数据,包括社区中可用服务的起因和连续性。…

介绍BookEngine

在过去的5年中,Mint与许多图书发行商合作,我们发现类似的问题反复出现。 为了解决这些问题,我们创建了一个名为BookEngine的软件。 我们看到什么问题? 典型的问题包括: 1.市场营销超越了元数据管理 出版商通常有一个主要站点,几个出版社站点以及许多作者或主题站点。 出版商总是有很多书。 当然,它们只有有限的时间。 尽管出版商的旗舰站点可能会从书名管理软件(通常为ONIX格式)中自动获取书籍,但市场营销部门却剥离了一些站点,这些站点都需要手动输入数据来维护目录。 这些烙印,作者和主题网站从理论上讲是不错的,但需要大量重复工作才能使书籍信息保持最新。 通常,网络流量使这种情况变得更加困难:我们已经看到发布者必须为一个网站两次更新相同的信息—一次是为目录更新一次,一次是为购物车更新相同信息。 鉴于这种麻烦,通常的反应是统治营销团队或阻挠印记。 这两种途径都无法赢得更多读者,也无法吸引更多作者加入您的品牌。 2.进行电子商务还是不进行电子商务 尽管几乎所有发行商都依靠转售商来获得大部分销售,但在合适的社区内,直接销售通常是有意义的。 在提供一致的搜索和标题管理的同时,使您的内容管理系统和电子商务解决方案协同工作并非易事。 3.烙印想要自由创作 烙印喜欢他们独特的共鸣,并希望培养他们的独特性。…

兔子更多

《经济学人》最近发表了一篇不错的文章和图表,详细介绍了每个国家在联合国演讲的平均讲话时长。 在本文中,我们对分析进行了一些调整,以查看一个基本变量GDP。 《经济学人》杂志客气地让我们访问了他们的源数据,然后我们继续使用GDP数据进行补充,然后将其汇总为口语参与次数,而不是原始文章中使用的平均语音时长。 数据集从2010年扩展到2015年。我们没有采用这些年的平均GDP,而是采用了一种更简单的方法,并获得了每个国家的2013年GDP(以2016年美元为单位)。 最终数据集可在此处以csv的形式获得。 DataSplash在散点图中显示这些数据,并立即显示智能结果。 我们在“ DataSplash关联”选项卡上看到正相关但无关紧要的关联。 但是,通过对散点图的目视检查,我们发现在GDP方面有两个大的异常值似乎在影响趋势线,分别是美国和中国。 左侧的数据变得混乱,但是我们仍然可以通过将鼠标悬停在该点上来识别每个国家。 在DataSplash中,我们可以轻松删除这两个离群值。 只需右键单击与要删除的数据点关联的点。 除去这些离群值之后,我们看到了新的关系,它既重要又重要。 旧的关系用虚线显示,新的回归线用实线显示。 在对数据进行简短的探索之后,分析师通常会尝试进行因果关系的解释。 也许较贫穷的国家没有被赋予向富裕国家大喊大叫的权利,或者也许较富裕的国家已经获得了极大的智慧,因此它们花费更长的时间进行交流。 显然,对于法国人,我们也有文化上的解释。 随意研究其他模式。…