Publisher数据联盟:乌托邦的梦想还是可能性?

数据共享平台的兴起是否会引起备受争议的发布者概念的发布,即他们将数据资源集中起来以进一步对抗双头垄断? Salesforce的Data Studio的最新出现为市场提供了另一个数据共享平台。 这使发布者可以安全地出售其第一方数据并购买第二方数据,即平台合作伙伴的第一方数据。 Data Studio加入了越来越多的类似平台,例如Adobe的Audience Marketplace和MediaMath的Helix。 它们是根据媒体所有者的要求创建的。 许多人将“非现场”第一方数据的出售视为增加收入并增加利润的机会。 所有这些都在一个安全的环境中,可以防止买家未经同意进一步利用它。 但是,使用此功能的价格很高,平台会员资格每年使发布者付出相当大的代价。 从某些方面来看,还有一种观点认为,销售与媒体分离的数据可能会威胁到传统库存销售。 它为客户提供了从出版物中增强其数字支出绩效的机会。 但是,通过创建可信的第二方数据池,发布者和品牌商可以使用它们来补充自己的第一方数据,这些平台在提高市场上可用数据的透明度方面起着关键作用。 从理论上讲,这应该改善定位并因此提供更有效的广告系列,以使广告客户受益。 问题是,出版商是否能从合作伙伴关系中获得足够的利益,以证明会员成本和直接销售数据的潜在利益。 数据共享的出现是朝着正确方向迈出的一步,它为发布商提供了一个额外的工具,帮助他们在与Google和Facebook的对抗中赢得一席之地(尽管很小)。 此外,这些发展使向备受争议的数据联盟的转移更加紧密了。…

谁获得信贷? 调查深入探讨了作者身份的棘手问题

大多数研究人员都认为起草论文和解释结果值得认可-但意见并不总是与作者指南相符。 这个故事最初发表在《 自然》上 。 对成千上万的研究人员进行的一项调查显示,关于哪些研究贡献值得在学术论文上获得作者称赞的观点在各个科学学科之间差异显着-甚至在同一领域内。 超过三分之二的受访者表示,他们将向解释数据或撰写稿件的人授予作者身份。 但是将近一半的人几乎永远不会或只有有时授予获得资金的人以作者身份。 负责这项研究的加拿大蒙特利尔理工大学化学工程师格雷戈里·帕蒂斯(Gregory Patience)说:“同一领域,同一背景的人们可能会有截然相反的意见。” 来自21个科学学科的近6,000名研究人员对此调查做出了回应,该调查询问他们是否认为25项研究任务(例如提出研究思路和对审稿人做出回应)是否值得拥有作者身份。 该研究的作者根据美国国立卫生研究院(NIH)制定的贡献准则来制定任务清单。 研究结果于5月17日发布在预印本服务器bioRxiv上,表明大多数跨学科的科学家都同意,根据NIH指南,应为研究,计划实验和分析数据的人员授予研究著作权。 第三方进行的样品分析和解决技术问题(例如修复复杂仪器中的故障)是最有价值的角色。 大约一半的受访者表示,他们几乎永远不会授予这些稿件的作者资格。 深层细节 调查中的某些任务会分割意见。 大约40%的受访者表示,建立研究团队通常或几乎总是足以获得学分,但几乎相同的比例表示,这只是有时或几乎永远是不够的。 数据表明,与纯科学,应用科学和自然科学领域的研究人员相比,社会科学家倾向于对诸如提议思想或提供实验室空间之类的贡献赋予较少的价值。…

Parse.ly的联合创始人兼首席执行官Sachin Kamdar谈到出版商面临的数据挑战

数据已成为在线发布者的痴迷。 这是2016年数字创新者峰会上关键辩论的主题(单击此处可获取2017年活动的减价门票),并且是在远离大厅就杯咖啡进行的许多非正式讨论中的主要话题。 对于许多发布者来说,一种挥​​之不去的感觉是他们没有充分利用检索到的数据。 有些人担心他们可能无法衡量正确的事情,而另一些人则担心当内容出现在如此众多的第三方网站上时如何收集受众数据。 最终,收集数据也是一回事,但是制定应对方法是另一回事。 这些问题一直是DIS 2017的主要演讲者-Parse.ly的联合创始人兼首席执行官Sachin Kamdar经常想到的问题。 2015年初,该公司重新启动了向发行商提供的服务,以提供一个新平台,该平台可汇总有关增长,参与度和忠诚度的统一受众见解。 从那时起,Parse.ly学会了很多有关在线受众的知识,Sachin在这里分享了有关衡量从视频到社交平台上的内容的一切见解,并讨论了数据应如何促进货币化策略。 您认为未来几年受众分析中的关键创新是什么? 我认为,数字出版领域的两个特定趋势将在未来几年内为受众分析领域的关键创新做出贡献。 分布式内容成为常态:除了在自己的网站上开发受众群体之外,当今的顶级发行商还拥有前所未有的机会,可以通过将其内容分发给Google和Facebook等第三方平台来吸引大量新受众。 这样,一直在跟踪其现场内容性能的数字发布者将希望跟踪其分布式内容的性能。 Parse.ly是能够跟踪Google AMP和Facebook Instant Articles上的分布式内容,并将这些分析与组织的现场数据整合在一起的仅有的分析工具之一。…

2017年OA周:最大化研究价值

研究是昂贵的。 分解它的方法有很多,但仅在美国,每年就花费数十亿美元资助研发。 这些资金大部分是由美国国立卫生研究院(NIH)和美国国家科学基金会(NSF)等联邦机构分配的,这意味着纳税人的钱将直接投入到研究过程中。 这些机构的预算受到来自各种来源的压力,这意味着越来越多的压力要求研究人员以更少的钱做更多的事情。 即使预算没有停滞,研究人员也有义务确保不浪费纳税人的钱。 联邦资助的基础研究的经济投资回报可能数十年来并不明显,过分强调某些成果可能导致昨天发表的文章中讨论的问题。 但是,开放数据不仅意味着允许其他研究人员访问,还意味着使纳税人可以访问他们所付费用的研究。 开放数据还可以实现重用和重组,这意味着单个金融投资实际上可以资助任何数量的项目和发现。 研究非常耗时。 除了提供资金外,研究成本还可以按收集,组织,分析,记录和共享数据所需的小时数来衡量。 当询问研究人员为什么他们不公开数据时,“花费时间”是所引用的主要原因之一。 但是,尽管确保开放数据以使他人能够使用的方式组织和记录文档确实需要时间,但从长远来看,使数据开放实际上可以节省研究人员的时间。 例如,昨天讨​​论的文件抽屉问题的一个后果是,研究人员可能会无意间重做已经完成但尚未发布的工作。 公开数据有助于防止这种重复,从而节省时间和拨款。 但是,开放数据的受益者不仅是其他研究人员-公开数据所涉及的组织和文档也可以帮助研究人员不必重做他们自己的工作。 对于研究人员而言,研究不仅昂贵而且耗时。 涉及人类参与者的研究的主要原则之一是仁慈-最大化可能的收益,同时将可能的风险最小化。 通过负责任地开放数据来提供对数据的访问,增加了研究人员能够使用它进行发现并带来重大收益的机会。…

选择开源机器学习库:TensorFlow,Theano,Torch,scikit-learn,Caffe

从医疗保健和安全性到营销个性化,尽管处于开发的早期阶段,机器学习一直在改变我们使用技术解决业务挑战和日常任务的方式。 这种潜力促使公司开始将机器学习视为一个相关的机遇,而不是遥不可及的美德。 我们已经讨论过将机器学习作为您的ML项目的服务工具。 但是,现在让我们看一下免费的开源软件,该软件可以使每个人都参加机器学习培训,而无需花费时间和资源来支持基础架构。 术语“ 开源软件”是指带有可通过Internet免费获得的源代码的工具。 专有(封闭源)软件代码是私有的,并通过许可的权利进行分发。 对于刚刚开始执行ML计划的企业,在决定使用Microsoft Azure或Amazon Machine Learning之类的企业级工具之前,使用开源工具可以是一种免费实践数据科学的好方法。 使用开源工具的好处不仅仅在于可用性。 通常,此类项目拥有大量的数据工程师和数据科学家,他们渴望共享数据集和预先训练的模型。 例如,您可以使用对ImageNet数据进行训练的分类模型,也可以使用此数据集构建自己的模型,而不是从头开始构建图像识别。 开源ML工具还可以让您利用转移学习 , 意思是应用从相关或什至遥远的领域解决问题后获得的知识来解决机器学习问题。 因此,您可以将一些能力从已经学会识别汽车的模型转移到旨在识别卡车的模型。…

讲故事的秘诀-数据可视化

故事很重要,带有数据的故事功能强大,带有故事的数据更美味 ♥好吧,我梦想成为一名小提琴手,但进入传播学院学习新闻专业的大学,并最终获得了数学系的统计学位(信任我重新组织(黑客入侵)您的大学是值得探索的东西)。 回顾过去,新闻培训是我最有价值的旅程之一,在这里我可以学到一些有关人,人类,观察,提出问题以及讲好故事(特别是技术讲故事)的知识。 为什么数据可视化可以更好地讲故事? 人类天生就是视觉感知的解释信息 这不仅仅是一个故事-我们无法解决看不见的问题 可视化只是澄清大量信息的有力武器 如果我们看看数据如何像空气和水一样与我们一起生活,这份清单将永远存在。 几年前,可视化可能是一种很好的技能,可以用来理解我们所面临的大量信息。 今天,数据已成为许多领域的主要力量。 没有另一层的抽象,我们可能无法理解一些困惑的问题。 简单而困难, 还有更深的道理。 有更深的道理 一本名为《知识幻觉 》的书对我学习和进行数据可视化的思考方式产生了巨大影响。 “我们的智慧不在于个人的大脑,而在于集体的思想。 要发挥作用,个人不仅依赖于存储在我们头骨中的知识,还依赖于存储在其他位置(在我们的身体,环境中,尤其是在其他人中)的知识。…