在2019年使用Mittmedia的数据-通过创新创造业务和用户价值小小书 XXshu

Mittmedias数据主管从数据角度展望未来的发展。

2018年的简短回顾，以及未来路线图中的五件事：客户流失预测，内容分类，地理数据，个性化和新的内容API。

对于在Mittmedia处理数据的任何人来说，2018年都是繁忙的时期。在这一年中，我们在所有网站，应用程序和新闻通讯中大规模实施了个性化设置，从而使与产品中与内容发布有关的所有内容都实现了自动化。我们调整并标准化了健壮且高度可扩展的元数据结构，该结构更适合于用户和机器学习模型。在付费内容方面，我们更新了付费专区，并对数据科学有了足够的信心，可以飞跃并将所有内容都声明为“付费内容”，并锁定在付费专区的后面。

通过专门针对Mittmedia记者撰写内容的计划工具，发布策略变得更好。通过添加商品生产套件，我们使内容创建更接近于供需方法，该方法通过评估商品的性能来建立用户参与度。这种统计信息还有助于我们定义KPI：s。

最重要的是，我们还能够使用数据结构将情报构建到第三方工具（例如新闻通讯服务）中。

但是去年最重要的是建立基金会。对于数据团队积压的每一项创新和进步的任务，我们都会进行十项更少的创新任务，以建立更好的结构。我们扩展了管道，重新设计了模型，增加了数据库集群，从头开始构建新的数据导入，设置了错误警报，优化了可访问性，集成了API：以及为组织应如何处理数据而定义的策略。我们甚至有机会使Soldr（我们的数据平台，焊接我们的生态系统）的设置过程专业化，到年底，这使一些外部合作伙伴可以建立自己的平台版本。

Mittmedias的开发人员和机器学习研究员JohannesLindén介绍了大学的自动分类的当前状态。

展望未来，从Mittmedia数据角度来看，这些是2019年的一些重大而有趣的事业。

流失预测

寻找能够吸引忠实客户的价值主张，对任何企业来说都是灵丹妙药。但是，要完全了解是什么导致了获取和流失，我们必须创建一种更通用的用户模型。使用付费内容解决方案，同时进行数据科学和用户体验研究，这些研究着眼于推动用户群发展的因素，这给了我们很多见解。

我们使用Markov Chains绘制了通过收购来绘制客户流入量的图表，对2018年净收益将如何发展做出了一些精确的预测，并且通过应用决策树，我们能够看到用户的活动水平是预测客户流失率的基础。但是，为了缩短反流失开发的上市时间，并更好地克服关注关联而不是因果关系的恐惧，我们需要一种更复杂的体系结构来体现用户在生态系统中的表示方式。集群和目标组的所有物，流失几率和个性化的应用程序设置等所有内容都应直接存在于此用户模型中

分类内容

自动分类（教机器以语义和上下文识别不同类型的内容）将最终实现为内容生产过程的集成部分。对于我们在Mittmedia的公司来说，这已经成为一个深度学习问题，而且已经存在了很长时间。

我们在这个主题上有悠久的历史，既进行了概念验证，例如尝试在内容编写器（Aracua）中进行自动标记，又在Mittmedia办公室或与大学合作进行了纯粹的学术工作。在生产级别解决此难题的最后一个难题是，正在进行的使我们的多分类模型适应新的元数据结构的工作。

通过设置正确的数据点来帮助新闻工作者创建内容，将对新闻编辑室（当然，对于最终用户）来说也是一个很大的补充。但是，该项目最有价值的部分可能来自拥有强大工具（如神经网络）创建新的和非直观类型的内容集群的可能性。基于我们在2019年针对此主题所做的工作，我们可能可以通过经过专门培训的应用程序的眼睛来查看内容档案，这些应用程序经过专门培训以了解Mittmedia正在发布的文章的独特之处，从而找到有关新闻产品的新方法可以提出。

地理资料

可视化的Västmanland地区之一的数据层，与用户活动相关。颜色表示活动水平不同。

Mittmedia的大部分业务模式（付费内容和广告）都基于地理位置。通过按地理区域划分内容和市场，我们能够了解我们的市场渗透率以及对我们生产的内容的需求。从广告的角度来看，地理数据是我们拥有的最重要的数据，并且能够针对本地市场微调广告活动是卖家使用的主要工具，可让我们在竞争者中脱颖而出。

Mittmedia的数字平台由微服务组成，为了进一步增强我们的编辑和广告业务模型之间的协同作用，我们需要构建新的服务，明确地致力于为我们的所有产品提供通用的地理数据层。借助针对地理数据访问的更健壮和可扩展的解决方案，我们可以将新工具应用于旧应用程序，这甚至可以为印刷报纸带来新的市场优势。

个性化

当我在这篇文章的开头总结2018年时，我提到Mittmedia去年在网站和应用程序等公共产品中个性化了新闻源。个性化的下一个阶段将是漫长而敏捷的调整过程。这听起来可能很累，但是这种工作会使我们走上开发更复杂类型的自我优化系统的道路。今天，在Mittmedia上运行的许多机器学习过程都是不受监督的，例如用于个性化服务的地理集群。

但是，未来可能会拥有更多的动态解决方案，例如取消任何预加权的数据点，而采用更具进化性的算法（当系统自动优化功能时，例如不断运行的无监督A / B测试）。

新内容API

媒体格局正在发生变化，而且一直在变化。新闻消费趋势遵循提供内容的总体趋势，仅在最近十年中，智能手机革命彻底改变了该行业。现在的区别在于，我们今天所看到的转变正越来越接近于用户体验信息流的方式。不仅我们看到了新型设备的出现，内容本身也在以新形式出现。

当文本，视频和图像开始被诸如基于对话的服务和为提供虚拟现实而构建的设备之类的产品所取代时，用户体验的革命将接近于神经系统水平，信息获取的体验将有所不同。。从用户的角度来看，通过参与对话或在模拟环境中走动来获取信息是与阅读文本完全不同的过程。

Mittmedia将无法运行并行项目来涵盖可能定义新闻消费未来的所有潜在研究领域。相反，为了避免新的创新项目需要较长的时间，我们的第一步将是在基础级别上重新定义内容分发。传统上，我们的内容API：s主要基于传递按类别和报纸标题等内容过滤的文本内容。 Mittmedia未来的内容分发将需要新的解决方案，从1月开始，我们已经启动了旨在为我们提供这些解决方案的项目。

在2019年期间，我们将构建一个新的API，其端点旨在根据空间搜索（地理）和基于层次结构的文章列表（例如动态创建的版本，如推荐的阅读列表或精选的新闻稿）等内容来提供内容。在许多情况下，我们可能还会发现自己开发的产品实际上根本不会使用文章中的文本内容，而只专注于细粒度的元数据。例如，仅元数据方法可能为针对智能家居扬声器的自然语言解决方案提供了良好的基础。

Mittmedia具有主持和参加黑客马拉松和开发人员聚会的传统。这是2018年Good Tech Hack大会上的Stefan Wallin，Jenny Vesterlund，Michelle Ludovici，Pontus Ekholm和JohannesLidén。

我们的目标不仅是为Mittmedia的开发人员提供更好的工具来构建新的创新产品，而且还向其他人开放也可以在我们的平台上构建产品。 Mittmedia的悠久传统是通过黑客马拉松和大学项目与本地开发人员和企业紧密合作。该项目将使我们有可能更大规模地进行此操作，对于希望构建前沿新闻应用程序的任何人，Mittmedia都是内容提供者的明显选择。

最后的笔记

Mittmedia对未来项目有非常雄心勃勃的计划，但是我们在接管创新数据项目并将其投入生产方面也拥有良好的往绩。当2019年总结时，我们可能会看上面的项目清单，得出的结论不是所有的事情都按计划完成，但是经验告诉我们，如果是这样的话，原因是我们发现可以做些更有意义和有趣的事情。