关于俄罗斯边界,国会道路,儿童时间,新闻寿命的有趣可视化效果— DataViz Weekly

DataViz Weekly在这里与您会面,这些天我们遇到了一些有趣的可视化。 新选择包括值得一看的基于数据的项目,以及有关以下主题的图表和信息图: 从1462年到2018年的俄罗斯边界; 进入美国国会的职业道路; 是时候生第一个孩子了; 新闻故事的寿命。 数据可视化每周有趣的可视化:2019年1月25日至2019年2月1日 1462–2018年的俄罗斯边界 https://map.runivers.ru/ Runivers是一个致力于俄罗斯文化和历史的数字项目(由Transneft支持),与世界历史研究所(俄罗斯科学院)的历史地理信息实验室以及开源地理空间软件开发商NextGIS合作,创造了一个有趣的该视觉项目展示了俄罗斯边界在1462–2018年的变化。 它本质上是一个交互式地图。 在这里,您可以添加图层(例如,如果您想在显示的时间查看谁统治了俄罗斯),切换到一年或另一年,播放动画等等。 该项目看起来有助于研究俄罗斯的领土历史。 美国国会的职业道路 https://www.nytimes.com/interactive/2019/01/26/opinion/sunday/paths-to-congress.html 《纽约时报》发表了一篇很棒的互动式讲故事,展示了第116届国会众议院每个议员的会前职业生涯。 选择一名代表,并在去美国众议院的路上了解他们早期生活中的主要教育,专业和政治里程碑。…

柯克·伯恩(Kirk Borne)—富有远见的分析家,太空科学家和长期学习者

Max McKinnon在Unsplash上​​拍摄的照片 那是2001年10月,距9-11-2001恐怖袭击发生仅一个月。 电话铃响时,我正坐在美国宇航局办公室。 通话另一端的声音说:“我们希望您明天向总统简要介绍数据挖掘。”我清楚地记得我的回答:“您是说总统吗?” 是的,他们的确是美国总统。 当我问到他们对本次简报的看法如何时,他们说他们意识到他们需要数据挖掘方面的专业知识才能发现并阻止下一次恐怖袭击,因此他们询问了不同的联邦机构,他们都是数据挖掘方面的专家, NASA总部的人们说我是NASA数据挖掘专家! 哇! 我从来没有那样想过自己。 当时,我正在做一些较小的项目,并努力学习有关数据挖掘的知识。 这是怎么变成这样的? 那一刻,我想到了两个重要的启示:(1)我对数据挖掘的一点了解已经被认为是“专家”; (2)数据量和数据分析应用程序的爆炸式增长不仅在科学领域,而且在各个领域的任何地方,包括一些非常重要且具有世界意义的应用程序。 拥有物理学(BS)和天文学(Ph.D.)学位,我一直在进行计算,建模和数据分析。 毕业后我最初的18年工作是在NASA,负责为太空科学任务和计划开发大型数据系统。 随着数据集大小变得越来越大,我开始研究数据挖掘和机器学习作为在大量海量数据集中进行更大探索和发现的工具。 在NASA工作了18年之后,我确定世界将需要一支庞大而庞大的受过训练的数据专家队伍(现在称为数据科学家),以探索和利用这些庞大且不断增长的数字数据集。…

第六周:专注于错误的事情

今天,我们花了整整一天的时间试图找到各种产品的颜色与其销量之间的联系。 最初似乎没有任何特定的联系,所以我们尝试了一些新方法,到午餐时间我们还没有真正的运气,因此我们继续插电,更改模型,删除一些异常值,我很高兴地宣布到今天结束时,我们还没有发现颜色和销量之间有任何联系的进一步证据。 我们所做的只是将我们的愿望和偏见投射到数据上。 我们非常希望我们的先前信念得到确认,以至于我们花费了不必要的时间来追逐一个失败的事业。 正如约翰·梅纳德·凯恩斯(John Maynard Keynes)显然曾经说过的那样。 “当事实改变时,我改变了主意。” 企业使用数据的原因之一是揭示他们以前认为不可能的事情。 作为数据科学家,最糟糕的事情是通过引入自己的偏见来阻碍这一过程。 我们每个人每天都会做出数百个假设。 它们是使我们存活的有用的小捷径。 您正在阅读的事实证明了这一点。 这不是一个关于摆脱所有假设和偏见的博客。 更好的方法,或者至少更容易的方法是,记下它们,写下来,并不时地确保它们不会驱动您的思考。 与其说不是给数据当事人带来自己的偏见,不如说是给数据当事人带来偏见,并确保他们在房间的一角坐在椅子上,以便您随时注意它们。

发布数据科学训练营的想法

Vasily Koloda在Unsplash上​​的照片 我最近在大会上完成了为期12周的密集数据科学训练营。 计划大约3周后,我写了一篇有关如何过渡到数据科学这一新领域的文章,您可以在此处阅读。 完成课程后,这里是我的一些想法。 我所取得的成就超出了我的预期。 我在上面提到的较早的帖子中讨论过,我不是来自技术背景,而回想自己在该课程中的经验,使我为所学到的一切感到自豪。 我能够在12周内完成5个端到端机器学习项目,现在我可以轻松地使用Python和SQL编程,我熟悉机器学习算法以及不同建模技术背后的直觉,并且能够向技术和非技术受众介绍我的发现。 大会(GA)提供了很棒的学习经验! 教室空间有利于学习,便利的设施非常适合在深夜编写代码和项目,本地和全球教员精明且平易近人,结果团队决心在求职过程中以任何方式提供帮助。 我周围都是聪明又渴望的学生,他们互相支持。感到鼓舞的是,同伴们与我并肩应对类似的挑战,这是大多数在线课程所缺乏的! 我觉得我在通用航空获得的知识和技术技能与行业中的实际数据科学家每天使用的内容非常相关。 该课程提供了有关使用Python / SQL代码和构建模型的培训和实践的手法,而不仅仅是讲解它们是什么,它们如何工作,何时使用它们等等。 离开我以前的职位并跳入新领域的风险值得。 我发现我比以前更喜欢编程和分析数据,并且对学到的新技能可以产生的影响使我感到兴奋。 我的经验从我所从事的项目中汲取了见识,从而证明了以正确的方式呈现数据是强大的。…

机器学习的故事(第2章:现实)

这是从Layman,Mathematician和Coding角度解释机器学习的系列文章的第二章。 目标读者是想要了解机器学习理论,背后的数学以及如何使用Python语言实际实现的任何人。 这将通过有关家庭及其互动的故事来解释。 单击第1章:幻觉,以了解有关家庭和该系列的开始。 现实:真正的机器学习是什么 诺克斯家人应邀参加了诺克斯朋友儿子的婚礼。 婚礼非常可爱,有很多花,酒和美丽的蛋糕。 诺克斯家族也与新娘和新郎共舞。 他们坐在餐桌上,诺克斯注意到了Ava的好奇面孔,并问“ Ava,我看到您不是100%在这里,正在想些事情”,Ava回答说:“是,我仍然对Machine背后的现实感到好奇。学习? 从您向我解释机器学习背后的幻想的那一天起,我仍然想知道它的现实。”诺克斯,丽莎和卡特对此大笑,诺克斯说:“好吧,我将解释机器学习的现实 ”。 Layman对什么是机器学习的解释是: Ava通过简单地举例说明您每天使用的洗衣机(例如洗衣机)来了解机器学习的概念。 现在,洗衣机根据衣物类型提供各种设置,即它们是否精致,是床单还是日常衣物。 也可能有水类型的设置,例如硬水等。另外,您可能会在一周的某天洗某些类型的衣服,例如周末可能会洗床单,或者夏季可能比冬天多洗衣服天。 现在,想象一下,而不是您必须手动设置的所有这些设置,而是洗衣机自己通过使用一些传感器来学习所有这些不同的组合或样式,并且下次将衣服放入洗衣机时,它会自动开始洗涤无需任何设置即可提供最佳洗涤性能。 简而言之,…

与Stephanie Evergreen博士一起有效呈现数据的秘密

斯蒂芬妮·艾弗格林(Stephanie Evergreen)博士是一个自称为“死硬数据书呆子”的人。 她在学术界中名列前茅,拥有跨学科评估博士学位,最终成为数据可视化和设计的专业。 Evergreen博士现在是国际公认的演讲者,作家,设计师和研究员。 她周游世界,教客户如何讲出更好的数据故事。 正如她所说,“这是一场非常不错的演出!” 当她在密歇根州白雪皑皑的家中闲逛时,我与她交谈,谈论她的书,精通数据通信的技巧以及她最喜欢的图表(每月更改一次)。 是什么促使您有效地编写“呈现数据”,又是什么促使您现在呢? 我认为这确实是我注意到自己的问题。 我当时正坐在一台装有数据的计算机上,试图将演示文稿整理在一起,而我对它的呈现方式感到无聊和沮丧。 我知道这并不有效,但我不知道还能做些什么。 因此,我开始写博客。 我的博客开始引起人们的广泛关注,因为我当时是唯一谈论此内容的人之一。 出版商在那里看到了足够的兴趣,看到了新的突破,因此他们给了我一本书。 现在激励我的是,当人们给我写电子邮件或发推文时,每天与我联系的读者都说我的写作对他们及其工作方式有所帮助。 我有一个在会议上找我的人想给我最高的五分。 他说,由于他参与了我的工作,因此与所在部门的其他人相比具有新的竞争优势,并且他现在比其他任何人都更能讲故事。 您如何描述有效的数据表示方式?…