成为数据科学家的旅程

#DAY4 我曾经认为,成为数据科学家意味着处理数据并借助算法来解决问题。 我记得当我第一次想到数据科学家并从大多数地方/网站上读到它时,我才知道我需要学习R或Python,机器学习,数据挖掘,统计分析和一些分析等语言。 SAS之类的工具。 因此,我决定先学习语言,然后再学习其他语言。 但是如今,事情开始变得有意义了。首先,我被教会了整个管理方面的知识,现在我正进入Excel。 我从来不知道Excel会很快提高我的工作速度。 Excel在我的工作中表现出色。 快捷键,match(),lookup()等公式,数据透视表/图表,过滤器等等,excel中的许多功能对于准备好的仪表板非常有益。 尽管数据科学家知道许多算法,语言和分析工具,但最终他/她将不得不向客户展示,而客户不应该知道那些算法或任何东西。 因此,显然,数据科学家无法在他的学习方式中提供解决方案。 他将需要向客户展示如何以良好的信息学方法解决问题。 所以,这是仪表板的东西。 DS将需要准备一个仪表板,客户应理解该仪表板,并且也应给他留下深刻的印象。 否则,他将解雇他,尽管他可以很好地解决自己的问题。 我想引用一下,如果您无法解释您的客户,那么您所有的辛勤工作将毫无意义。 学习Excel,它将为您提供无处不在的帮助,您需要使用原始数据处理数据,还是需要打动客户。 如果您想学习excel,那么首先要学习一些重要的捷径。…

在没有CS背景的情况下学习Python

我支持这样的想法:随着时间的流逝,自学新技能从未如此简单–在线资源的数量是无穷无尽的,而自学能力却又不花时间,变得前所未有的容易。 就是说,当我开始学习Python的冒险时,这没有任何意义。 就像,绝对没有。 我大学毕业时获得了心理学学士学位,现在我形容这是一个“好主意”。此后,我获得了工业和组织心理学硕士学位,事实证明这是一个不错的决定。 我能够在公司中找到专注于人员分析的工作,然后我很快意识到,如果不学习编程语言,就无法充分挖掘公司中可用人员数据的潜力。 由于没有任何教育背景,甚至与CS都不相近,我感到非常害怕。 即使从一些最好的学习资料开始,甚至安装也可能很复杂。 更不用说弄清楚在哪里键入-或按下什么键才能使某些东西“运行”。所有这些都引出了您的第一句话“ Hello,world!”,这很可爱,而第一个则有些激动时间-但是,如果您渴望在职业生涯中使用python …好吧,向世界问候可能不会帮助您使用这些电子表格。 在大多数情况下,当您入门时,都会跟随一些免费的PDF的在线示例,这些示例介绍了如何从一些简单的基础知识和脚本开始。 没有完全完美地输入示例,您将收到错误消息。 而且您不会理解这些错误消息。 最初,这些错误消息很可能是由于打字错误引起的,您最终会发现一些挠头,但是很快,尤其是当您开始编写自己的代码时,这些错误将不仅仅是被遗忘的逗号或“ (“而不是” [“。您将要阅读的东西最终变得比您想象的要复杂得多。 这是如何播放的-您将努力地阅读这些PDF,只是在您最喜欢的附近咖啡店中间的橡木长桌上坐着热拿铁咖啡,接下来的几个小时被挡在周六之外继续学习……只是发现您正在处理的PDF在您要尝试处理的确切位置上已经过时,并且您几乎不了解开始使用的概念,因此现在您在花钱接下来的两个小时,他们试图理解该错误消息,同时又试图找到一种现代的方式来编写您自己(完整而又完全的新手)首先要理解的内容。 接下来,您会陷入Chrome标签页的深处,所有这些标签会导致您几乎不了解的不同的Stack…

公共服务交付中开放数据的学习资源

ODI Devon很高兴与开放数据研究所合作开展一个项目,以探索公共服务交付中开放数据学习机会的前景。 我们将在本出版物中撰写有关该项目的文章,以分享我们正在做的事情,并希望在我们进行期间从开放数据和公共服务社区中获得一些反馈。 我们将在以后的文章中介绍一些主要主题。 现在,我们要介绍该项目并提出要求(最后请更多说明)。 上面的照片是在去年我们与ODI一起举办的一个研讨会上拍摄的,该研讨会开始为参与使用开放数据进行公共服务交付的人员开发一些角色。 不久之后,ODI利兹又举办了第二次讲习班,现在,我们掌握了一些很棒的资料,可以帮助我们更好地满足用户需求并发现我们的知识空白。 我们现在正在做的部分工作将通过不断进行的用户研究来帮助我们在这项工作的基础上继续发展; 我们将在接下来的几周内分享更多有关此的信息。 现在,我们要讨论项目的另一个重要方面。 用户研究的另一面是继续在学习提供方面进行工作,ODI已经开始对此进行探索。 总体而言,该项目将着眼于人们需要什么和可得到的东西之间的差距,并就ODI应该采取的措施提出建议。 那就是我们需要您帮助的地方。 如果您知道有关开放数据和公共服务交付的任何学习材料,课程,讲习班,非正式小组(在线或离线),我们希望了解一下。 这可能只是开放数据,公共服务交付或两者的资源。 所谓公共服务交付,是指公共服务的设计,实施,评估,重新设计和影响。 之所以广泛,是因为我们希望看到结果。 我们正在努力不要对组成学习资源的规定太过规范;…

如何在2019年实现数据科学学习目标

不飞溅 作为自学成才的数据科学家或想成为数据科学家,决定每次学习的内容非常重要。 但是,由于涉及许多材料和新概念,因此它本身就可能成为一项艰巨的任务。 对于某些人而言,挑战在于他们缺乏继续学习的动力。 他们在一两周后辞职,然后又重新开始,从那以后一直处于这个周期。 因此,如果满足以下条件,我已为您撰写了这篇文章: 你觉得自己学习不够快,或者学习得不够多 机器学习领域的新课程或主题很容易使您分心 你是一个完整的新手,你不知道从哪里开始 您需要一种结构化的学习方法,并在2019年实现目标。 事实是,在此过程中,我们会遇到新的有趣的资源,课程或框架。 而且,我们要面对的挑战不是被他们所迷住-XYZ框架上崭新的课程或著名的数据科学家在机器学习新领域上的最新著作。 尽管我不反对与时俱进的新资源,但它们可能会分散我们的注意力。 因此,对于自学成才的数据科学家而言,在学习过程中优先考虑时间和取得进步是至关重要的。 否则,我们会发现自己每天都在跳来跳去,试图了解有关Reddit和Twitter的最新主题。 艾伦·甘内特(Allen Gannett)在他的《创意曲线》一书中说,掌握所有人的技能可以遵循四个定律: 消费法则-阅读有关该主题的书籍,观看教程和收听有关该主题的播客等。…