我进化神经网络学习玩电子游戏的时间

前言(或我如何偶然发现遗传算法和强化学习) 奇怪的是,在2017年初,我对机器学习的知识主要限于经济学中使用的技术:GLM,时间序列分析和各种统计量度。 经济学的目标是找到可以很好地拟合数据的模型,但更为关键的是,它提供了某种方式来解释“现实世界”中发生的事情(在许多情况下给出了虚假的解释,从而最好进行冗长的讨论,或者在最坏的情况下用一些精心挑选的变量来支持某些先验信念)。 我对机器学习的迷恋源于它的反向方法-找到最能预测看不见数据的模型,而很少考虑解释它。 换句话说,将重点放在有效的内容上,而不是可以解释的内容上。 这似乎无限有用,即使它不允许我听起来那么聪明。 开普敦大学统计系出色的学术人员,再加上免费的出色在线资料(尤其是吴安德的Coursera和deeplearning.ai课程),使我得以掌握所需的主要监督和非监督方法和工具。创建有用的模型和分析。 但是,有一些我从未完全理解的东西:一台机器没有一组标记的数据(正确答案的示例)时,如何学习? 这似乎是一个更为根本的问题,因为它非常类似于我们个人面临的问题。 当时我正在阅读Siddhartha Mukherjee的《基因》 (这本书是我建议作为了解遗传学和我们自己的一种便捷途径)。 让我吃惊的是,进化过程是如此复杂,因为突变发生在遗传水平上,但是这些基因以不可预测的方式表达,并且在基因型和表型之间存在多对多的映射。 您不能将物理特征向后工程为一系列碱基对,也不能创建一系列碱基对并准确预测物理特征。 您可以做的是观察自然选择会滤除无法帮助生物体生存和繁殖的特征。 这两个关于我们如何在没有答案的情况下学习的思想,以及有机体如何在遗传水平上突变以根据其在环境中的物理特征进化的思想,使我开始研究遗传算法如何在进化更好的强化学习剂中发挥作用。 强化学习 在许多方面,强化学习(RL)比监督学习更直观,尽管许多RL方法都使用监督学习方法。…

如何掌握康奈尔笔记系统

提前几个月考虑:考试季节已经开始,并且您很感谢您忠实地参加了课堂并记下了清晰,井井有条的笔记-还是您这样想。 杂乱无章的意大利面条像杂乱无章的意大利面条一样,在页面上盯着你,这使你无法确切记住教授的意思或这些思想之间的联系。 面对这样的笔记灾难,您如何有效地学习? 解决方案很简单:学习康奈尔笔记系统,并在考试开始之前开始使用它。 该笔记记录系统由康奈尔大学的Walter Pauk博士创建,既是记录信息的有效方法,也是吸收信息的有效方法。 除了为您节省时间和烦恼进行填字游戏外,Cornell笔记实际上可以提高您的学习体验质量,帮助您建立联系并从每堂课中学到更多。 通过此分步指南,您将了解康奈尔笔记系统的五卢比,并且永远不会遇到无法理解自己笔记的噩梦般的问题。 在你开始之前 康奈尔笔记系统在空间上组织思想,因此对于视觉学习者来说非常有用。 这个想法是给自己留出空间来抄录信息(课堂笔记),识别要点(学习线索)以及总结本课的主要思想(总结)。 记住还要记录课程名称,班级主题和课程日期,以使笔记保持井井有条。 在上课之前,请使用记号笔或其他颜色的墨水将页面分为两大栏,顶部留一点空间,底部留一个较大的区域。 请注意,粗线形成了偏斜的“ I”形。 您可能需要事先准备好几页,或者可以使用模板(可以在网上找到它们,也可以使用Microsoft Word创建数字版本)。 左撇子可以将提示栏切换到右侧,使事情变得更容易。…

阶段3:对生成研究报告的反馈

萨拉·亨德伦(Sara Hendren) 在向Microsoft团队介绍我们的生成研究之前,我们很幸运地从Olin学院设计助理教授Sara Hendren获得了反馈。 除了提供有关演示文稿本身的反馈意见之外,Sara还促使我们更深入地思考我们的原则,设计项目的目标以及我们在工作中探索的重要原因 。 以下是莎拉对我们的演示文稿进行回顾时得出的一些主要结论: 推销应该更好地解决什么(例如职业培训中的MR)以及WHY(当前趋势,创造新工作,但人们不具备这些条件以及目前正在发生的更大的社会转型) 探索性研究的原则似乎含糊不清,更令人信服的见解包括:1)诊断与解决问题之间的区别—某些事情将自动化,但解决方案可以帮助增强仍将是人类的技能(即解决问题); 2)需要为终身学习者而不是熟练工人做准备-技术将发生变化,解决这些问题所需的技能也将发生变化; 3)面对快速的技术变革,需要训练灵活性—与技能一样重要,技术变革的准备以及面对这种破坏的灵活性,将是未来必不可少的技能。 在以这种方式考虑用于教育的MR时,该解决方案可能会支持一种变革性的学习体验,这种体验会破坏主/学徒的动态,并成为打破教育层次结构的邀请,并为变革性学习提供新的机会。 有了她的反馈,我们回到了演示文稿中,以结合她的想法,将我们的原则带入更深层次,并进一步发展我们的概念以反映那些更深层的原则。

实地失败

您上次看到非营利组织宣布其尚未达到目标的时间是什么时候? 来自发展部门的媒体(推文,会议演讲,赠款报告)往往描绘出影响力很大的计划的美好前景。 我们被关于大规模进步,大量产出和动人的故事的描述所淹没,这些故事植根于对成功的一维描述。 如果每个非营利组织实际上都完成了其报告的一半,那么世界上就不会有贫穷。 在过去的15年中,我曾担任Ubuntu Education Fund的执行官。 从表面上看,我们的轨迹看起来很简单:最初是两个人从扫帚壁橱里的物资分发到南非伊丽莎白港乡镇学校的食堂,如今已发展成为一个先进的中心,这是一个希望的灯塔。整个社区。 但是,Ubuntu并没有通过这个线性的,易于销售的故事到达今天的位置。 我们的旅程是复杂而细微的,充满了风险和失败。 我们从失败中吸取了最大的教训,促使我们对方法和程序进行了重大更改,并产生了长期影响。 公司成立后将近二十年,我们仍在冒险,推动我们的工作并从挫折中吸取教训。 一个简单的成功故事无法涵盖这一轨迹。 Ubuntu并不孤单-故障是每个组织发展的固有部分。 在不冒任何变革风险的情况下,不可能产生深远的影响,赋予社区权力或减轻贫困的残酷影响。 这就是为什么我们需要在这个部门中打开叙述,以包括失败的教训以及对成功的庆祝。 我们需要停止夸大影响而不暴露我们的斗争。 发展领导者冒险,失败,但也改变了生活。…

eMAG TechTalks — 2年的知识共享

在过去的10-15年中,技术已成为每个人生活中非常重要的一部分。 也许我们当中没有多少人承认在很短的时间内事情已经走了多远。 例如,第一部真正的智能手机是10年前随第一部iPhone出现的,但感觉它已经存在了很长时间。 好吧,还没有。 现在,我们将智能手机或万维网等事物视为理所当然,但不久前,这些都是SF概念。 如果我回到过去并向某人展示智能手机,他们可能会发疯,将我锁起来并扔掉钥匙。 科技改变了我们生活的世界,使生活更轻松,也可能更有趣。 但是,它具有非常烦人和有趣的特征-变化是如此之快,以至于令人难以置信。 技术是eMAG等大公司的骨干。 一家公司的价值每年都在增长,无论是销售额,提供的产品和服务数量还是员工人数。 一家不断成长,不断变化并且对后端和前端技术的要求更高的公司。 每当公司变大时,雇用的人数就激增。 人们不会经常见面或交谈。 我知道您可以给他们发送电子邮件,但是电子邮件将永远无法取代人机交互,发言人的声音以及一群人在一起的反馈和投入。 这就是eMAG TechTalks出现的地方-我们将人们召集在一起,让他们谈论技术及其知识。 如果知识就是力量,那就与他人分享。 两年前,我们召开了第一届TechTalks会议,人数超过了我们的实际预期,主题是Microservices和Redis…