开发和研究机器学习的东西小小书 XXshu

我们的Octavian暑期研究员Ashwath Salimath今天问他应该着重于巩固他的机器学习技能：

我想掌握TensorFlow中的核心ML算法，并能够将研究论文快速转换为编写良好的代码。在接下来的3到6个月内该怎么办？

这引发了一个有趣的讨论，我希望这里的摘要对其他人有用。

为了扎实地开发（然后可能扩展到研究）机器学习算法，我建议花点时间做以下事情：

为了真正了解某事物的工作原理，无所不包（这就是为什么许多计算机科学课程仍在教授组装和硬件的原因）。从头开始编写模型将帮助您欣赏所采用的每个设计决策和库函数。它还有助于记忆该模型的工作方式。

此外，调试模型会迫使您了解它正在（/没有）在做什么，为什么这样做，它的局限性是什么以及如何解决常见问题。

建议选择一个重要的数据问题（例如MNIST或Iris除外），以便您遇到更多与现实世界相关的挑战（例如，班级不平衡，噪音，难处理性，不同的准确性指标，数据清理和处理中）。

如果您真的想学习（并经历一些痛苦！），请选择缺少教程/公共解决方案的问题。这些都不容易捷径，并且会提高您的能力。

为了使您变得灵活并且可以采用多种策略，我建议您熟悉所有主要的ML架构：

机器学习库倾向于鼓励单一的，难以阅读的，难以测试的代码。抵抗这种冲动！

通过编写更多的防弹代码，您将能够更快地编写工作模型。

您想要使代码对他人友好，可能会起作用，并且会给出易于理解的错误，而不是令人讨厌的零精度。

现在有很多很棒的工具和平台可以加快您的工作速度。例如：

首先，养成阅读研究论文的习惯是一种很好的方法：

Twitter当前是发现新论文的好地方。以下是一些有关句柄的想法。

接下来，尝试实现论文中的内容。即使实施整个研究系统令人生畏，也可以在工作中采用一些较小的想法。例如，我一直在努力寻找能够成功训练嵌入模型的学习率，而PercentDelta的5行实现解决了我的问题。

许多现实世界中的问题/数据集太大，无法在十分钟之内在笔记本电脑上运行。分布式系统是一个完全独立的野兽（并且可能比深度学习模型更难调试！）

尽管构建企业规模的分布式培训系统是一项巨大的努力，但更友好的规模项目很容易实现：

我个人开始进行分布式培训，以帮助进行遗传算法/神经图灵机实验。

通常，现实世界中的部署资源有限（例如，它必须在浏览器中运行，或者必须为用户快速计算答案）。

请尝试以下方法之一：

写作和教学迫使您在知识上的差距上发光。它们既是有价值的技能，又是奖励和乐趣。

您可以尝试以下几种常见格式：

发现良好的研究标题/问题本身就是一项技能。您要查找的是：

很难找到满足所有这些条件的东西（通常，提高技能和资源非常有帮助）。但是，对于每个项目，您都可以反思其进展情况，然后磨练自己的技能。

玩得开心！愉悦和激情会驱使您度过所有这一切，特别是如果您在自己的空闲时间里做的话。查找让您兴奋的活动，问题和技术架构，并追随兔子洞！