开发和研究机器学习的东西
我们的Octavian暑期研究员Ashwath Salimath今天问他应该着重于巩固他的机器学习技能: 我想掌握TensorFlow中的核心ML算法,并能够将研究论文快速转换为编写良好的代码。 在接下来的3到6个月内该怎么办? 这引发了一个有趣的讨论,我希望这里的摘要对其他人有用。 为了扎实地开发(然后可能扩展到研究)机器学习算法,我建议花点时间做以下事情: 从头开始编写各种模型 为了真正了解某事物的工作原理,无所不包(这就是为什么许多计算机科学课程仍在教授组装和硬件的原因)。 从头开始编写模型将帮助您欣赏所采用的每个设计决策和库函数。 它还有助于记忆该模型的工作方式。 此外,调试模型会迫使您了解它正在(/没有)在做什么,为什么这样做,它的局限性是什么以及如何解决常见问题。 建议选择一个重要的数据问题(例如MNIST或Iris除外),以便您遇到更多与现实世界相关的挑战(例如,班级不平衡,噪音,难处理性,不同的准确性指标,数据清理和处理中)。 如果您真的想学习(并经历一些痛苦!),请选择缺少教程/公共解决方案的问题。 这些都不容易捷径,并且会提高您的能力。 为了使您变得灵活并且可以采用多种策略,我建议您熟悉所有主要的ML架构: 致密层/回归 卷积神经网络 递归神经网络…