第四周:完善的准备?
完善的准备可以防止性能下降。 我想是我父亲首先告诉我的。 在数据科学中, 您80%的时间都花在准备阶段 。 在这里,您可以轻松地将眼前的不完美信息说成有用的东西。 例如,您可能缺少值,或者有异常的异常值将投影朝一个方向或另一个方向拉。 您可能需要太多的信息来进行抽样。 您可能只是拥有可怕的数据而决定不继续。 准备是难题中最重要的部分之一。 当您第一次开始进行数据项目时,本能是尽快着手并尽快建立模型,以便获得某种结果。 对产生任何东西的渴望使我想起了没有研究的文章。 您可能会在两个小时内产生800个单词,但最终结果并不是很有用。 过去的一周是关于学习享受数据预处理阶段的知识。 我们一直在学习给予它所需的应有的关注和关注。 因为没有其他选择。 如果您第一次做的不对,那么一旦您的预测不佳且结果低于标准,您将不得不回到过去。