第四周:完善的准备?

完善的准备可以防止性能下降。 我想是我父亲首先告诉我的。

数据科学中, 您80%的时间都花在准备阶段 。 在这里,您可以轻松地将眼前的不完美信息说成有用的东西。

例如,您可能缺少值,或者有异常的异常值将投影朝一个方向或另一个方向拉。 您可能需要太多的信息来进行抽样。 您可能只是拥有可怕的数据而决定不继续。

准备是难题中最重要的部分之一。

当您第一次开始进行数据项目时,本能是尽快着手并尽快建立模型,以便获得某种结果。 对产生任何东西的渴望使我想起了没有研究的文章。

您可能会在两个小时内产生800个单词,但最终结果并不是很有用。

过去的一周是关于学习享受数据预处理阶段的知识。 我们一直在学习给予它所需的应有的关注和关注。

因为没有其他选择。 如果您第一次做的不对,那么一旦您的预测不佳且结果低于标准,您将不得不回到过去。