为流集创建自定义原点
流集数据收集器: StreamSets Data Collector是一个轻量级且功能强大的引擎,可实时传输数据。 它使您可以构建连续的数据管道,每个管道都从一个来源使用面向记录的数据,可以选择在一个或多个处理器中对这些记录进行操作,并将数据写入一个或多个目标 。 流集原始阶段: 要定义Data Collector的数据流,请配置管道 。 管道由代表管道起点和终点以及您要执行的任何其他处理的阶段组成。 原始阶段代表管道的源。 例如,此管道基于SDC出租车数据教程https://streamsets.com/documentation/datacollector/latest/help/#Tutorial/Overview.html,其中使用了目录原点,四个处理器和Hadoop File System目标: Stremsets捆绑有许多Origin阶段组件,可与几乎所有常用数据源连接,如果您找不到源系统的数据源,请不要担心Streamsets API可以帮助您为系统创建自定义的Origin阶段。 该博客介绍了如何开始编写自己的自定义Streamsets…