我有一组处理器来执行一些功能。
只要考虑一个例子,如果我有getfile,generateflowfile处理器通过cron触发整个工作流。在某些时候,我进入那个工作流不能确保处理器按照cron运行,因为它的整个处理在那个时候完成了。
谁能建议我最好的方法,以确保处理器的最后运行时间和它的处理属性?。
您可以使用数据出处
。例如,您希望查看GenerateflowFile
的触发器时间。右键单击该处理器并选择Data Provenany
,它将列出该处理器的provenance stats。
date/time
列列出处理器触发/创建流文件的时间。type
列引用事件的类型。generateflowfile
将始终具有create
类型,因为它只生成flowfile。其他处理器可能有不同类型的事件,如drop
、attributes_modified
。但是,如果只是想知道处理器何时被触发,请查找create
事件类型。
有一个特定的处理器,正如下面提到的,我对它感兴趣,与1.2.0相比,1.5.0中有一个额外的特性,所以我想使用它。 我看到有两种方法。 以上处理器存储为nifi-standard-nar-x.x.x.nar-unpacked文件。所以只需从1.5.0复制Nar,并将其放在1.2.0上即可。在此之后,我不确定nifi是否会识别这个新的处理器版本? 上面的处理器是下面文件的一部分,因此从它中创建一个新
Apache NIFI“ExecutesQL处理器”能否以“X”MB为单位流式传输大量的选择结果?
我在Nifi中使用QueryCassandra处理器从Cassandra中获取数据以摄取MSSql表。但是我的Cassandra查询总是重复运行,并且在Cassandra Nifi的处理器中我没有任何设置增量或最大值列的选项。如何使用增量Cassandra查询执行Nifi流?
我正在研究NIFI数据流,我的用途是获取mysql表数据并将其放入HDFS/本地文件系统。 我已经构建了一个数据流管道,在这里我使用了querydatabaseTable处理器------ConvertRecord----PutFile处理器。 我的表模式-->id、name、city、Created_date 我的问题是,如何处理这种情况?任何其他处理器或需要更新某些属性。
每次作业运行时,都在从不断增长的现有表中读取数据。我正在寻找Spring batch中的选项,以便在每次运行调度作业时只查询新记录。 如果我读了50000条记录,下一个时间表应该从50001开始。 我的想法是将ItemReader读取的最后一条记录的id(整个读卡器输出的最后一条,而不是每个块的最后一条)保存在DB中,并在后续的作业计划中使用。我将从主表返回按id排序的数据。 我怎么知道作者最后的
在getView(int位置,视图转换视图,视图组父)方法的适配器如何知道位置是否反映行的最后一列? 例如: 假设这是GridView,那么元素3、6和9分别是第1、2和3行的最后一列。