我按照设置TwitterSource和HDFS汇的链接。
用于启动代理的命令:
bin/flume-ng agent -n TwitterAgent -c conf -f conf/flume-conf.properties -Dflume.root.logger=DEBUG,console
我成功地做到了这一点,但现在有一个问题。在停止flume代理之前,输出不会被写入。一旦我杀了我的水槽代理,它就会被写到HDFS。
我有两个问题:
1)如何停止水槽剂 - 除了做CTRL C之外,还有其他方法吗?
2)我能让flume-agent在移动中向HDFS写信,而不必杀死代理吗?
注意:终止进程后,写入的文件。tmp作为分机。是否在意料之中?
编辑:
TwitterAgent.sinks.HDFS.hdfs.rollSize = 0
TwitterAgent.sinks.HDFS.hdfs.rollCount = 10000
TwitterAgent.sinks.HDFS.hdfs.rollInterval = 600
谢谢Donald和Praveen:
我可以通过在 flume-conf 文件中设置以下内容来解决问题
TwitterAgent.sinks.HDFS.hdfs.batchSize = 1000
TwitterAgent.sinks.HDFS.hdfs.rollSize = 0
TwitterAgent.sinks.HDFS.hdfs.rollCount = 10000
并通过删除此条目
TwitterAgent.sinks.HDFS.hdfs.rollInterval = 600
现在flume正在随时随地写入HDFS。
写入了多少数据?我敢打赌,它不会写,因为你还没有收集到足够的触发与默认配置参数HDFS冲洗。有多种方法可以配置HDFS接收器,使其以可预测的方式刷新。您可以对其进行设置,使其在发生多个事件(< code>hdfs.rollCount)时、在一个时间间隔(< code>hdfs.rollInterval)时或在一个大小(< code>hdfs.rollSize)时刷新。当您终止代理时,它会清除当前正在做的事情并刷新...所以基本上你是通过杀死它来强迫它。
您也可以尝试降低hdfs.batchSize
。
记住Hadoop喜欢更大的文件。一般来说,你应该尽量避免大量的小文件。所以在这里要小心滚动太频繁。
像你一样在前台运行它,ctrl c或杀是阻止它的唯一真正方法。在生产中,您可能应该使用具有开始/停止/重新启动的初始化脚本。
使用JavaFX8,如果ObjectProperty的一个属性发生更改,但引用保持不变,那么如何能够得到通知? 下面是使用ObjectProperty的具体示例 相关代码是第一次设置的值并随后删除一个元素的位置。change eListener仅在设置的值时收到通知,但在值更改时不会收到通知。 我的问题是:即使引用的对象没有更改,如果密钥库得到更新,我如何获得通知?JavaFX中是否有内置方式?
问题内容: 这是我的配置: 根据此处找到的logback文档(http://logback.qos.ch/manual/appenders.html#TimeBasedRollingPolicy),文件将根据我的fileNamePattern 每分钟翻转一次。 我观察了它是如何工作的,这是我的发现: 它不会在很短的时间内创建日志文件。 当新日志到达时,它只会为前一分钟创建一个日志文件。(例如,我在
当bean是POJO时,Weld说“对类型Foo的不满意的依赖关系”是什么意思,但是,只要我在顶部添加< code>@Dependent,一切都工作正常?我记得以前不用指定作用域也能很好的工作。我想我打碎了什么东西。 说明书上说: 托管 Bean 由 Java 类实现,该类称为其 Bean 类。如果顶级 Java 类被任何其他 Java EE 技术规范(如 Java 服务器人脸技术规范)定义为受管
当JUnit5 explain@Test时,文档https://junit.org/junit5/docs/current/user-guide/#writing-他说 这些方法是继承的,除非它们被重写 这句话是什么意思?我没有看到任何与方法继承相关的东西
问题内容: 好的,所以我有一个监视线程,该线程检查ArrayList的大小,并在该大小大于某个数字之后执行一些操作。我现在遇到的问题是,除非我的循环中有打印语句,否则大小值永远不会更新。这是一些代码来显示我到底要做什么。 上面的代码不起作用。它永远不会进入if语句。但是,这很好用: 编辑:getSize()代码: 注意:我有另一个正在运行的线程正在更新并添加到我的t类中的列表中。 有什么帮助吗?当
我已经花了很多时间试图找到一个解决办法,但没有运气。 我正在使用旋转木马并通过javascript文件设置图像。然而,有趣的是,当我加载页面时,只有第一个图像按需要出现,其他图像(第2个,第3个....)只有当我调整窗口大小时才会出现,然后一切都正常工作。 这里是我的HTML null null 另外,需要注意的是,我使用的是Swiper包CDN 我试着从其他答案中添加max-width和heig