当前位置：首页 > 专题 >

《flume》专题

Cloudera 5.4.2：使用Flume和Twitter流媒体时，Avro块大小无效或过大
当我尝试Cloudera 5.4.2时，有一个小问题。基于这篇文章 Apache Flume-获取Twitter数据http://www.tutorialspoint.com/apache_flume/fetching_twitter_data.htm 它尝试使用Flume和twitter流来获取推文，以进行数据分析。所有的事情都很开心，创建Twitter应用程序，在HDFS上创建目录，配置Flu
Flume NoSuch方法错误将Twitter数据拉入HDFS
由于一个我无法摆脱的错误，我无法使用Flume将Twitter数据拉入HDFS。命令：控制台： flume-env.sh:我手动将flume-sources-1.0-SNAPSHOT.jar添加到flume/lib中。 twitter.conf：操作系统：Ubuntu Flume:v1.9.0 Hadoop:v3.3.0
Flume没有选择我的JMS绑定文件
我正在尝试设置一个使用JMS作为源并使用HDFS作为接收器的水槽代理。我遵循的步骤是 1）由创建了.binding文件 ``` 去 /opt/mqm/java/bin/JMSAdmin- ``` 2)丢弃相关的罐子和。绑定文件在适当的位置使用以下有用的链接如何使用。将JMS绑定到HDFS的文件 3)启动flume代理只会得到以下错误消息其中是我创建的工厂。绑定文件类似于我怀疑由于某种原因
Flume除非被杀，否则不会写入HDFS
我按照设置TwitterSource和HDFS汇的链接。用于启动代理的命令：我成功地做到了这一点，但现在有一个问题。在停止flume代理之前，输出不会被写入。一旦我杀了我的水槽代理，它就会被写到HDFS。我有两个问题： 1）如何停止水槽剂 - 除了做CTRL C之外，还有其他方法吗？ 2)我能让flume-agent在移动中向HDFS写信，而不必杀死代理吗？注意:终止进程后，写入的文件。t
如何在不指定来源的情况下使用Flume的Kafka Channel
我有一个现有的 Kafka 主题和一个从那里读取并写入 HDFS 的 flume 代理。我想重新配置我的水槽代理，以便它脱离现有设置;一个 Kafka 源，文件 Channel 到 HDFS Sink，以使用 Kafka 通道。我在cloudera文档中读到，仅使用Kafka通道和HDFS接收器（没有水槽源）就可以实现这一目标。（除非我弄错了棍子的一端。所以我尝试创建此配置，但它不起作用。它甚至
无法将Log4J中的事件放入Flume
我正在尝试使用Log4J Flume appender通过Flume将事件从Log4J 1x获取到HDFS。创建了两个附加器FILE和水槽。它适用于文件附加器，但使用水槽附加器，程序只是挂在Eclipse中。Flume工作正常，我能够使用avro客户端向avro源发送消息并在HDFS中查看消息。但是，它没有与Log4J 1x集成。我没有看到任何异常，除了下面在log.out中。从水槽控制台如
如何配置 Apache Flume 1.4.0 从 Twitter 获取数据并放入 HDFS（Apache Hadoop 版本 2.5）？
我使用的是Ubuntu 14.04，我的配置文件如下：我正在我的终端上使用以下命令: 我收到以下错误： Apache Flume和Apache Hadoop的版本有兼容性问题吗？我没有找到任何可以帮助我安装Apache Flume 1 . 5 . 1版的好资源。如果没有兼容性问题，那么我应该如何在我的HDFS中获取tweets？
使用Flume将日志文件写入HDFS
在HDFS中写入日志文件的最佳方式是什么？我正在尝试配置Apache Flume，并尝试配置能够为我提供数据可靠性的源。我试图配置“exec”，后来也查看了“spooldir”，但flume.apache上的以下文档。org对我的意图表示怀疑- 执行来源：最常请求的功能之一是像“tail -F file_name”这样的用例，其中应用程序写入磁盘上的日志文件，Flume 尾随文件，将每一行作为事
Flume将输出格式从. csv更改为. json
我使用的是flume的纯节点(测试)模式；我的水槽以如下方式启动: 水槽节点-1-c$FQDN'：amqp（“exchangeName=[exchange name]”，“bindings=[binding name]””，“host=127.0.0.1”，“port=5672”，“userName=[user]”，”password=[pass]“，”exchangeType=direct“，”
在Flume-ng中使用HDFS接收器和滚动间隔来批量处理90秒的日志信息
我正在尝试使用Flume-ng获取90秒的日志信息，并将其放入HDFS的一个文件中。我让flume通过exec和tail查看日志文件，但是它每5秒创建一个文件，而不是我试图配置为每90秒创建一个文件。我的flume.conf如下: 我试图通过参数-agent1.sinks.sink1.hdfs.rollInterval=90来控制文件大小。运行此配置会产生: 从时间戳可以看出，它大约每5秒钟创
在Flume中，我如何获取多个动态实时文件
我有一个程序，它每分钟运行一次，并使用STRACE命令同时生成多个日志文件。例如，在第一次运行中-它可能会开始跟踪10个进程，日志文件名为唯一的PIDS，这将一直运行，直到整个跟踪完成。同时，第二次运行将开始，它可能会开始跟踪更多的进程ID。现在我想使用flume将所有这些STRACE日志连续流式传输到另一台服务器。我尝试使用假脱机，但由于我有多个动态实时文件，所以这是一个糟糕的选择。我曾想过使用
如何将Flume的Avro事件反序列化到Spark？
我有Flume Avro水槽和SparkStreams程序来读取水槽。CDH 5.1、Flume 1.5.0、Spark 1.0，使用Scala作为Spark上的程序lang 我能够制作Spark示例并计算Flume Avro事件。但是我无法将 Flume Avro 事件反序列化为字符串\文本，然后解析结构行。有人能举例说明如何使用Scala做到这一点吗？
了解Apache Flume中Avro的连接和转换
我正在学习Apache Flume，但有些东西我不懂。当源/接收器类型为avro时，这是否意味着事件以avro格式发送？也就是说，我的数据被封装到水槽事件中，并以 avro 格式从接收器发送到源。文档说： Flume事件被定义为具有字节有效载荷和可选字符串属性集的数据流单元。Flume代理是一个（JVM）进程，它托管组件，事件通过这些组件从外部源流到下一个目标（跳）。这是否意味着在流的顶部有一
Flume HDFS接收器写入错误“无协议:值”
尝试运行水槽作业时，我收到下面给出的错误。我正在云时代设置上运行它。 Kafka是来源 Morphline用作拦截器，从中创建avro记录接收器为HDFS 完全相同的文件(morphline，avro schema等。水槽配置)。但是在另一个环境中，它会抛出这个错误。我能够在水槽上找到相关代码：https://github.com/apache/flume/blob/trunk/flume-n
Apache Flume连接到twitter API 401：身份验证凭据
我正在尝试使用Apache Flume将推文保存到HDFS。我目前在Hadoop和Flume中使用Cloudera图像。我在Cloudera的博客上学习教程，但我无法连接到Twitter API。我收到以下错误：我已经将我的twitter API凭证复制到flume.conf中(我已经在光盘和web用户界面上进行了尝试)。我也曾试图重新生成它们，并复制那些新的，但这对我没有帮助。我的pom。

首页

2

3

4

5

6

7

尾页

最新发布

百度数据开发实习面经雷克沙测开二面上海百考丝信息科技有限公司--java面经海致科技--java面经京东Java一二面面经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

python - 明明有这个文件为什么还报错？前端 - 使用 wxt 框架开发浏览器扩展遇到的问题?前端 - 你们用react-markdown做聊天的时候，内容是流不断返回的，如果有图片的话。会造成页面闪烁，因为contten不断变化，重新渲染了。怎么解决的？vue2 - vue虚拟滚动列表vue-virtual-scroller滚动卡顿的问题？前端 - uni-app打包web站点，webview在app端如何上传非媒体类型文件？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

minimal-light Eclipse Corrosion Shiretoko NovelHarvester Conceal KAProgressLabel nba-go chan

文档资料

gRPC 官方文档中文版 Apple Watch 人机交互指南 Ruby 用户指南 Go Web 编程 Ruby 源码解读