问题：

如何解决twitter流数据时水槽中的404错误？

束新

2023-03-14

我正在尝试使用flume从Twitter API流传输一些数据。代码最初确实有效。但是现在我得到了404错误:

INFO twitter4j.TwitterStreamImpl: 404: The URI requested is invalid or the resource requested, such as a user, does not exist.

Unknown URL. See Twitter Streaming API documentation at http://dev.twitter.com/pages/streaming_api

下面是我的conf文件代码。

TwitterAgent.sources= Twitter
TwitterAgent.channels= MemChannel
TwitterAgent.sinks=HDFS
TwitterAgent.sources.Twitter.type = com.cloudera.flume.source.TwitterSource
TwitterAgent.sources.Twitter.channels=MemChannel

TwitterAgent.sources.Twitter.consumerKey=<code>
TwitterAgent.sources.Twitter.consumerSecret=    <code>
TwitterAgent.sources.Twitter.accessToken=<code>
TwitterAgent.sources.Twitter.accessTokenSecret= <code>

TwitterAgent.sources.Twitter.keywords= hadoop, bigdata

TwitterAgent.sinks.HDFS.channel=MemChannel
TwitterAgent.sinks.HDFS.type=hdfs
TwitterAgent.sinks.HDFS.hdfs.path=hdfs://localhost:8020/user/flume/tweets
TwitterAgent.sinks.HDFS.hdfs.fileType=DataStream
TwitterAgent.sinks.HDFS.hdfs.writeformat=Text
TwitterAgent.sinks.HDFS.hdfs.batchSize=1000
TwitterAgent.sinks.HDFS.hdfs.rollSize=0
TwitterAgent.sinks.HDFS.hdfs.rollCount=10000
TwitterAgent.sinks.HDFS.hdfs.rollInterval=600
TwitterAgent.channels.MemChannel.type=memory
TwitterAgent.channels.MemChannel.capacity=10000
TwitterAgent.channels.MemChannel.transactionCapacity=100

共有1个答案

隗俊誉

2023-03-14

我刚刚手动同步了VMware和windows系统的时间，问题就解决了。

类似资料：

运行水槽下载twitter数据时出现未处理java.lang.错误

当我运行这个命令时水槽正在启动，但过了一段时间，它向我抛出了不允许水槽下载的异常。我收到以下错误：出现此错误后，它尝试进行检查，但未能下载数据。我是Hadoop和Flume的新手。
以hdfs为水槽的水槽中的NOSUCH方法错误

我试图配置水槽与HDFS作为汇。这是我的flume.conf文件：我的hadoop版本是：水槽版本是：我已将这两个jar文件放在flume/lib目录中我将hadoop common jar放在那里，因为在启动flume代理时出现以下错误：现在代理开始了。这是启动日志：但是当一些事件发生时，下面的错误出现在水槽日志中，并且没有任何东西被写入hdfs。我缺少一些配置或jar文件？
水槽使用hdfs水槽。hdfs不可用时如何保证数据完整性？

当hdfs不可用时，是否有方法确保数据安全？场景是：kafka源，flume内存通道，hdfs接收器。如果水槽服务关闭了，它是否可以存储主题分区的偏移量，并在恢复后从正确的位置消费？
水槽和远程hdfs水槽出错

我正在尝试使用hdfs水槽运行水槽。hdfs在不同的机器上正常运行，我甚至可以与水槽机器上的hdfs交互，但是当我运行水槽并向其发送事件时，我收到以下错误：同样，一致性不是问题，因为我可以使用hadoop命令行与hdfs交互（水槽机不是datanode）。最奇怪的是，在杀死水槽后，我可以看到tmp文件是在hdfs中创建的，但它是空的（扩展名仍然是. tmp）。关于为什么会发生这种情况的任何想法
如何解决Socket.io 404（未找到）错误？

问题内容：我在Express中使用Socket.io。在我的项目中，我有一个登录页面和一个主页。成功登录后，我导航到localhost：3000 / home，收到此错误：我没有对我（通过express创建的项目）进行任何修改。 index.js：在我这样定义Socket.io中：问题答案：如果您运行的是Express 4，在我看来，您似乎缺少代码行：这将启动您的Web服务器并将其设置
使用水槽将数据记录到水槽所需的格式

我的项目有一个要求。我必须使用水槽收集日志数据，并且必须将数据输入到hive表中。在这里，我需要将放置在文件夹中的文件收集到hdfs中，我正在使用Spooldir进行。在此之后，我需要处理这些文件并将输出放在hive文件夹中，以便立即查询数据。我是否可以使用 sink 处理源文件，使放置在 hdfs 中的数据已经处理为所需的格式。？谢了，萨希

如何解决twitter流数据时水槽中的404错误？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档