当前位置: 首页 > 知识库问答 >
问题:

使用 NGINX 将跟踪数据转发到 Flume

薛俊美
2023-03-14

我正在根据我们通过简单的图像信标收集的仪器数据,为我们的网站属性提供分析。我们的数据管道从Flume开始,我需要尽可能快的方法来解析查询字符串参数,形成一条简单的文本消息并将其推入Flume。

出于性能原因,我倾向于使用nginx。由于已经支持从内存提供静态映像,所以我的任务减少到处理查询字符串并将消息转发到Flume。因此,问题是:

nginx和Flume集成最简单可靠的方法是什么?我在考虑使用syslog (Flume支持syslog监听器),但是我很纠结如何配置nginx将自定义日志消息转发给运行在远程服务器和自定义端口上的syslog(或者只是TCP)监听器。nginx现有的第三方模块是否可行,或者我必须自己编写?

另外,对于编写一个快速$args解析器,您可以推荐的任何现有内容都将非常受欢迎。

如果您认为我走在一条完全错误的道路上,并且可以推荐更好的性能,请随时告诉我。

先谢谢!

共有1个答案

万高轩
2023-03-14

你应该像tail -f一样解析nginx日志文件,然后将结果传递给Flume。这将是最简单,最可靠的方法。syslog 的问题在于它会阻止 nginx,并且可能会完全卡在高负载下或出现问题(这就是 nginx 不支持它的原因)。

 类似资料:
  • 1.3.2. 跟踪数据 作为一个有安全意识的开发者,最重要的一件事就是随时跟踪数据。不只是要知道它是什么和它在哪里,还要知道它从哪里来,要到哪里去。有时候要做到这些是困难的,特别是当你对WEB的运做原理没有深入理解时。这也就是为什么尽管有些开发者在其它开发环境中很有经验,但他对WEB不是很有经验时,经常会犯错并制造安全漏洞。 大多数人在读取EMAIL时,一般不会被题为"Re: Hello"之类的垃

  • 更新:我已将代码推送到我的回购协议中,以便人们可以查看那里,看看可能出现了什么问题。 编辑:我几乎可以肯定是客户端代码没有向服务器发布任何统计数据,但是下面的指南都没有解释如何启用:是否有我缺少的配置设置? 我一直在关注OpenZipkin和Spring Sleuth的快速启动:我从docker Zipkin使用和Cassandra作为后端运行Zipkin服务器: 我已经创建并运行了Spring

  • 从现有检测的Spring Boot应用程序向honeycomb-opentracing-proxy发送跟踪失败,代理控制台中出现以下错误: Spring Boot版本:2.1.3.发布Spring Cloud Sleuth版本:2.1.1.发布 应用程序.属性 如有任何帮助,我将不胜感激

  • 问题内容: 假设您执行 e.printStackTrace() ,则捕获到一个异常并在标准输出(例如控制台)上获得以下内容: 现在,我想将其发送给log4j之类的记录器,以获取以下信息: 我怎样才能做到这一点? 问题答案: 您将异常直接传递给记录器,例如 取决于log4j来呈现堆栈跟踪。

  • 在迈克尔·哈特尔(Michael Hartl)的rails教程之后,我正在尝试构建一个呼叫跟踪应用程序,以了解更多rails和Twilio。 到目前为止,我已经成功地创造了- 认证 与Stripe集成 每个自动注册的用户都会获得一个Twilio子帐户 用户可以搜索电话号码并购买它们 (在过去的5天里,已经完成了20个Stackoverflow问题!) 现在,我想做的是创建通过Twilio记录通话数

  • 问题内容: 我正在Go中为Linux编写一个ShareX克隆,该克隆通过http POST请求将文件和图像上传到文件共享服务。 我目前正在使用http.Client和Do()发送请求,但我希望能够跟踪较大文件的上传进度,这些文件最多需要一分钟的时间来上传。目前,我能想到的唯一方法是手动在端口80上打开与网站的TCP连接,并以块的形式写入HTTP请求,但我不知道它是否可以在https网站上使用,我不