使用普罗米修斯度量标准需要不同的思维方式。设计指标通常并不太困难。你能帮我设计订单处理系统的指标吗? 系统处理请求(如订单)。每个请求都包含许多要处理的项目。请求的处理时间可能在几秒钟到几小时之间。一个请求中的项目数在100万到100万之间变化。请求之间可能有一段时间。 我如何设计指标(计数器,量表,直方图,摘要?)普罗米修斯在白天(比如每10分钟)提供以下信息: 每个时间单位处理的平均项目数(请
我已经配置了普罗米修斯来获取一些来源的指标。 cadvisor 问题是。 在Prometheus UI中,我可以看到所有的目标,在图形中,我可以查询所有与nodejs相关的指标。但是如果我做,我只看到与普罗米修斯和节点出口商相关的指标。没有任何与nodejs应用程序或hazelcast相关的内容。 直接请求nodejs应用程序毫无问题地返回所有这些值。 什么会导致这样的问题?
现在我正在从节点导出器中抓取指标。节点导出器导出的一些指标具有标签。 我想删除具有此标签且与正则表达式不匹配的时间序列。我尝试使用操作(因为我希望保留与此正则表达式匹配的时间序列),但这也会删除没有标签的所有其他度量。 我也尝试过使用操作,但这需要我使用负前瞻来反转正则表达式(这不受支持,因为Prometheus是用Go-of-course编写的)。 我的选择是什么? 重要的是,我无法控制节点导出
我正在编写一个Prometheus Exporter,用于公开从AIX服务器推送的度量。AIX服务器将它们的度量(json格式)推送到一个中央侦听器(导出程序),该侦听器将它们转换为标准的Prometheus度量,并将它们公开以进行刮取。 我遇到的问题是,度量的主机名是从推送的json中提取的。我将其存储为每个度量中的标签。例如,njmon_memory_free{lpar=“myhostname
我已经在我的web服务器中配置了apache_exporter以公开度量,普罗米修斯将从中获取度量。它在除启用了apache http身份验证(AuthType)的公共服务器之外的所有服务器上都能工作。如果启用了http身份验证,如何使用prometheus进行刮取。
我有一个带有prom客户端的node express应用程序,用于监视串行连接并向httpendpoint报告值,串行速度为9600波特,正在通过网络传输一些统计数据。Prometheus实例以1000毫秒的间隔配置作业,以针对该endpoint并获取度量。我希望能够在至少10毫秒的分辨率内看到这个指标,但似乎普罗米修斯图形分辨率不接受小于1秒的分辨率。我应该怎么做才能让普罗米修斯以至少10毫秒的
我遇到了一点麻烦,因为这似乎是一个简单的问题。 我的场景:我有一个k8s作业,它可以在任何时候运行(不是cronJobs),这反过来又创建了一个pod来执行一些任务。一旦豆荚完成了它的任务,就完成了产生它的工作。 我尝试的是:以下普罗米修斯度量,这是一个即时向量,可以是0(pod不运行)或1(pod正在运行): 我想我试着用这个指标和下面的公式来计算一天中指标为1的持续时间 因为这些豆荚来来往往并
当我运行上述PromQL查询时,它还返回从未失败的Pod(我在库伯内特斯看到的)。Pod处于运行状态,从未失败或重新启动。普罗米修斯是如何将其标记为“失败”的?
我有一个应用程序,当它收到一个特定的HTTP请求时,它会增加一个Prometheus计数器。该应用程序在Kubernetes中运行,具有多个实例,并且每天重新部署多次。使用查询生成一个图形,显示每个实例的累积请求计数,如预期的那样。 我想创建一个Grafana图表,显示过去7天收到的请求的累积频率。 我的第一个想法是使用来说明从7天窗口(如图所示)之外开始的任何指标,然后对这些值进行
我目前正试图提醒Kubernetes吊舱堆积在可用区域内。我已经成功地使用了两个不同的指标,可以看到一个应用程序有多少吊舱在特定的可用性区域上运行。但是,由于缩放,我希望警报是基于百分比的。。。因此,我们可以在一个AZ上运行特定百分比的POD时发出警报(即超过70%)。 我当前的查询: 和一些选定的输出: 例如,在上面的输出中,我们可以看到4个db-1吊舱堆叠在az2上,而不是az1上的1个吊舱。
我有两个实例运行作业并向pushgateway发送仪表度量。 出于某种原因,普罗米修斯为一项工作和两个不同的实例绘制了一幅图。图如下: 问题是我做错了什么,如何让普罗米修斯为这些例子画出独立的连续情节? 我用的是python的prometheus_client。
我需要计算普罗米修斯度量在给定时间框架内的唯一标签集的数量。例如,“在过去7天的某个时候,有多少唯一标签集的值为1。” 我已经使用和进行了研究,但是只对即时向量进行操作,这意味着我可以在时间上获得一个实例的唯一标签集的数量,但不能在时间框架内获得总数。返回没有用的值的数量,因为我需要知道标签集的数量,而不是每个标签集有多少值。 基本上我想要像
我试图解决一个问题,使总和和组查询普罗米修斯上的一个指标,其中的标签分配给度量值唯一的我的总和和和组的要求。 我有一个ElasticSearch索引的指标采样大小,其中索引名称被标记在指标上。索引是这样命名的,并放置在标签"index"中:
我有以下计数器指标 如何计算最近2分钟内活动设备的数量,即2(设备id 3和4)?
假设我有一个文件,用于跟踪插入计算机的设备的状态。该文件如下所示: 如何使用prometheus_clientPython库创建自定义导出器,将刮取该文件中的值?我计划使用Grafana显示时间序列图中的值,这样我就可以看到每个设备的状态如何随时间变化。我需要使用直方图还是仪表?我必须将设备ID及其状态保持在一起。有人能解释一下最好的方法,以便将它们转换为度量标准吗?