当前位置: 首页 > 知识库问答 >
问题:

普罗米修斯的grafana仪表盘不工作

习宸
2023-03-14

我是格拉法纳和普罗米修斯的新手。我使用docker compose设置了prometheus、grafana、alertmanager、nodeexporter和cadvisor。yml来自本帖https://github.com/vegasbrianc/prometheus

从https://grafana.com/dashboards/893进口Grafana仪表板#893

但是仪表板不工作,因为我可以在一些面板中看到N/A。例如,下面是面板使用的查询,我不知道如何在查询中获取模板变量的值。我看了超文本传输协议://node-exator: 9100/指标,没有看到变量$server的值

Query1: time() - node_boot_time{instance=~"$server:.*"}
Query2:min((node_filesystem_size_bytes{fstype=~"xfs|ext4",instance=~"$server:.*"} - node_filesystem_free_bytes{fstype=~"xfs|ext4",instance=~"$server:.*"} )/ node_filesystem_size_bytes{fstype=~"xfs|ext4",instance=~"$server:.*"})

我应该为node exporter和prometheus配置什么来评估查询中的模板变量$server?

共有2个答案

郜光明
2023-03-14

这是个老问题,但对我来说仍然不起作用。原因是标签_值(…)获取具有节点启动时间度量的所有实例名称效果良好。

问题在于表达式后面的正则表达式(下一行)。在我的例子中,它是一种类似“/([^::].*):/”的棘手的东西。我的实例名称以“i-”开头,不包含冒号,因此未选择任何内容。我只是用ProductCode来找出正确的实例。

边桐
2023-03-14

$server是一个Grafana模板变量。这些通常显示为Grafana仪表板顶部的下拉列表。

label_values是应用于普罗米修斯查询的普罗米修斯特定Grafana函数。您的特定示例label_values(node_boot_time,instance)将返回普罗米修斯收集的所有node_boot_time指标的实例标签的所有值(即普罗米修斯监控的所有节点导出器目标)。

我对您正在使用的特定仪表板(或节点导出器)没有经验,但通常情况下,某些面板显示“N/A”或没有值,而其他面板工作正常的原因是基础度量名称可能已更改。您可以单击Grafana中有问题面板的标题,选择编辑,然后单击度量选项卡以尝试不同的度量名称。有关“灵感”,请检查节点导出器的/metricsendpoint。如果您不知道如何访问它,请在Prometheus web界面上导航到状态

 类似资料:
  • 我将我的GKE API服务器升级到1.6,并正在将节点升级到1.6,但遇到了一个障碍... 我有一个prometheus服务器(版本1.5.2),运行在一个由Kubernetes部署管理的pod中,其中两个节点运行版本1.5.4Kubelet,一个新节点运行版本1.6。 但普罗米修斯仍然得到401。 更新:就像乔丹所说的kubernetes认证问题。在这里看到新的、更集中的问题;https://s

  • 我要监控的应用程序为健康检查提供了一个apiendpoint,该endpoint使用json中的指标进行响应。例如: 我已经设置了Prometheus blackbox\u exporter,以监视此endpoint是否返回200 Ok,但理想情况下,我也希望获得这些指标。我知道instrumentation直接从应用程序导出这些数据。但是,由于应用程序已经在导出json对象中我想要的内容,我更希

  • null 使用默认配置和轻微的定制。 我可以访问prometheus、grafana和alertmanager,查询度量标准并查看精美的图表。 但是prometheus-adapter在启动时不断抱怨它不能访问/发现度量: 在我的设置中,对于prometheus-adapter的正确值是什么?

  • 我在web服务中使用Prometheus Java simpleclient来跟踪有多少事件导致了这种或那种状态。 我可以在日志中检查计数器是否正在被调用,是否在内部递增,但是似乎很多时候数据都没有到达/metricsendpoint。 例如,就在刚才,在每隔几分钟为同一状态递增计数器3次之后,日志将打印出“当前值= 0,新值= 1”三次。前两次在/metricsendpoint上没有显示任何数据

  • 我有一个启用了监视和日志记录的GKE集群(1.15)。到目前为止,我们一直使用metrics-server对StackDriver进行度量监控。对于其他自定义度量标准,我们使用了自定义度量标准适配器,该适配器使用Prometheus-to-SD将度量标准刮取并导出到stackdriver。 我想开始看看prometheus是否能给我们提供其他功能,比如HPA的聚合度量。 在GCP marketpl

  • 关于整合齐普金和普罗米修斯的可能性的小问题。 目前,我们已经有了一个完全可用的Zipkin实例,以及它的web UI。Zipkin超级酷,一切都很好。 我们能够让所有微服务向Zipkin发送跟踪信息,并让Zipkin汇总这些信息。 我们还可以在UI中搜索痕迹等等,超级酷。 另一方面,我们也有一个非常成熟的经过实战检验的Prometheus Grafana,其中已经包含了容器级指标、应用程序级指标和