当前位置: 首页 > 知识库问答 >
问题:

为什么当pod从未失败时,我会在普罗米修斯查询结果中将“正在运行”的pod视为“失败”?

范飞翰
2023-03-14
{__name__="kube_pod_status_phase",namespace="mynamespace",phase="Failed"}

当我运行上述PromQL查询时,它还返回从未失败的Pod(我在库伯内特斯看到的)。Pod处于运行状态,从未失败或重新启动。普罗米修斯是如何将其标记为“失败”的?

共有1个答案

孔欣可
2023-03-14

据此,kube\u pod\u status\u phase度量是枚举度量,并公开每个可能状态的时间序列。但是,只有Pod所在的Pod的值为1

因此,如果您想查看实际的失败的pod,请执行以下查询:

kube_pod_status_phase{namespace="mynamespace",phase="Failed"} == 1

 类似资料:
  • 我试图使用现有的Prometheus(集群外部)从EKS集群内部聚合所有的指标,EC2(CPU、ram、disk)和POD(CPU、ram、disk)。我开始使用node-exporter、kube-state-metrics添加数据,但我一直坚持部署metrics-server。使用helm I conf并安装它,和正在提取数据,但是有人能告诉我如何将所有这些都提取到外部的Prometheus吗

  • 在Spring boot中,我有一个带有控制器“/my”的Rest api。在“我的控制器我正在调用3个API:/a,/b,c http_server_requests_seconds_sum{exception=“localHttpClientRoreXception”,method=“get”,outcome=“client_error”,status=“404”,uri=“/my”,}3.0

  • null 使用默认配置和轻微的定制。 我可以访问prometheus、grafana和alertmanager,查询度量标准并查看精美的图表。 但是prometheus-adapter在启动时不断抱怨它不能访问/发现度量: 在我的设置中,对于prometheus-adapter的正确值是什么?

  • 下面是的helm图表值:https://github.com/helm/charts/blob/master/stable/prometheus/values.yaml 我能把这件事搞定: 为了做到这一点,我必须做: 我相信有一种更好、更恰当的方法可以使用和来实现这一点。我尝试了类似以下的事情,但没有运气: 我希望证书神奇地出现在上,但它们没有出现。 我假设我不需要克隆整个repo和手动编辑hel

  • 我使用Spring-Boot2.0.0并尝试公开/acturet/prometheusendpoint。我启用了所有web管理endpoint,但只有prometheusendpoint未公开。有什么帮助吗?

  • 我试图用操作符在新的k8s集群中创建普罗米修斯我使用以下文件, 我正在创建名称空间监视 应用此文件,该文件工作正常 现在我想应用这个文件(CRD)