{__name__="kube_pod_status_phase",namespace="mynamespace",phase="Failed"}
当我运行上述PromQL查询时,它还返回从未失败的Pod(我在库伯内特斯看到的)。Pod处于运行状态,从未失败或重新启动。普罗米修斯是如何将其标记为“失败”的?
据此,kube\u pod\u status\u phase
度量是枚举度量,并公开每个可能状态的时间序列。但是,只有Pod所在的Pod的值为1
。
因此,如果您想查看实际的失败的
pod,请执行以下查询:
kube_pod_status_phase{namespace="mynamespace",phase="Failed"} == 1
我试图使用现有的Prometheus(集群外部)从EKS集群内部聚合所有的指标,EC2(CPU、ram、disk)和POD(CPU、ram、disk)。我开始使用node-exporter、kube-state-metrics添加数据,但我一直坚持部署metrics-server。使用helm I conf并安装它,和正在提取数据,但是有人能告诉我如何将所有这些都提取到外部的Prometheus吗
在Spring boot中,我有一个带有控制器“/my”的Rest api。在“我的控制器我正在调用3个API:/a,/b,c http_server_requests_seconds_sum{exception=“localHttpClientRoreXception”,method=“get”,outcome=“client_error”,status=“404”,uri=“/my”,}3.0
null 使用默认配置和轻微的定制。 我可以访问prometheus、grafana和alertmanager,查询度量标准并查看精美的图表。 但是prometheus-adapter在启动时不断抱怨它不能访问/发现度量: 在我的设置中,对于prometheus-adapter的正确值是什么?
下面是的helm图表值:https://github.com/helm/charts/blob/master/stable/prometheus/values.yaml 我能把这件事搞定: 为了做到这一点,我必须做: 我相信有一种更好、更恰当的方法可以使用和来实现这一点。我尝试了类似以下的事情,但没有运气: 我希望证书神奇地出现在上,但它们没有出现。 我假设我不需要克隆整个repo和手动编辑hel
我使用Spring-Boot2.0.0并尝试公开/acturet/prometheusendpoint。我启用了所有web管理endpoint,但只有prometheusendpoint未公开。有什么帮助吗?
我试图用操作符在新的k8s集群中创建普罗米修斯我使用以下文件, 我正在创建名称空间监视 应用此文件,该文件工作正常 现在我想应用这个文件(CRD)