当前位置: 首页 > 知识库问答 >
问题:

Kubernetes prometheus运行吊舱和节点的度量?

姜玉泽
2023-03-14

我已经设置了普罗米修斯,通过跟踪普罗米修斯留档来监控库本内斯的指标。

普罗米修斯现在有很多有用的指标。

但是,我看不到任何引用我的pod或节点状态的指标。

理想情况下-我希望能够绘制pod状态(运行,挂起,CrashLoopBackoff,错误)和节点(NodeNow,就绪)。

这个度量单位在哪里?如果没有,我可以添加到某个地方吗?怎么做?

共有3个答案

古棋
2023-03-14

我发现我可以使用heapster监控这些指标

司徒炎彬
2023-03-14

我认为不存在这样的指标。

您必须修改源代码才能添加它们。查看此文件,了解如何注册度量:https://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/metrics/metrics.go,并查看这一行,了解如何记录度量:https://github.com/kubernetes/kubernetes/blob/master/pkg/kubelet/pleg/generic.go#L180

乌灿
2023-03-14

常规kubernetes设置不会公开这些指标——此处进一步讨论。

但是,可以使用另一个服务来收集这些群集级别的度量:https://github.com/kubernetes/kube-state-metrics.

这目前提供了节点状态就绪和pod容器重启,听起来像我想要的。

 类似资料:
  • 我有一个后端nodeJS应用程序运行在kubernetes集群。现在我想运行两个cron作业计划每个月。cron作业在一个JS文件中。如何使用库伯内特斯创建一个作业,在每个月运行该服务的pod中运行这些JS文件? 此链接提供了对其工作原理的基本理解,但我对如何为特定服务和特定Pod运行它有点困惑 https://kubernetes.io/docs/concepts/workloads/contr

  • 如何强制调度器以循环方式在节点上运行pod,以便如果任何节点宕机,那么至少有一个节点将NGINX pod处于运行模式。 这到底有没有可能?如果可能,我们如何实现这一场景?

  • 我创建了一个kubernetes集群进行测试。但不能创建RC。我得到错误:

  • 我已经设置了ingress nginx Helm图表来在集群上设置ingress控制器,但是默认情况下它只运行一个pod实例。 由于我们在Digital Ocean的k8s群集上运行,因此我们使用externalTrafficPolicy:Local来允许cert manager在内部访问其他POD,因此我们的请求网络跳数更少。 为了获得弹性,我们已将后端服务配置为至少在2个节点上运行,因此我们在

  • 我已经在节点(node1)上的pod(pod1)上部署了一个Spring Boot应用程序。我还在不同节点(node2)上的另一个pod(pod2)上部署了JMeter。我试图从POD2执行自动负载测试。为了执行负载测试,我要求为每个测试用例重新启动pod1。如何从POD2重新启动pod1?

  • 这个问题的答案是(Kubernetes会在主节点上运行Docker容器吗?)建议确实可以在主节点上运行用户吊舱--但没有解决是否存在与允许这样做相关的任何问题。 到目前为止,我能找到的唯一信息表明,允许这样做可能存在相关问题,那就是主节点上的吊舱通信不安全(请参见http://kubernetes.io/docs/admin/master-node-communication/和https://g