问题：

普罗米修斯在GKE中没有收到来自cadvisor的度量

鲜于峰

2023-03-14

嘿，

null

    - job_name: kubernetes-cadvisor
      honor_timestamps: true
      scrape_interval: 15s
      scrape_timeout: 10s
      metrics_path: /metrics/cadvisor
      scheme: https
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        insecure_skip_verify: true
      kubernetes_sd_configs:
      - role: node
      relabel_configs:
        - action: labelmap
          regex: __meta_kubernetes_node_label_(.+)

如果有人有经验得到这个配置，我肯定会感谢一些帮助调试。

干杯

共有1个答案

葛深

2023-03-14

我能够挖掘一个博客，其中有一个对我有效的示例配置。cadvisor（和kubelet）度量标准的GKEendpoint不同于文档示例中的标准endpoint。以下是我在普罗米修斯工作中的一段摘录：

    - job_name: kubernetes-cadvisor
      honor_timestamps: true
      scrape_interval: 15s
      scrape_timeout: 10s
      metrics_path: /metrics/cadvisor
      scheme: https
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        insecure_skip_verify: true
      kubernetes_sd_configs:
      - role: node
      relabel_configs:
        - action: labelmap
          regex: __meta_kubernetes_node_label_(.+)
        - target_label: __address__
          replacement: kubernetes.default.svc.cluster.local:443
        - source_labels: [__meta_kubernetes_node_name]
          regex: (.+)
          target_label: __metrics_path__
          replacement: /api/v1/nodes/${1}/proxy/metrics/cadvisor
    - job_name: kubernetes-kubelet
      honor_timestamps: true
      scrape_interval: 15s
      scrape_timeout: 10s
      metrics_path: /metrics
      scheme: https
      bearer_token_file: /var/run/secrets/kubernetes.io/serviceaccount/token
      tls_config:
        ca_file: /var/run/secrets/kubernetes.io/serviceaccount/ca.crt
        insecure_skip_verify: true
      kubernetes_sd_configs:
      - role: node
      relabel_configs:
      - action: labelmap
        regex: __meta_kubernetes_node_label_(.+)
      - target_label: __address__
        replacement: kubernetes.default.svc.cluster.local:443
      - target_label: __metrics_path__
        source_labels: [__meta_kubernetes_node_name]
        regex: (.+)
        replacement: /api/v1/nodes/${1}/proxy/metrics

编辑：这里有博客文章的链接->https://medium.com/htc-research-engineering-blog/monitoring-kubernetes-clusters-with-grafana-e2a413febefd。

类似资料：

GKE与普罗米修斯监测

我有一个启用了监视和日志记录的GKE集群（1.15）。到目前为止，我们一直使用metrics-server对StackDriver进行度量监控。对于其他自定义度量标准，我们使用了自定义度量标准适配器，该适配器使用Prometheus-to-SD将度量标准刮取并导出到stackdriver。我想开始看看prometheus是否能给我们提供其他功能，比如HPA的聚合度量。在GCP marketpl
普罗米修斯添加自定义度量
普罗米修斯没有公开所有收集的指标

我已经配置了普罗米修斯来获取一些来源的指标。 cadvisor 问题是。在Prometheus UI中，我可以看到所有的目标，在图形中，我可以查询所有与nodejs相关的指标。但是如果我做，我只看到与普罗米修斯和节点出口商相关的指标。没有任何与nodejs应用程序或hazelcast相关的内容。直接请求nodejs应用程序毫无问题地返回所有这些值。什么会导致这样的问题？
普罗米修斯度量-用于自动缩放

我已经设置了prometheus从我的豆荚和节点中收集度量。我还设置了prometheus自定义度量适配器。我如何使用普罗米修斯提供的那些度量来自动缩放我的吊舱？我试着谷歌它，但我只找到自定义的pods在他们的/metrics URL上提供他们的度量。我想能够自动缩放任何我的豆荚，已经有一个普罗米修斯度量基于cpu或内存使用。我可以在grafana中可视化我所有的豆荚和节点的所有度量，但无法找
普罗米修斯-Kubernetes RBAC

我将我的GKE API服务器升级到1.6，并正在将节点升级到1.6，但遇到了一个障碍... 我有一个prometheus服务器（版本1.5.2)，运行在一个由Kubernetes部署管理的pod中，其中两个节点运行版本1.5.4Kubelet，一个新节点运行版本1.6。但普罗米修斯仍然得到401。更新：就像乔丹所说的kubernetes认证问题。在这里看到新的、更集中的问题；https://s
如何在普罗米修斯中创建自定义度量？

我正在建立一个监控PoC以备将来的需要。PoC是在我的电脑上本地开发的。我使用普罗米修斯和格拉法纳来监视度量。我想统计一下收到的文件数量和处理文件所花费的时间。为此，我需要创建自定义度量。我使用的是Python2.7.5。现在我已经把普罗米修斯和目标联系起来了。我收到度量标准，但不知道如何创建我想要的度量标准。我希望收到的文件和“计数收到的文件数”度量。处理一个文件所花费的时间（即2s)和处理

普罗米修斯在GKE中没有收到来自cadvisor的度量

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档