问题：

为什么普罗米修斯操作员无法启动

令狐嘉禧

2023-03-14

我试图用操作符在新的k8s集群中创建普罗米修斯我使用以下文件，

我正在创建名称空间监视
应用此文件，该文件工作正常


apiVersion: apps/v1beta2
kind: Deployment
metadata:
  labels:
    k8s-app: prometheus-operator
  name: prometheus-operator
  namespace: monitoring
spec:
  replicas: 2
  selector:
    matchLabels:
      k8s-app: prometheus-operator
  template:
    metadata:
      labels:
        k8s-app: prometheus-operator
    spec:
      priorityClassName: "operator-critical"
      tolerations:
      - key: "WorkGroup"
        operator: "Equal"
        value: "operator"
        effect: "NoSchedule"
      - key: "WorkGroup"
        operator: "Equal"
        value: "operator"
        effect: "NoExecute"
      containers:
      - args:
        - --kubelet-service=kube-system/kubelet
        - --logtostderr=true
        - --config-reloader-image=quay.io/coreos/configmap-reload:v0.0.1
        - --prometheus-config-reloader=quay.io/coreos/prometheus-config-reloader:v0.29.0
        image: quay.io/coreos/prometheus-operator:v0.29.0
        name: prometheus-operator
        ports:
        - containerPort: 8080
          name: http
        securityContext:
          allowPrivilegeEscalation: false
          readOnlyRootFilesystem: true
      nodeSelector:
      serviceAccountName: prometheus-operator

现在我想应用这个文件(CRD)

apiVersion: monitoring.coreos.com/v1
kind: Prometheus
metadata:
  name: prometheus
  namespace: monitoring
  labels: 
    prometheus: prometheus
spec:
  replica: 1
  priorityClassName: "operator-critical"
  serviceAccountName: prometheus
  nodeSelector:
        worker.garden.sapcloud.io/group: operator
  serviceMonitorNamespaceSelector: {}
  serviceMonitorSelector:
    matchLabels:
      role: observeable
  tolerations:
  - key: "WorkGroup"
    operator: "Equal"
    value: "operator"
    effect: "NoSchedule"
  - key: "WorkGroup"
    operator: "Equal"
    value: "operator"
    effect: "NoExecute"

共有1个答案

慕鹏

2023-03-14

您正在尝试引用操作符关键优先级类。优先级类决定吊舱的优先级及其资源分配。

要解决此问题，您可以删除这两个文件中的显式优先级类(priorityclassname:“operator-critical”)，或者创建operator-critic类：

apiVersion: scheduling.k8s.io/v1beta1
kind: PriorityClass
metadata:
  name: operator-critical
value: 1000000
globalDefault: false
description: "Critical operator workloads"

类似资料：

普罗米修斯适配器使用的正确的普罗米修斯URL是什么

null 使用默认配置和轻微的定制。我可以访问prometheus、grafana和alertmanager，查询度量标准并查看精美的图表。但是prometheus-adapter在启动时不断抱怨它不能访问/发现度量：在我的设置中，对于prometheus-adapter的正确值是什么？
普罗米修斯-Kubernetes RBAC

我将我的GKE API服务器升级到1.6，并正在将节点升级到1.6，但遇到了一个障碍... 我有一个prometheus服务器（版本1.5.2)，运行在一个由Kubernetes部署管理的pod中，其中两个节点运行版本1.5.4Kubelet，一个新节点运行版本1.6。但普罗米修斯仍然得到401。更新：就像乔丹所说的kubernetes认证问题。在这里看到新的、更集中的问题；https://s
普罗米修斯json指标

我要监控的应用程序为健康检查提供了一个apiendpoint，该endpoint使用json中的指标进行响应。例如：我已经设置了Prometheus blackbox\u exporter，以监视此endpoint是否返回200 Ok，但理想情况下，我也希望获得这些指标。我知道instrumentation直接从应用程序导出这些数据。但是，由于应用程序已经在导出json对象中我想要的内容，我更希
Openshift 4.4-普罗米修斯无法看到度量

oc版本：客户端版本:4.4.3服务器版本:4.4.3 Kubernetes版本:V1.17.1 图片:quay.io/openshift-release-dev/ocp-v4.0-art-dev@sha256:6a5398997bd7ccddd8d0be0f0f2d9dcae8dddc01d54e6877437f07397c273048 在其他吊舱上没有任何错误，只在普罗米修斯操作员吊舱日志中
GKE与普罗米修斯监测

我有一个启用了监视和日志记录的GKE集群（1.15）。到目前为止，我们一直使用metrics-server对StackDriver进行度量监控。对于其他自定义度量标准，我们使用了自定义度量标准适配器，该适配器使用Prometheus-to-SD将度量标准刮取并导出到stackdriver。我想开始看看prometheus是否能给我们提供其他功能，比如HPA的聚合度量。在GCP marketpl
普罗米修斯中的齐普金痕迹

关于整合齐普金和普罗米修斯的可能性的小问题。目前，我们已经有了一个完全可用的Zipkin实例，以及它的web UI。Zipkin超级酷，一切都很好。我们能够让所有微服务向Zipkin发送跟踪信息，并让Zipkin汇总这些信息。我们还可以在UI中搜索痕迹等等，超级酷。另一方面，我们也有一个非常成熟的经过实战检验的Prometheus Grafana，其中已经包含了容器级指标、应用程序级指标和

为什么普罗米修斯操作员无法启动

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档