问题：

"nslookup： read：连接拒绝"从库伯内特斯（K8S）集群中的吊舱内（DNS问题）

方博

2023-03-14

我在基于Centos 7的AWS ec2上自定义安装了k8s群集，其中有1个主节点和1个节点。当调用例如nslookup google.com时，它在节点吊舱内部使用核心DNS（吊舱运行正常，日志中没有错误）。输出为nslookup:write to'10.96.0.10'：连接被拒绝；；连接超时；无法访问任何服务器

例如，在pod内部pingping 8.8.8.8可以正常工作：

PING 8.8.8.8 (8.8.8.8): 56 data bytes
64 bytes from 8.8.8.8: seq=0 ttl=50 time=1.330 ms

/etc/resolv.conf在一个Pod中，它看起来像：

nameserver 10.96.0.10
search default.svc.cluster.local svc.cluster.local cluster.local ec2.internal
options ndots:5

此命令在节点本身运行良好nslookup google.com：

Server:         172.31.0.2
Address:        172.31.0.2#53

Non-authoritative answer:
Name:   google.com
Address: 172.217.15.110
Name:   google.com
Address: 2607:f8b0:4004:801::200e

Kubelet配置kubectl获取配置映射Kubelet-config-1.17-n kube系统-o yaml返回

data:
  kubelet: |
    apiVersion: kubelet.config.k8s.io/v1beta1
    authentication:
      anonymous:
        enabled: false
      webhook:
        cacheTTL: 0s
        enabled: true
      x509:
        clientCAFile: /etc/kubernetes/pki/ca.crt
    authorization:
      mode: Webhook
      webhook:
        cacheAuthorizedTTL: 0s
        cacheUnauthorizedTTL: 0s
    clusterDNS:
    - 10.96.0.10
    clusterDomain: cluster.local
    cpuManagerReconcilePeriod: 0s
    evictionPressureTransitionPeriod: 0s
    fileCheckFrequency: 0s
    healthzBindAddress: 127.0.0.1
    healthzPort: 10248
    httpCheckFrequency: 0s
    imageMinimumGCAge: 0s
    kind: KubeletConfiguration
    nodeStatusReportFrequency: 0s
    nodeStatusUpdateFrequency: 0s
    rotateCertificates: true
    runtimeRequestTimeout: 0s
    staticPodPath: /etc/kubernetes/manifests
    streamingConnectionIdleTimeout: 0s
    syncFrequency: 0s
    volumeStatsAggPeriod: 0s
kind: ConfigMap

kube命名空间中的Podskubectl获取Pods-n kube系统如下所示：

coredns-6955765f44-qdbgx                                1/1     Running   6          11d
coredns-6955765f44-r4v7n                                1/1     Running   6          11d
etcd-ip-172-31-42-121.ec2.internal                      1/1     Running   7          11d
kube-apiserver-ip-172-31-42-121.ec2.internal            1/1     Running   7          11d
kube-controller-manager-ip-172-31-42-121.ec2.internal   1/1     Running   6          11d
kube-proxy-lrpd9                                        1/1     Running   6          11d
kube-proxy-z55cv                                        1/1     Running   6          11d
kube-scheduler-ip-172-31-42-121.ec2.internal            1/1     Running   6          11d
weave-net-bdn5n                                         2/2     Running   0          39h
weave-net-z7mks                                         2/2     Running   5          39h

从pod中，如果我执行ip路由，它将返回：

default via 10.32.0.1 dev eth0 
10.32.0.0/12 dev eth0 scope link  src 10.32.0.16

来自master：

default via 172.31.32.1 dev eth0 
10.32.0.0/12 dev weave proto kernel scope link src 10.32.0.1 
172.17.0.0/16 dev docker0 proto kernel scope link src 172.17.0.1 
172.31.32.0/20 dev eth0 proto kernel scope link src 172.31.42.121

从节点：

default via 172.31.32.1 dev eth0 
10.32.0.0/12 dev weave proto kernel scope link src 10.32.0.1 
172.17.0.0/16 dev docker0 proto kernel scope link src 172.17.0.1 
172.31.32.0/20 dev eth0 proto kernel scope link src 172.31.46.62

CoreDNS configmapkubectl-n kube系统获取配置映射CoreDNS-oyaml是：

apiVersion: v1
data:
  Corefile: |
    .:53 {
        log
        errors
        health {
           lameduck 5s
        }
        ready
        kubernetes cluster.local in-addr.arpa ip6.arpa {
           pods insecure
           fallthrough in-addr.arpa ip6.arpa
           ttl 30
        }
        prometheus :9153
        forward . /etc/resolv.conf
        cache 30
        loop
        reload
        loadbalance
    }
kind: ConfigMap

那么为什么nslookup google.com不能在一个pod中工作呢？？

共有1个答案

公孙宇

2023-03-14

k8s集群的安装是错误的，一个可行的脚本应该包含正确的主IP和ec2虚拟机上的节点。

dev-kubernetes-master ansible_host=34.233.207.xxx private_ip=172.31.37.xx
dev-kubernetes-slave ansible_host=52.6.10.xxx private_ip=172.31.42.xxx

我已经用指定的正确的私有ip重新安装了集群（在根本没有私有ip之前），问题已经解决了。

类似资料：

DNS插件库伯内特斯CentOS 7集群

我一直在努力让DNS插件在CentOS 7.2集群上工作。我使用以下说明安装了群集：http://severalnines.com/blog/installing-kubernetes-cluster-minions-centos7-manage-pods-services 在此配置中，主服务器正在运行：etcd、库贝-调度器、库贝-apiserver和库贝-控制器-管理器。这些节点正在运行：do
库伯内特斯：无法访问法兰绒吊舱

我是库伯内特斯的新手。我已经在Oracle虚拟盒管理器上设置了3个Ubuntu 20.04.2 LTS虚拟机。根据以下文档，我已经在所有3个虚拟机中安装了docker、kubelet、kubeadm和kubectl https://kubernetes.io/docs/setup/production-environment/tools/kubeadm/install-kubeadm/ 我使用以
库伯内特斯的吊舱没有出站网络

我正在VM中运行一个单节点Kubernetes集群，用于开发和测试。我使用Rancher Kubernetes引擎（RKE，Kubernetes版本1.18）部署它，并使用MetalLB启用LoadBalancer服务类型。Traefik是2.2版，通过官方掌舵图部署(https://github.com/containous/traefik-helm-chart)。我部署了几个虚拟容器来测试设置
库伯内特斯-通过Terraform升级库伯内特斯集群版本

我假设没有愚蠢的问题，所以这里有一个我找不到直接答案的问题。现在的情况我目前有一个运行1.15的Kubernetes集群。AKS上的x，通过Terraform部署和管理。AKS最近宣布Azure将在AKS上停用Kubernetes的1.15版本，我需要将集群升级到1.16或更高版本。现在，据我所知，直接在Azure中升级集群不会对集群的内容产生任何影响，即节点、豆荚、秘密和当前在那里的所有其他
库伯内特斯OOM杀人舱

我有一个简单的容器，它由安装在阿尔卑斯山上的OpenLDAP组成。它被安装为以非root用户身份运行。我能够使用我的本地Docker引擎运行容器而没有任何问题。但是，当我将其部署到我们的库伯内特斯系统时，它几乎立即被OOMKill杀死。我尝试在没有任何更改的情况下增加内存。我还查看了pod的内存使用情况，没有发现任何异常。服务器启动为slapd-d debug-hldap://0.0.0.0:1
库伯内特斯的热舱重组

我已经在Kubernetes上部署了Prometheus，并提供了配置文件作为配置映射资源。该文件作为卷装入普罗米修斯吊舱中。在集群中更改配置映射后，我用一个空POST请求点击Prometheus服务器endpoint，以便重新加载它（如文档中所述）然而，当我对配置映射进行更改并重新部署它时，我会经历大约30秒的“滞后”，直到prometheus.yml文件在pod中更新。我在这里读到，这是

"nslookup： read：连接拒绝"从库伯内特斯（K8S）集群中的吊舱内（DNS问题）

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档