kubernetesr进阶之污点和容忍之基于污点的驱逐

NoExecute的污点效果，将对已经运行在节点上的 Pod 施加如下影响：

不容忍该污点的 Pod 将立刻被驱逐
容忍该污点的 Pod 在未指定 tolerationSeconds 的情况下，将继续在该节点上运行
容忍该污点的 Pod 在指定了 tolerationSeconds 的情况下，将在指定时间超过时从节点上驱逐

tolerationSeconds 字段可以理解为 Pod 容忍该污点的 耐心：

超过指定的时间，则达到 Pod 忍耐的极限，Pod 离开所在节点
不指定 tolerationSeconds，则认为 Pod 对该污点的容忍是无期限的

此外，自 kubernetes 1.6 以来，kubernetes 的节点控制器在碰到某些特定的条件时，将自动为节点添加污点。这类污点有：

node.kubernetes.io/not-ready：节点未就绪。对应着 NodeCondition Ready 为 False 的情况
node.kubernetes.io/unreachable：节点不可触达。对应着 NodeCondition Ready 为 Unknown 的情况
node.kubernetes.io/out-of-disk：节点磁盘空间已满
node.kubernetes.io/memory-pressure：节点内存吃紧
node.kubernetes.io/disk-pressure：节点磁盘吃紧
node.kubernetes.io/network-unavailable：节点网络不可用
node.kubernetes.io/unschedulable：节点不可调度
node.cloudprovider.kubernetes.io/uninitialized：如果 kubelet 是由 "外部" 云服务商启动的，该污点用来标识某个节点当前为不可用的状态。在“云控制器”（cloud-controller-manager）初始化这个节点以后，kubelet将此污点移除

自 kubernetes 1.13 开始，上述特性被默认启用。

例如，某一个包含了大量本地状态的应用，在网络断开时，可能仍然想要在节点上停留比较长的时间，以等待网络能够恢复，而避免从节点上驱逐。此时，该 Pod 的容忍可能如下所示：

代码语言：javascript复制

 tolerations:
 - key: "node.kubernetes.io/unreachable"
   operator: "Exists"
   effect: "NoExecute"
   tolerationSeconds: 6000

如果 Pod 没有 node.kubernetes.io/not-ready 容忍， Kubernetes 将自动为 Pod 添加一个 tolerationSeconds=300 的 node.kubernetes.io/not-ready 容忍。同样的，如果 Pod 没有 node.kubernetes.io/unreachable 容忍，Kubernetes 将自动为 Pod 添加一个 tolerationSeconds=300 的 node.kubernetes.io/unreachable 容忍

这类自动添加的容忍确保了 Pod 在节点发生 not-ready 和 unreachable 问题时，仍然在节点上保留 5 分钟。

DaemonSet Pod 相对特殊一些，他们在创建时就添加了不带 tolerationSeconds 的 NoExecute 效果的容忍，适用的污点有：

node.kubernetes.io/unreachable
node.kubernetes.io/not-ready

这将确保 DaemonSet Pod 始终不会被驱逐。

磁盘内存网络 kubernetes io

2 人点赞