本篇文章整理了近期(7.19-7.25)社区用户们在使用Kube-OVN时遇到的一些问题,并附相应问题的解决方案,希望能对社区的其他用户有所帮助。
01
kube-ovn-cni 启动时显示 iptables 命令错误
代码语言:javascript复制iptables v1.8.4 (nf_tables): CHAIN_UPDATE failed (Operation not supported); chain FORWARD
解答:
1.7.1 版本存在的 bug,在主机上不存在 nftables 时,尝试打开 nftables FORWARD 规则失败,可以尝试 v1.7.1-x86 版本修复当前问题
02
使用用户自定义 VPC 后相同 Namespace 下的
Pod 之间无法通过 DNS 域名进行访问
解答:
目前的 CoreDNS 部署在默认 VPC 下,和用户自定义 VPC 隔离,用户自定义 VPC 内的 Pod 无法访问到 CoreDNS 无法进行域名解析,请关注后续版本将会解决该问题
03
先删 VPC 后删子网会导致子网删除一直卡死
代码语言:javascript复制E0723 04:46:53.357382 1 subnet.go:139] error syncing 'net2': vpc.kubeovn.io "test-vpc-2" not found, requeuing
解答:
VPC 相关的 Bug 会在后续版本解决
04
多网卡情况下,使用 Kube-OVN 分配的附属网卡
IP 在删除 Pod 后,该分配的 IP 不会从 IP 列表中
删除
解答:
https://github.com/kubeovn/kube-ovn/issues/943
记录 issue 后续会继续跟进
05
使用最新版本 CNI kubelet 显示报错
代码语言:javascript复制failed to set up pod "ngiinx-test_default" network: no converter for CNI rresult versiion 1.0.0 to , failed to clean up sandbox container
解答:
Kube-OVN 目前支持到 0.8.7 版本的 CNI,需要配套 CNI 插件兼容当前版本
06
1.7.1 版本做卸载运行 clean 脚本,会导致主机
网络失联
解答:
单网卡情况下,ip 会从物理网卡转移到 br-provider 上,卸载时会导致主机没有可用 IP,后续版本将会修复该问题
07
1.7.0 版本子网可用 IP 在有多个保留 IP 段时显
示数量有问题
解答:
1.7.1 版本已修复该问题,可以升级后重新查看
08
1.7.0 升级 1.7.1 的方法
解答:
直接替换镜像的方式会存在问题,升级脚本正在开发中
09
ovn-default 子网是否可以更改配置
解答:
default 子网使用方式和用户自定义子网使用方式一致,可以修改网关类型,NAT 类型等参数
10
使用 Vlan 网络,当扩容节点与现有节点不在同
一个机房,一般情况下处于vlan的ovn-default
在另一个机房无法路由,这样似乎就没办法扩
容了
解答:
对于底层物理网络存在分区的情况下建议给 Node 打上对应网络区域的 label,调度时按照区域进行部署,避免 Pod 部署在和所需网络不一致的区域
11
在 Underlay 模式下使用 NodeLocalDNS 解析
域名超时
解答:
Underlay 模式下数据包的转发不经过本机的网络栈,无法直接访问到本机的 NodeLocalDNS 地址,建议使用 SVC IP 或者结合固定 IP 直连 CoreDNS
12
IP 的 CRD,能不能创建一个空的,只为 IP 占用。
创建 Pod、Deployment时指定 IP 这个 CRD 的
某些 IP 用来保证 IP 不会被占用
解答:
目前可以先把这些 IP 放入 Subnet 的 exclude_ips 字段,保证不会被随机分配占用
13
kube-ovn采用hybrid模式部署,之后定义了一个
vlan与宿主机同一子网之后,vlan命名空间下的
pod可以与宿主机(以及与宿主机同一子网的其
它主机)通讯,也可以上网。default命名空间下
的pod可以上网,但是无法与宿主机以及与宿主
机同一子网的其它主机)通讯了。删除vlan后,
default命名空间下的pod才可以与宿主机通讯。
解答:
Underlay 模式的子网错误的加入了 ipset 列表进行了 nat 的映射,1.7.1-x86 版本中已修复该问题
14
OpenStack 的 vm 使用 Underlay 模式 Pod 创建
失败,describe pod 显示 network not ready
after 200 ping
解答:
OpenStack 需要关闭 portsecurity 放行 underlay 流量