今天的文章继续聊聊有关Service Mesh微服务架构的话题,如果对之前的聊过的话题还不了解,可以参考文末的推荐阅读。今天要聊的话题是:如何在Service Mesh微服务架构中实现“金丝雀发布”?
什么是金丝雀发布
既然要聊具体的实现,那么在开始之前,先科普下什么是“金丝雀发布”。金丝雀发布也叫“灰度发布”,具体来说就是在发布线上版本时,先将少量的生产流量打到服务的新版本,以验证新版本的准确性和可靠性,待发布的新版本得到线上流量的全面验证后,在逐步将所有流量放入新版本,以实现生产服务版本的稳定更新。
为什么叫金丝雀发布呢,是因为金丝雀对矿场中的毒气比较敏感,所以在矿场开工前工人们会放一只金丝雀进去,以验证矿场是否存在毒气,这便是金丝雀发布名称的由来。
在不同技术栈场景中,金丝雀发布的实现方式也不尽相同:有通过nginx实现的、也有借助A/B测试实现的。而随着以Kubernetes为代表的云原生基础设施的普及,金丝雀发布作为一项基本的服务发布功能,其实现方式也有了一些新的趋势——那就是逐步与云原生基础设施融为一体,成为基础设施服务的一部分。
Kubernetes中的金丝雀(灰度)发布
接下来,先看看在Kubernetes中是如何实现版本更新的。以下内容假设你已经有了一套可用的Kubernetes环境,如果没有可以查看文末推荐阅读的文章链接,参考相关分享自行部署。
1.滚动更新
在介绍Kubernetes中的金丝雀(灰度)发布之前,先来了解下Kubernetes中最重要的应用部署方式——“滚动升级”。
所谓“滚动升级”:是指当更新了Kubernetes中Deployment编排资源的Pod模版(例如更新镜像版本号)之后,Deployment就需要遵循一种叫做“滚动更新(rolling update)”的方式,来升级现有的容器,从而实现应用对外服务的“不中断更新部署”。Kubernetes实现“滚动升级”的示意图如下:
如上图所示,滚动升级的过程为:
1)当容器开始升级时,集群中会先启动一个新版本的Pod,并终止一个旧版本的Pod。
2)如果此时,新版本的Pod有问题启动不了,那么“滚动升级”就会停止,并允许开发和运维人员介入。而在这个过程中,由于应用本身还有两个旧版本的Pod在线,所以服务并不会受到太大的影响。
3)而如果新版本的Pod启动成功,且服务访问正常,则继续滚动升级,直至按照Deployment编排器设置的副本数量,完成后续旧版本Pod的升级。
在Kubernetes中Deployment还可以通过相应地“滚动升级”策略,来控制Pod的滚动升级行为,以进一步保证服务的连续性。例如:“在任何时间窗口内,只有指定比例的Pod处于离线状态;在任何时间窗口内,只有指定比例的新Pod被创建出来"。可以通过相应地控制参数进行设置,如下:
代码语言:javascript复制...
spec:
selector:
matchLabels:
app: micro-api
replicas:
#设置滚动升级策略
#Kubernetes在等待设置的时间后才开始进行升级,例如5秒
minReadySeconds:
strategy:
type: RollingUpdate
rollingUpdate:
#升级过程中最多可以比原先设置多出的Pod数量
maxSurge:
#升级过程中Deployment控制器最多可以删除多少个旧Pod,主要用于提供缓冲时间
maxUnavailable:
...
在上面RollingUpdate Strategy(滚动升级策略)的配置中:
- maxSurge:指定的是,除了设定的Pod副本数量之外,在一次“滚动”中,Deployment控制器还可以创建多少个新的Pod。
- maxUnavailable:指的是,在一次“滚动”中,Deployment控制器可以删除多少个旧Pod。
通过这种精确的“滚动升级”策略,可以使得Kubernetes服务版本发布的过程更加平滑。此外,这两个配置还可以通过百分比的方式来表示,比如“maxUnavailable=50%”,指的是Deployment控制器最多可以一次删除“50%*设定Pod副本数”个Pod。
接下来具体演示下在Kubernetes中进行服务滚动升级的详细过程。
使用的示例代码说明:
本文及本公众号之前或之后与Service Mesh(服务网格、Istio)技术相关的分享,均使用《干货|如何步入Service Mesh微服务架构时代》、《实战|Service Mesh微服务架构实现服务间gRPC通信》这两篇文章所展示的项目。
该项目以Spring Boot编写的Java服务为主,在体验上更接近真实的项目开发场景。项目的结构如下:
该项目所在的GitHub地址为:
代码语言:javascript复制https://github.com/manongwudi/istio-micro-service-demo
“滚动升级”演示:
这里先借助示例项目中的“micro-api”服务来演示其在Kubernetes中进行“滚动升级”的过程,步骤如下:
(1)首先准备“micro-api”服务的k8s发布文件(如:micro-api.yaml)。代码如下:
代码语言:javascript复制apiVersion: v1
kind: Service
metadata:
name: micro-api
spec:
type: ClusterIP
ports:
- name: http
port: 19090
targetPort: 9090
selector:
app: micro-api
---
apiVersion: apps/v1
kind: Deployment
metadata:
name: micro-api
spec:
selector:
matchLabels:
app: micro-api
replicas: 3
#设置滚动升级策略
#Kubernetes在等待设置的时间后才开始进行升级,例如5秒
minReadySeconds: 5
strategy:
type: RollingUpdate
rollingUpdate:
#升级过程中最多可以比原先设置多出的Pod数量
maxSurge: 1
#升级过程中Deployment控制器最多可以删除多少个旧Pod
maxUnavailable: 1
template:
metadata:
labels:
app: micro-api
spec:
#设置的阿里云私有镜像仓库登陆信息的secret(对应2.1.2的设置)
imagePullSecrets:
- name: regcred
containers:
- name: micro-api
image: registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.0-SNAPSHOT
imagePullPolicy: Always
tty: true
ports:
- name: http
protocol: TCP
containerPort: 19090
上述部署文件设置了“micro-api”服务的Pod副本个数为“3”,并且设置了相应地滚动升级策略。
(2)接下来执行k8s部署命令如下:
代码语言:javascript复制$ kubectl apply -f micro-api.yaml
成功后,查看Deployment创建后的状态信息,命令效果如下:
代码语言:javascript复制$ kubectl get deployments
NAME READY UP-TO-DATE AVAILABLE AGE
micro-api / d
从上述命令的返回结果中,可以看到三个状态字段,它们的含义如下所示:
- READY:表示用户期望的Pod副本个数,以及当前处于Running状态的Pod个数。
- UP-TO-DATE:当前处于最新版本的Pod个数。所谓最新版本,指的是Pod的Spec部分与Deployment中Pod模版里定义的完全一致。
- AVAILABLE:当前已经可用的Pod的个数——既是Running状态,又是最新版本,并且已经处于Ready(监控检查正确)状态的Pod个数。
(3)模拟服务版本升级,触发滚动升级。
接下来重新构建“micro-api”服务的版本,并将其上传至私有镜像仓库。之后,通过命令修改“micro-api”的Deployment所使用的镜像,并触发滚动升级。
修改Deployment所使用的镜像的命令如下:
代码语言:javascript复制$ kubectl set image deployment/micro-api micro-api=registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.1-SNAPSHOT
deployment.apps/micro-api image updated
这里使用了“kubectl set image”指令,主要是为了方便操作,也可以直接在k8s部署文件中进行镜像版本的修改。
修改完Deployment的镜像版本后,Kubernetes会立即触发“滚动升级”的过程。可以通过“kubectl rollout status”指令来查看Deployment资源的状态变化。具体如下:
代码语言:javascript复制$ kubectl rollout status deployment/micro-api
Waiting for deployment "micro-api" rollout to finish: out of new replicas have been updated...
Waiting for deployment "micro-api" rollout to finish: out of new replicas have been updated...
Waiting for deployment "micro-api" rollout to finish: out of new replicas have been updated...
Waiting for deployment "micro-api" rollout to finish: of updated replicas are available...
Waiting for deployment "micro-api" rollout to finish: of updated replicas are available...
deployment "micro-api" successfully rolled out
这时,也可以通过查看Deployment的Events,看到这个“滚动升级”的过程。具体如下:
代码语言:javascript复制$ kubectl describe deployment micro-api
...
OldReplicaSets: <none>
NewReplicaSet: micro-api-d745d8649 (/ replicas created)
Events:
Type Reason Age From Message
---- ------ ---- ---- -------
Normal ScalingReplicaSet m deployment-controller Scaled up replica set micro-api-677dd4d5b6 to
Normal ScalingReplicaSet m deployment-controller Scaled down replica set micro-api-57c7cb5b74 to
Normal ScalingReplicaSet m deployment-controller Scaled up replica set micro-api-677dd4d5b6 to
Normal ScalingReplicaSet m1s deployment-controller Scaled down replica set micro-api-677dd4d5b6 to
Normal ScalingReplicaSet m deployment-controller Scaled up replica set micro-api-d745d8649 to
Normal ScalingReplicaSet s deployment-controller Scaled down replica set micro-api-57c7cb5b74 to
Normal ScalingReplicaSet s deployment-controller Scaled up replica set micro-api-d745d8649 to
可以看到,当你修改了Deployment里的Pod定义后,"Deployment Controller"会使用这个修改后的Pod模版,创建一个新的ReplicaSet,这个新的ReplicaSet的初始Pod副本数是:0。
然后在Age=12 m的位置,开始将这个新的ReplicaSet所控制的Pod副本数从0个变成1个。
紧接着,在Age=12 m的位置,又将旧ReplicaSet所控制的Pod副本数减少1个,即“水平收缩”成两个副本。
如此交替进行,新ReplicaSet所管理的Pod的副本数,从0个变成1个,再变成2个,最后变成3个;而旧ReplicaSet所管理的Pod的副本数则从3个变成2个,最后变成0个。
这样,就完成了一组Pod的版本升级过程。而像这样将一个Kubernetes集群中正在运行的多个Pod版本,交替逐一升级的过程,就是“滚动升级”。
2.金丝雀(灰度)发布
前面“1.”小标题中,比较详细的演示了Kubernetes的“滚动升级”的方式,虽然通过滚动升级的方式可以方便、平滑的实现版本更新,但是这个过程,并没有灰度功能。滚动升级的方式,虽然中间有缓冲交替的过程,但这种过程是自动的、迅速的,滚动升级过程结束就相当于直接进行了新版本的全量发布。
而对于需要进行金丝雀(灰度)发布的场景,“滚动升级”的方式很显然是不够用的。那么,在Kubernetes中应该如何结合版本更新做到金丝雀(灰度)发布呢?
具体步骤如下:
(1)编写实现新版本灰度发布的部署文件。
为了实现在Kubernetes中的金丝雀(灰度)发布过程的可观测,我们重新定义下具体的k8s发布文件(如:micro-api-canary.yaml)的内容如下:
代码语言:javascript复制apiVersion: apps/v1
kind: Deployment
metadata:
name: micro-api
spec:
selector:
matchLabels:
app: micro-api
replicas: 3
#设置滚动升级策略
#Kubernetes在等待设置的时间后才开始进行升级,例如5秒
minReadySeconds: 5
strategy:
type: RollingUpdate
rollingUpdate:
#升级过程中最多可以比原先设置多出的Pod数量
maxSurge: 1
#升级过程中Deployment控制器最多可以删除多少个旧Pod,主要用于提供缓冲时间
maxUnavailable: 1
template:
metadata:
labels:
app: micro-api
#增加新的标签(演示k8s的灰度发布)
track: canary
spec:
#设置的阿里云私有镜像仓库登陆信息的secret(对应2.1.2的设置)
imagePullSecrets:
- name: regcred
containers:
- name: micro-api
image: registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.3-SNAPSHOT
imagePullPolicy: Always
tty: true
ports:
- name: http
protocol: TCP
containerPort: 19090
上述发布文件与“1.”小标题中演示滚动升级时,发布文件的内容一致,只是为了方便观察灰度发布过程的实现,这里通过“track: canary”对新发布的Pod版本进行标记。
设置新版本的镜像为:“micro-api:1.3-SNAPSHOT”。并且通过“spec.selector.matchLabels.app:micro-api”与历史版本Pod所对应的Service(micro-api.yaml文件中定义的Service)资源定义匹配。
(2)执行"滚动升级"发布命令,实现“灰度发布”效果。
代码语言:javascript复制$ kubectl apply -f micro-api-canary.yaml && kubectl rollout pause deployment/micro-api
上面通过"kubectl rollout pause"命令实现对Deployment的金丝雀(灰度发布)。执行发布命令之后的运行效果如下:
代码语言:javascript复制$ kubectl get pods --show-labels -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES LABELS
micro-api-57c7cb5b74-mq7m9 1/1 Running 0 6m20s 10.32.0.3 kubernetes <none> <none> app=micro-api,pod-template-hash=57c7cb5b74
micro-api-57c7cb5b74-ptptj 1/1 Running 0 6m20s 10.32.0.4 kubernetes <none> <none> app=micro-api,pod-template-hash=57c7cb5b74
micro-api-7dbb6c5d66-4rbdc 1/1 Running 0 5m33s 10.32.0.6 kubernetes <none> <none> app=micro-api,pod-template-hash=7dbb6c5d66,track=canary
micro-api-7dbb6c5d66-cfk9l 1/1 Running 0 5m33s 10.32.0.5 kubernetes <none> <none> app=micro-api,pod-template-hash=7dbb6c5d66,track=canary
查看Deployment的滚动升级情况,命令如下:
代码语言:javascript复制$ kubectl get deployments
NAME READY UP-TO-DATE AVAILABLE AGE
micro-api 4/3 2 4 194d
可以看到此时“micro-api” ready的数量为4,其中两个旧版本Pod,两个新版本Pod。
(3)接下来进行流量测试。
查询两组Pod版本所对应的Service资源的IP,命令如下:
代码语言:javascript复制# kubectl get svc micro-api
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
micro-api ClusterIP 10.110.169.161 <none> 19090/TCP 194d
接下来,模拟对服务的接口进行批量访问,命令如下:
代码语言:javascript复制$ for i in {1..10}; do curl 10.110.169.161:19090/test/test; done
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
可以看到,此时流量会随机的流向旧版本和新版本(日志标记为V3)的服务。
(4)将服务版本升级为新版本。
如果新版本的服务经过线上流量测试验证没有问题,则可以通过"rollout resume"命令将整体服务的版本升级为新版本。命令如下:
代码语言:javascript复制$ kubectl rollout resume deployment micro-api
deployment.apps/micro-api resumed
升级后的效果如下:
代码语言:javascript复制$ kubectl get pods --show-labels -o wide
NAME READY STATUS RESTARTS AGE IP NODE NOMINATED NODE READINESS GATES LABELS
micro-api-7dbb6c5d66-4rbdc 1/1 Running 0 18m 10.32.0.6 kubernetes <none> <none> app=micro-api,pod-template-hash=7dbb6c5d66,track=canary
micro-api-7dbb6c5d66-bpjtg 1/1 Running 0 84s 10.32.0.3 kubernetes <none> <none> app=micro-api,pod-template-hash=7dbb6c5d66,track=canary
micro-api-7dbb6c5d66-cfk9l 1/1 Running 0 18m 10.32.0.5 kubernetes <none> <none> app=micro-api,pod-template-hash=7dbb6c5d66,track=canary
可以看到,此时目标服务已经通过“滚动升级”的方式完成了全量更新。而如果存在问题,则通过“kubectl rollout undo”命令进行回滚即可!
从上述过程可以看到,Kubernetes中的金丝雀(灰度发布)主要是通过操纵(如:pause)“滚动升级”的过程来实现的——通过发布一定数量的新版本Pod,并利用Service资源类型本身的负载均衡能力来实现流量在新/旧Pod之间的随机交替。
这样的方式虽然已经可以满足一些简单的场景,但是没有办法做到更精准的灰度流量控制。这时候就需要借助 Service Mesh 中的解决方案了,下面我们来看看在 Istio 中如何做到精准流量的金丝雀(灰度)发布。
Istio中的金丝雀(灰度)发布
以下内容默认你已经在Kubernetes中安装了Istio环境,如果还没有安装可以参考《干货|如何步入Service Mesh微服务架构时代》中分享的内容。
Istio与Kubernetes实现金丝雀(灰度)发布的方式不一样,Istio通过Envoy(SideCar)强大的路由规则管理能力,可以非常灵活地控制对应版本的流量占比,从而实现具备精准流量控制能力的金丝雀(灰度)发布功能。
Istio通过Envoy(SideCar)实现金丝雀(灰度)发布的流量路由示意图如下(继续以“micro-api”服务为例):
从上图中可以大致看出,Istio具备强大的流量管理能力,而这种能力对于实现流量精准控制的金丝雀(灰度)发布功能来说,自然是水到渠成的。
具体来说,在Istio中是通过VirtualService(虚拟服务)这种特定的资源在服务网格中实现流量路由的。通过VirtualService可以方便地定义流量路由规则,并在客户端试图连接到服务时应用这些规则,并最终到达目标服务。
接下来,具体演示如何在Istio中通过VirtualService实现金丝雀(灰度)发布。步骤如下:
(1)首先发布一个v1版本的服务。
要在Istio中实现更精准的版本控制,需要在发布Pod资源时,通过明确的“版本标签”进行指定。准备“micro-api”服务v1版本的k8s部署文件(micro-api-canary-istio-v1.yaml):
代码语言:javascript复制apiVersion: v1
kind: Service
metadata:
name: micro-api
spec:
type: ClusterIP
ports:
- name: http
port: 19090
targetPort: 9090
selector:
app: micro-api
---
apiVersion: apps/v1
kind: Deployment
meta data:
name: micro-api-v1
spec:
selector:
matchLabels:
app: micro-api
#这里是关键,需要设置版本标签,以便实现灰度发布
version: v1
replicas: 3
#设置滚动升级策略
#Kubernetes在等待设置的时间后才开始进行升级,例如5秒
minReadySeconds: 5
strategy:
type: RollingUpdate
rollingUpdate:
#升级过程中最多可以比原先设置多出的Pod数量
maxSurge: 1
#升级过程中Deployment控制器最多可以删除多少个旧Pod,主要用于提供缓冲时间
maxUnavailable: 1
template:
metadata:
labels:
app: micro-api
#设置版本标签,便于灰度发布
version: v1
spec:
#设置的阿里云私有镜像仓库登陆信息的secret
imagePullSecrets:
- name: regcred
containers:
- name: micro-api
image: registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.1-SNAPSHOT
imagePullPolicy: Always
tty: true
ports:
- name: http
protocol: TCP
containerPort: 19090
“spec.selector.matchLabels.version:v1”标签用来标注服务的版本,该标签是后续Istio的流量管理规则中,识别服务版本的主要依据。
准备好发布文件后,执行发布命令:
代码语言:javascript复制$ kubectl apply -f micro-api-canary-istio-v1.yaml
此时,一个低版本的服务就运行成功了!接下来我们模拟对其实施金丝雀(灰度)发布。
(2)发布一个v2版本的服务(升级的目标版本)。
与v1版本服务一样,发布的v2版本的服务也需要明确版本标签,其发布文件(micro-api-canary-istio-v2.yaml)的内容如下:
代码语言:javascript复制apiVersion: apps/v1
kind: Deployment
metadata:
name: micro-api-v2
spec:
selector:
matchLabels:
app: micro-api
#设置好版本标签,便于灰度发布
version: v2
replicas: 3
#设置滚动升级策略
#Kubernetes在等待设置的时间后才开始进行升级,例如5秒
minReadySeconds: 5
strategy:
type: RollingUpdate
rollingUpdate:
#升级过程中最多可以比原先设置多出的Pod数量
maxSurge: 1
#升级过程中Deployment控制器最多可以删除多少个旧Pod,主要用于提供缓冲时间
maxUnavailable: 1
template:
metadata:
labels:
app: micro-api
#设置好版本标签,便于灰度发布
version: v2
spec:
#设置的阿里云私有镜像仓库登陆信息的secret
imagePullSecrets:
- name: regcred
containers:
- name: micro-api
image: registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.3-SNAPSHOT
imagePullPolicy: Always
tty: true
ports:
- name: http
protocol: TCP
containerPort: 19090
执行发布命令:
代码语言:javascript复制$ kubectl apply -f micro-api-canary-istio-v2.yaml
deployment.apps/micro-api-v2 created
此时,系统中就存在了两组版本的Pod资源,具体如下:
代码语言:javascript复制# kubectl get pods
NAME READY STATUS RESTARTS AGE
micro-api-v1-565d749dd4-7c66z / Running h
micro-api-v1-565d749dd4-7dqfb / Running h
micro-api-v1-565d749dd4-l62wc / Running h
micro-api-v2-6f98c598c9-5stlw / Running 82s
micro-api-v2-6f98c598c9-f2ntq / Running 82s
micro-api-v2-6f98c598c9-l8g4j / Running 82s
接下来将演示如何利用Istio强大的流量管理功能,来实现流量在这两组版本Pod资源之间的精确控制!
(3)创建Istio网关资源。
在Istio中要实现流量的精确控制,需要将VirtualService绑定到具体的Ingressgateway(入口网关)资源。因此在创建VirtualService资源实现流量路由及控制前,需要创建一个Istio网关。部署文件(micro-gateway.yaml)的内容如下:
代码语言:javascript复制apiVersion: networking.istio.io/v1alpha3
kind: Gateway
metadata:
name: micro-gateway
spec:
selector:
istio: ingressgateway
servers:
- port:
number: 80
name: http
protocol: HTTP
hosts:
- "*"
上述部署文件执行后将创建一个名称为“micro-gateway”的Istio网关,并允许所有主机(hosts:"*"指定)通过该网关。
(4)创建Istio虚拟服务资源VirtualService。
前面提到过在Istio中主要是通过VirtualService(虚拟服务)来实现服务网格内的流量路由及控制。接下来我们看看VirtualService资源的具体创建方式,准备资源文件(如virtual-service-all.yaml),内容如下:
代码语言:javascript复制apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
name: micro-api-route
spec:
#用于定义流量被发送到的目标主机(这里为部署在k8s中的micro-api服务)
hosts:
- micro-api.default.svc.cluster.local
#将VirtualService绑定到Istio网关,通过网关来暴露路由目标
gateways:
- micro-gateway
http:
- route:
#设置旧版本(V1)版本的流量占比为70%
- destination:
host: micro-api.default.svc.cluster.local
subset: v1
#通过权重值来设置流量占比
weight: 70
#设置新版本(V2)版本的流量占比为30%
- destination:
host: micro-api.default.svc.cluster.local
subset: v2
weight: 30
如上所示,VirtualService资源具备针对http的精准流量控制能力,可以将指定占比的流量路由到特定的“subset”指定的版本。而为了实现这一能力,VirtualService资源还需要与Istio网关绑定,通过Istio网关来暴露路由目标。
(5)创建Istio目标路由规则资源。
虚拟服务VirtualService在Istio中主要用于控制流量的行为,而定义流量行为的路由规则则需要通过“DestinationRule”路由规则资源来定义。创建路由规则文件(destination-rule-all.yaml),具体内容如下:
代码语言:javascript复制apiVersion: networking.istio.io/v1alpha3
kind: DestinationRule
metadata:
name: micro-api-destination
spec:
#与Deployment资源对应的Service资源名称关联
host: micro-api
#流量策略设置:负载均衡策略、连接池大小、局部异常检测等,在路由发生后作用于流量
trafficPolicy:
#限流策略
connectionPool:
tcp:
maxConnections: 10
http:
http1MaxPendingRequests: 1
maxRequestsPerConnection: 1
#设置目的地的负债均衡算法
loadBalancer:
simple: ROUND_ROBIN
#目的地指的是不同的子集(subset)或服务版本。通子集(subset),可以识别应用程序的不同版本,以实现流量在不同服务版本之间的切换
subsets:
- name: v1
labels:
version: v1
- name: v2
labels:
version: v2
如上所示,通过subsets属性,定义了VirtualService资源用于路由的具体版本标签匹配信息。至此,针对两个版本服务的灰度流量控制规则就设置好了,接下来测试具体的金丝雀(灰度)发布效果。
(6)测试Istio实现金丝雀(灰度)发布的流量控制效果。
在正式测试之前,可以通过命令查看下当前的部署资源情况:
代码语言:javascript复制#查看部署的Deployment资源
kubectl get deploy | grep micro-api
micro-api-v1 / h
micro-api-v2 / h
代码语言:javascript复制#查看两组版本Pod资源对应的K8s-Service的服务IP
kubectl get svc micro-api
NAME TYPE CLUSTER-IP EXTERNAL-IP PORT(S) AGE
micro-api ClusterIP 10.110.169.161 <none> /TCP d
代码语言:javascript复制#查看VirtualService资源定义
kubectl get vs
NAME GATEWAYS HOSTS AGE
micro-api-route [micro-gateway] [micro-api.default.svc.cluster.local] h34m
代码语言:javascript复制#查看定义的路由规则资源
kubectl get dr
NAME HOST AGE
micro-api-destination micro-api h27m
通过上面的资源信息查看,这里我们已经可以查到Deployments对应的K8s-Service资源的IP,但如果通过K8s-Service资源来进行测试的话,会发现流量的控制并不精准,并不能达到我们设置的70%流量流向v1,30%的流量流向v2(因为这是随机流量)。
因此,要使用Istio的精准流量控制功能,还需要使用Istio的Ingressgateway。查看Istio的Ingressgateway资源IP的命令如下:
代码语言:javascript复制#查看ingress的IP
kubectl get svc -n istio-system | grep ingress
istio-ingressgateway LoadBalancer 10.98.178.61 <pending> :/TCP,:/TCP,:/TCP,:/TCP,:/TCP 7h54m
接下来,通过Ingress的IP来访问“micro-api”服务,命令及效果如下:
代码语言:javascript复制# for i in {1..10}; do curl -H "Host:micro-api.default.svc.cluster.local" 10.98.178.61:/test/test; done
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
如上所示,流量按照设定的比例(v1:70%;v2:30%)进行了分流。
(7)测试将流量全部切向新版本。
为了更明显地验证Istio的流量控制效果,接下来,我们通过变更VirtualService资源的流量设置占比,将流量全部切到新版本。变更后的VirtualService资源的配置文件内容如下:
代码语言:javascript复制apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
name: micro-api-route
spec:
#用于定义流量被发送到的目标主机(这里为部署在k8s中的micro-api服务)
hosts:
- micro-api.default.svc.cluster.local
#将VirtualService绑定到Istio网关,通过网关来暴露路由目标
gateways:
- micro-gateway
http:
- route:
#设置旧版本(V1)版本的流量占比为70%
- destination:
host: micro-api.default.svc.cluster.local
subset: v1
#通过权重值来设置流量占比
weight: 0
#设置新版本(V2)版本的流量占比为30%
- destination:
host: micro-api.default.svc.cluster.local
subset: v2
weight: 100
继续通过Istio网关访问目标服务,命令如下:
代码语言:javascript复制# for i in {1..10}; do curl -H "Host:micro-api.default.svc.cluster.local" 10.98.178.61:/test/test; done
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
可以观察到,此时流量已经全部切换到了新版本服务!
后记
在微服务时代,不同的服务之间相互联系,关系错综复杂,部署升级一个服务,可能造成整个系统的瘫痪,因此,需要选择合适的部署方式,从而将风险降到最低。金丝雀(灰度)发布只是多种部署方式的一种,还有蓝绿部署、滚动部署(如K8s的滚动升级)等,可以根据不同的业务场景选择不同的发布形式。
—————END—————
参考文档:
#Istio 流量管理官方文档(英文版)
https://istio.io/latest/docs/concepts/traffic-management/#introducing-istio-traffic-management
#Istio Fault Injection介绍
https://istio.io/latest/docs/tasks/traffic-management/fault-injection/
#网文参考
https://www.kubernetes.org.cn/5556.html
https://zhuanlan.zhihu.com/p/263569381