如何在Service Mesh微服务架构中实现金丝雀发布?

2021-10-20 10:32:31 浏览数 (1)

今天的文章继续聊聊有关Service Mesh微服务架构的话题,如果对之前的聊过的话题还不了解,可以参考文末的推荐阅读。今天要聊的话题是:如何在Service Mesh微服务架构中实现“金丝雀发布”?

什么是金丝雀发布

既然要聊具体的实现,那么在开始之前,先科普下什么是“金丝雀发布”。金丝雀发布也叫“灰度发布”,具体来说就是在发布线上版本时,先将少量的生产流量打到服务的新版本,以验证新版本的准确性和可靠性,待发布的新版本得到线上流量的全面验证后,在逐步将所有流量放入新版本,以实现生产服务版本的稳定更新。

为什么叫金丝雀发布呢,是因为金丝雀对矿场中的毒气比较敏感,所以在矿场开工前工人们会放一只金丝雀进去,以验证矿场是否存在毒气,这便是金丝雀发布名称的由来。

在不同技术栈场景中,金丝雀发布的实现方式也不尽相同:有通过nginx实现的、也有借助A/B测试实现的。而随着以Kubernetes为代表的云原生基础设施的普及,金丝雀发布作为一项基本的服务发布功能,其实现方式也有了一些新的趋势——那就是逐步与云原生基础设施融为一体,成为基础设施服务的一部分。

Kubernetes中的金丝雀(灰度)发布

接下来,先看看在Kubernetes中是如何实现版本更新的。以下内容假设你已经有了一套可用的Kubernetes环境,如果没有可以查看文末推荐阅读的文章链接,参考相关分享自行部署。

1.滚动更新

在介绍Kubernetes中的金丝雀(灰度)发布之前,先来了解下Kubernetes中最重要的应用部署方式——“滚动升级”

所谓“滚动升级”:是指当更新了Kubernetes中Deployment编排资源的Pod模版(例如更新镜像版本号)之后,Deployment就需要遵循一种叫做“滚动更新(rolling update)”的方式,来升级现有的容器,从而实现应用对外服务的“不中断更新部署”。Kubernetes实现“滚动升级”的示意图如下:

如上图所示,滚动升级的过程为:

1)当容器开始升级时,集群中会先启动一个新版本的Pod,并终止一个旧版本的Pod。

2)如果此时,新版本的Pod有问题启动不了,那么“滚动升级”就会停止,并允许开发和运维人员介入。而在这个过程中,由于应用本身还有两个旧版本的Pod在线,所以服务并不会受到太大的影响。

3)而如果新版本的Pod启动成功,且服务访问正常,则继续滚动升级,直至按照Deployment编排器设置的副本数量,完成后续旧版本Pod的升级。

在Kubernetes中Deployment还可以通过相应地“滚动升级”策略,来控制Pod的滚动升级行为,以进一步保证服务的连续性。例如:“在任何时间窗口内,只有指定比例的Pod处于离线状态;在任何时间窗口内,只有指定比例的新Pod被创建出来"。可以通过相应地控制参数进行设置,如下:

代码语言:javascript复制
...
spec:
  selector:
    matchLabels:
      app: micro-api
  replicas: 
  #设置滚动升级策略
  #Kubernetes在等待设置的时间后才开始进行升级,例如5秒
  minReadySeconds: 
  strategy:
    type: RollingUpdate
    rollingUpdate:
      #升级过程中最多可以比原先设置多出的Pod数量
      maxSurge: 
      #升级过程中Deployment控制器最多可以删除多少个旧Pod,主要用于提供缓冲时间
      maxUnavailable: 
...

在上面RollingUpdate Strategy(滚动升级策略)的配置中:

  • maxSurge:指定的是,除了设定的Pod副本数量之外,在一次“滚动”中,Deployment控制器还可以创建多少个新的Pod。
  • maxUnavailable:指的是,在一次“滚动”中,Deployment控制器可以删除多少个旧Pod。

通过这种精确的“滚动升级”策略,可以使得Kubernetes服务版本发布的过程更加平滑。此外,这两个配置还可以通过百分比的方式来表示,比如“maxUnavailable=50%”,指的是Deployment控制器最多可以一次删除“50%*设定Pod副本数”个Pod。

接下来具体演示下在Kubernetes中进行服务滚动升级的详细过程。

使用的示例代码说明:

本文及本公众号之前或之后与Service Mesh(服务网格、Istio)技术相关的分享,均使用《干货|如何步入Service Mesh微服务架构时代》、《实战|Service Mesh微服务架构实现服务间gRPC通信》这两篇文章所展示的项目。

该项目以Spring Boot编写的Java服务为主,在体验上更接近真实的项目开发场景。项目的结构如下:

该项目所在的GitHub地址为:

代码语言:javascript复制
https://github.com/manongwudi/istio-micro-service-demo

“滚动升级”演示:

这里先借助示例项目中的“micro-api”服务来演示其在Kubernetes中进行“滚动升级”的过程,步骤如下:

(1)首先准备“micro-api”服务的k8s发布文件(如:micro-api.yaml)。代码如下:

代码语言:javascript复制
apiVersion: v1
kind: Service
metadata:
  name: micro-api
spec:
  type: ClusterIP
  ports:
    - name: http
      port: 19090
      targetPort: 9090
  selector:
    app: micro-api

---
apiVersion: apps/v1
kind: Deployment
metadata:
  name: micro-api
spec:
  selector:
    matchLabels:
      app: micro-api
  replicas: 3
  #设置滚动升级策略
  #Kubernetes在等待设置的时间后才开始进行升级,例如5秒
  minReadySeconds: 5
  strategy:
    type: RollingUpdate
    rollingUpdate:
      #升级过程中最多可以比原先设置多出的Pod数量
      maxSurge: 1
      #升级过程中Deployment控制器最多可以删除多少个旧Pod
      maxUnavailable: 1
  template:
    metadata:
      labels:
        app: micro-api
    spec:
      #设置的阿里云私有镜像仓库登陆信息的secret(对应2.1.2的设置)
      imagePullSecrets:
        - name: regcred
      containers:
        - name: micro-api
          image: registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.0-SNAPSHOT
          imagePullPolicy: Always
          tty: true
          ports:
            - name: http
              protocol: TCP
              containerPort: 19090

上述部署文件设置了“micro-api”服务的Pod副本个数为“3”,并且设置了相应地滚动升级策略。

(2)接下来执行k8s部署命令如下:

代码语言:javascript复制
$ kubectl apply -f micro-api.yaml 

成功后,查看Deployment创建后的状态信息,命令效果如下:

代码语言:javascript复制
$ kubectl get deployments
NAME          READY   UP-TO-DATE   AVAILABLE   AGE
micro-api     /                            d

从上述命令的返回结果中,可以看到三个状态字段,它们的含义如下所示:

  • READY:表示用户期望的Pod副本个数,以及当前处于Running状态的Pod个数。
  • UP-TO-DATE:当前处于最新版本的Pod个数。所谓最新版本,指的是Pod的Spec部分与Deployment中Pod模版里定义的完全一致。
  • AVAILABLE:当前已经可用的Pod的个数——既是Running状态,又是最新版本,并且已经处于Ready(监控检查正确)状态的Pod个数。

(3)模拟服务版本升级,触发滚动升级。

接下来重新构建“micro-api”服务的版本,并将其上传至私有镜像仓库。之后,通过命令修改“micro-api”的Deployment所使用的镜像,并触发滚动升级。

修改Deployment所使用的镜像的命令如下:

代码语言:javascript复制
$ kubectl set image deployment/micro-api micro-api=registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.1-SNAPSHOT
deployment.apps/micro-api image updated

这里使用了“kubectl set image”指令,主要是为了方便操作,也可以直接在k8s部署文件中进行镜像版本的修改。

修改完Deployment的镜像版本后,Kubernetes会立即触发“滚动升级”的过程。可以通过“kubectl rollout status”指令来查看Deployment资源的状态变化。具体如下:

代码语言:javascript复制
$ kubectl rollout status deployment/micro-api

Waiting for deployment "micro-api" rollout to finish:  out of  new replicas have been updated...
Waiting for deployment "micro-api" rollout to finish:  out of  new replicas have been updated...

Waiting for deployment "micro-api" rollout to finish:  out of  new replicas have been updated...
Waiting for deployment "micro-api" rollout to finish:  of  updated replicas are available...
Waiting for deployment "micro-api" rollout to finish:  of  updated replicas are available...
deployment "micro-api" successfully rolled out

这时,也可以通过查看Deployment的Events,看到这个“滚动升级”的过程。具体如下:

代码语言:javascript复制
$ kubectl describe deployment micro-api
...
OldReplicaSets:  <none>
NewReplicaSet:   micro-api-d745d8649 (/ replicas created)
Events:
  Type    Reason             Age   From                   Message
  ----    ------             ----  ----                   -------
  Normal  ScalingReplicaSet  m   deployment-controller  Scaled up replica set micro-api-677dd4d5b6 to 
  Normal  ScalingReplicaSet  m   deployment-controller  Scaled down replica set micro-api-57c7cb5b74 to 
  Normal  ScalingReplicaSet  m   deployment-controller  Scaled up replica set micro-api-677dd4d5b6 to 
  Normal  ScalingReplicaSet  m1s  deployment-controller  Scaled down replica set micro-api-677dd4d5b6 to 
  Normal  ScalingReplicaSet  m    deployment-controller  Scaled up replica set micro-api-d745d8649 to 
  Normal  ScalingReplicaSet  s   deployment-controller  Scaled down replica set micro-api-57c7cb5b74 to 
  Normal  ScalingReplicaSet  s   deployment-controller  Scaled up replica set micro-api-d745d8649 to 

可以看到,当你修改了Deployment里的Pod定义后,"Deployment Controller"会使用这个修改后的Pod模版,创建一个新的ReplicaSet,这个新的ReplicaSet的初始Pod副本数是:0。

然后在Age=12 m的位置,开始将这个新的ReplicaSet所控制的Pod副本数从0个变成1个。

紧接着,在Age=12 m的位置,又将旧ReplicaSet所控制的Pod副本数减少1个,即“水平收缩”成两个副本。

如此交替进行,新ReplicaSet所管理的Pod的副本数,从0个变成1个,再变成2个,最后变成3个;而旧ReplicaSet所管理的Pod的副本数则从3个变成2个,最后变成0个。

这样,就完成了一组Pod的版本升级过程。而像这样将一个Kubernetes集群中正在运行的多个Pod版本,交替逐一升级的过程,就是“滚动升级”。

2.金丝雀(灰度)发布

前面“1.”小标题中,比较详细的演示了Kubernetes的“滚动升级”的方式,虽然通过滚动升级的方式可以方便、平滑的实现版本更新,但是这个过程,并没有灰度功能。滚动升级的方式,虽然中间有缓冲交替的过程,但这种过程是自动的、迅速的,滚动升级过程结束就相当于直接进行了新版本的全量发布

而对于需要进行金丝雀(灰度)发布的场景,“滚动升级”的方式很显然是不够用的。那么,在Kubernetes中应该如何结合版本更新做到金丝雀(灰度)发布呢?

具体步骤如下:

(1)编写实现新版本灰度发布的部署文件。

为了实现在Kubernetes中的金丝雀(灰度)发布过程的可观测,我们重新定义下具体的k8s发布文件(如:micro-api-canary.yaml)的内容如下:

代码语言:javascript复制
apiVersion: apps/v1
kind: Deployment
metadata:
  name: micro-api
spec:
  selector:
    matchLabels:
      app: micro-api
  replicas: 3
  #设置滚动升级策略
  #Kubernetes在等待设置的时间后才开始进行升级,例如5秒
  minReadySeconds: 5
  strategy:
    type: RollingUpdate
    rollingUpdate:
      #升级过程中最多可以比原先设置多出的Pod数量
      maxSurge: 1
      #升级过程中Deployment控制器最多可以删除多少个旧Pod,主要用于提供缓冲时间
      maxUnavailable: 1
  template:
    metadata:
      labels:
        app: micro-api
        #增加新的标签(演示k8s的灰度发布)
        track: canary
    spec:
      #设置的阿里云私有镜像仓库登陆信息的secret(对应2.1.2的设置)
      imagePullSecrets:
        - name: regcred
      containers:
        - name: micro-api
          image: registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.3-SNAPSHOT
          imagePullPolicy: Always
          tty: true
          ports:
            - name: http
              protocol: TCP
              containerPort: 19090

上述发布文件与“1.”小标题中演示滚动升级时,发布文件的内容一致,只是为了方便观察灰度发布过程的实现,这里通过“track: canary”对新发布的Pod版本进行标记。

设置新版本的镜像为:“micro-api:1.3-SNAPSHOT”。并且通过“spec.selector.matchLabels.app:micro-api”与历史版本Pod所对应的Service(micro-api.yaml文件中定义的Service)资源定义匹配。

(2)执行"滚动升级"发布命令,实现“灰度发布”效果。

代码语言:javascript复制
$ kubectl apply -f micro-api-canary.yaml && kubectl rollout pause deployment/micro-api

上面通过"kubectl rollout pause"命令实现对Deployment的金丝雀(灰度发布)。执行发布命令之后的运行效果如下:

代码语言:javascript复制
$ kubectl get pods --show-labels -o wide
NAME                         READY   STATUS    RESTARTS   AGE     IP          NODE         NOMINATED NODE   READINESS GATES   LABELS
micro-api-57c7cb5b74-mq7m9   1/1     Running   0          6m20s   10.32.0.3   kubernetes   <none>           <none>            app=micro-api,pod-template-hash=57c7cb5b74
micro-api-57c7cb5b74-ptptj   1/1     Running   0          6m20s   10.32.0.4   kubernetes   <none>           <none>            app=micro-api,pod-template-hash=57c7cb5b74
micro-api-7dbb6c5d66-4rbdc   1/1     Running   0          5m33s   10.32.0.6   kubernetes   <none>           <none>            app=micro-api,pod-template-hash=7dbb6c5d66,track=canary
micro-api-7dbb6c5d66-cfk9l   1/1     Running   0          5m33s   10.32.0.5   kubernetes   <none>           <none>            app=micro-api,pod-template-hash=7dbb6c5d66,track=canary

查看Deployment的滚动升级情况,命令如下:

代码语言:javascript复制
$ kubectl get deployments
NAME            READY   UP-TO-DATE   AVAILABLE   AGE
micro-api       4/3     2            4           194d

可以看到此时“micro-api” ready的数量为4,其中两个旧版本Pod,两个新版本Pod。

(3)接下来进行流量测试。

查询两组Pod版本所对应的Service资源的IP,命令如下:

代码语言:javascript复制
# kubectl get svc micro-api
NAME        TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)     AGE
micro-api   ClusterIP   10.110.169.161   <none>        19090/TCP   194d

接下来,模拟对服务的接口进行批量访问,命令如下:

代码语言:javascript复制
$ for i in {1..10}; do curl 10.110.169.161:19090/test/test; done

{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":0,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}

可以看到,此时流量会随机的流向旧版本和新版本(日志标记为V3)的服务。

(4)将服务版本升级为新版本。

如果新版本的服务经过线上流量测试验证没有问题,则可以通过"rollout resume"命令将整体服务的版本升级为新版本。命令如下:

代码语言:javascript复制
$ kubectl rollout resume deployment micro-api
deployment.apps/micro-api resumed

升级后的效果如下:

代码语言:javascript复制
$ kubectl get pods --show-labels -o wide
NAME                         READY   STATUS    RESTARTS   AGE   IP          NODE         NOMINATED NODE   READINESS GATES   LABELS
micro-api-7dbb6c5d66-4rbdc   1/1     Running   0          18m   10.32.0.6   kubernetes   <none>           <none>            app=micro-api,pod-template-hash=7dbb6c5d66,track=canary
micro-api-7dbb6c5d66-bpjtg   1/1     Running   0          84s   10.32.0.3   kubernetes   <none>           <none>            app=micro-api,pod-template-hash=7dbb6c5d66,track=canary
micro-api-7dbb6c5d66-cfk9l   1/1     Running   0          18m   10.32.0.5   kubernetes   <none>           <none>            app=micro-api,pod-template-hash=7dbb6c5d66,track=canary

可以看到,此时目标服务已经通过“滚动升级”的方式完成了全量更新。而如果存在问题,则通过“kubectl rollout undo”命令进行回滚即可!

从上述过程可以看到,Kubernetes中的金丝雀(灰度发布)主要是通过操纵(如:pause)“滚动升级”的过程来实现的——通过发布一定数量的新版本Pod,并利用Service资源类型本身的负载均衡能力来实现流量在新/旧Pod之间的随机交替。

这样的方式虽然已经可以满足一些简单的场景,但是没有办法做到更精准的灰度流量控制。这时候就需要借助 Service Mesh 中的解决方案了,下面我们来看看在 Istio 中如何做到精准流量的金丝雀(灰度)发布。

Istio中的金丝雀(灰度)发布

以下内容默认你已经在Kubernetes中安装了Istio环境,如果还没有安装可以参考《干货|如何步入Service Mesh微服务架构时代》中分享的内容。

Istio与Kubernetes实现金丝雀(灰度)发布的方式不一样,Istio通过Envoy(SideCar)强大的路由规则管理能力,可以非常灵活地控制对应版本的流量占比,从而实现具备精准流量控制能力的金丝雀(灰度)发布功能。

Istio通过Envoy(SideCar)实现金丝雀(灰度)发布的流量路由示意图如下(继续以“micro-api”服务为例):

从上图中可以大致看出,Istio具备强大的流量管理能力,而这种能力对于实现流量精准控制的金丝雀(灰度)发布功能来说,自然是水到渠成的。

具体来说,在Istio中是通过VirtualService(虚拟服务)这种特定的资源在服务网格中实现流量路由的。通过VirtualService可以方便地定义流量路由规则,并在客户端试图连接到服务时应用这些规则,并最终到达目标服务。

接下来,具体演示如何在Istio中通过VirtualService实现金丝雀(灰度)发布。步骤如下:

(1)首先发布一个v1版本的服务。

要在Istio中实现更精准的版本控制,需要在发布Pod资源时,通过明确的“版本标签”进行指定。准备“micro-api”服务v1版本的k8s部署文件(micro-api-canary-istio-v1.yaml):

代码语言:javascript复制
apiVersion: v1
kind: Service
metadata:
  name: micro-api
spec:
  type: ClusterIP
  ports:
    - name: http
      port: 19090
      targetPort: 9090
  selector:
    app: micro-api

---

apiVersion: apps/v1
kind: Deployment
meta data:
  name: micro-api-v1
spec:
  selector:
    matchLabels:
      app: micro-api
      #这里是关键,需要设置版本标签,以便实现灰度发布
      version: v1
  replicas: 3
  #设置滚动升级策略
  #Kubernetes在等待设置的时间后才开始进行升级,例如5秒
  minReadySeconds: 5
  strategy:
    type: RollingUpdate
    rollingUpdate:
      #升级过程中最多可以比原先设置多出的Pod数量
      maxSurge: 1
      #升级过程中Deployment控制器最多可以删除多少个旧Pod,主要用于提供缓冲时间
      maxUnavailable: 1
  template:
    metadata:
      labels:
        app: micro-api
        #设置版本标签,便于灰度发布
        version: v1
    spec:
      #设置的阿里云私有镜像仓库登陆信息的secret
      imagePullSecrets:
        - name: regcred
      containers:
        - name: micro-api
          image: registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.1-SNAPSHOT
          imagePullPolicy: Always
          tty: true
          ports:
            - name: http
              protocol: TCP
              containerPort: 19090

“spec.selector.matchLabels.version:v1”标签用来标注服务的版本,该标签是后续Istio的流量管理规则中,识别服务版本的主要依据。

准备好发布文件后,执行发布命令:

代码语言:javascript复制
$ kubectl apply -f micro-api-canary-istio-v1.yaml

此时,一个低版本的服务就运行成功了!接下来我们模拟对其实施金丝雀(灰度)发布。

(2)发布一个v2版本的服务(升级的目标版本)。

与v1版本服务一样,发布的v2版本的服务也需要明确版本标签,其发布文件(micro-api-canary-istio-v2.yaml)的内容如下:

代码语言:javascript复制
apiVersion: apps/v1
kind: Deployment
metadata:
  name: micro-api-v2
spec:
  selector:
    matchLabels:
      app: micro-api
      #设置好版本标签,便于灰度发布
      version: v2
  replicas: 3
  #设置滚动升级策略
  #Kubernetes在等待设置的时间后才开始进行升级,例如5秒
  minReadySeconds: 5
  strategy:
    type: RollingUpdate
    rollingUpdate:
      #升级过程中最多可以比原先设置多出的Pod数量
      maxSurge: 1
      #升级过程中Deployment控制器最多可以删除多少个旧Pod,主要用于提供缓冲时间
      maxUnavailable: 1
  template:
    metadata:
      labels:
        app: micro-api
        #设置好版本标签,便于灰度发布
        version: v2
    spec:
      #设置的阿里云私有镜像仓库登陆信息的secret
      imagePullSecrets:
        - name: regcred
      containers:
        - name: micro-api
          image: registry.cn-hangzhou.aliyuncs.com/wudimanong/micro-api:1.3-SNAPSHOT
          imagePullPolicy: Always
          tty: true
          ports:
            - name: http
              protocol: TCP
              containerPort: 19090

执行发布命令:

代码语言:javascript复制
$ kubectl apply -f micro-api-canary-istio-v2.yaml 
deployment.apps/micro-api-v2 created

此时,系统中就存在了两组版本的Pod资源,具体如下:

代码语言:javascript复制
# kubectl get pods
NAME                            READY   STATUS    RESTARTS   AGE
micro-api-v1-565d749dd4-7c66z   /     Running             h
micro-api-v1-565d749dd4-7dqfb   /     Running             h
micro-api-v1-565d749dd4-l62wc   /     Running             h
micro-api-v2-6f98c598c9-5stlw   /     Running             82s
micro-api-v2-6f98c598c9-f2ntq   /     Running             82s
micro-api-v2-6f98c598c9-l8g4j   /     Running             82s

接下来将演示如何利用Istio强大的流量管理功能,来实现流量在这两组版本Pod资源之间的精确控制!

(3)创建Istio网关资源。

在Istio中要实现流量的精确控制,需要将VirtualService绑定到具体的Ingressgateway(入口网关)资源。因此在创建VirtualService资源实现流量路由及控制前,需要创建一个Istio网关。部署文件(micro-gateway.yaml)的内容如下:

代码语言:javascript复制
apiVersion: networking.istio.io/v1alpha3
kind: Gateway
metadata:
  name: micro-gateway
spec:
  selector:
    istio: ingressgateway
  servers:
    - port:
        number: 80
        name: http
        protocol: HTTP
      hosts:
        - "*"

上述部署文件执行后将创建一个名称为“micro-gateway”的Istio网关,并允许所有主机(hosts:"*"指定)通过该网关。

(4)创建Istio虚拟服务资源VirtualService。

前面提到过在Istio中主要是通过VirtualService(虚拟服务)来实现服务网格内的流量路由及控制。接下来我们看看VirtualService资源的具体创建方式,准备资源文件(如virtual-service-all.yaml),内容如下:

代码语言:javascript复制
apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
  name: micro-api-route
spec:
  #用于定义流量被发送到的目标主机(这里为部署在k8s中的micro-api服务)
  hosts:
    - micro-api.default.svc.cluster.local
  #将VirtualService绑定到Istio网关,通过网关来暴露路由目标
  gateways:
    - micro-gateway
  http:
    - route:
        #设置旧版本(V1)版本的流量占比为70%
        - destination:
            host: micro-api.default.svc.cluster.local
            subset: v1
          #通过权重值来设置流量占比
          weight: 70
        #设置新版本(V2)版本的流量占比为30%
        - destination:
            host: micro-api.default.svc.cluster.local
            subset: v2
          weight: 30

如上所示,VirtualService资源具备针对http的精准流量控制能力,可以将指定占比的流量路由到特定的“subset”指定的版本。而为了实现这一能力,VirtualService资源还需要与Istio网关绑定,通过Istio网关来暴露路由目标。

(5)创建Istio目标路由规则资源。

虚拟服务VirtualService在Istio中主要用于控制流量的行为,而定义流量行为的路由规则则需要通过“DestinationRule”路由规则资源来定义。创建路由规则文件(destination-rule-all.yaml),具体内容如下:

代码语言:javascript复制
apiVersion: networking.istio.io/v1alpha3
kind: DestinationRule
metadata:
  name: micro-api-destination
spec:
  #与Deployment资源对应的Service资源名称关联
  host: micro-api
  #流量策略设置:负载均衡策略、连接池大小、局部异常检测等,在路由发生后作用于流量
  trafficPolicy:
    #限流策略
    connectionPool:
      tcp:
        maxConnections: 10
      http:
        http1MaxPendingRequests: 1
        maxRequestsPerConnection: 1
    #设置目的地的负债均衡算法
    loadBalancer:
      simple: ROUND_ROBIN
  #目的地指的是不同的子集(subset)或服务版本。通子集(subset),可以识别应用程序的不同版本,以实现流量在不同服务版本之间的切换
  subsets:
    - name: v1
      labels:
        version: v1
    - name: v2
      labels:
        version: v2

如上所示,通过subsets属性,定义了VirtualService资源用于路由的具体版本标签匹配信息。至此,针对两个版本服务的灰度流量控制规则就设置好了,接下来测试具体的金丝雀(灰度)发布效果。

(6)测试Istio实现金丝雀(灰度)发布的流量控制效果。

在正式测试之前,可以通过命令查看下当前的部署资源情况:

代码语言:javascript复制
#查看部署的Deployment资源
kubectl get deploy  | grep micro-api

micro-api-v1             /                            h
micro-api-v2             /                            h
代码语言:javascript复制
#查看两组版本Pod资源对应的K8s-Service的服务IP
kubectl get svc micro-api

NAME        TYPE        CLUSTER-IP       EXTERNAL-IP   PORT(S)     AGE
micro-api   ClusterIP   10.110.169.161   <none>        /TCP   d
代码语言:javascript复制
#查看VirtualService资源定义
kubectl get vs

NAME              GATEWAYS          HOSTS                                   AGE
micro-api-route   [micro-gateway]   [micro-api.default.svc.cluster.local]   h34m
代码语言:javascript复制
#查看定义的路由规则资源
kubectl get dr

NAME                    HOST        AGE
micro-api-destination   micro-api   h27m

通过上面的资源信息查看,这里我们已经可以查到Deployments对应的K8s-Service资源的IP,但如果通过K8s-Service资源来进行测试的话,会发现流量的控制并不精准,并不能达到我们设置的70%流量流向v1,30%的流量流向v2(因为这是随机流量)

因此,要使用Istio的精准流量控制功能,还需要使用Istio的Ingressgateway。查看Istio的Ingressgateway资源IP的命令如下:

代码语言:javascript复制
#查看ingress的IP
kubectl get svc -n istio-system | grep ingress

istio-ingressgateway   LoadBalancer   10.98.178.61     <pending>     :/TCP,:/TCP,:/TCP,:/TCP,:/TCP   7h54m

接下来,通过Ingress的IP来访问“micro-api”服务,命令及效果如下:

代码语言:javascript复制
# for i in {1..10}; do curl -H "Host:micro-api.default.svc.cluster.local" 10.98.178.61:/test/test; done

{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}

如上所示,流量按照设定的比例(v1:70%;v2:30%)进行了分流。

(7)测试将流量全部切向新版本。

为了更明显地验证Istio的流量控制效果,接下来,我们通过变更VirtualService资源的流量设置占比,将流量全部切到新版本。变更后的VirtualService资源的配置文件内容如下:

代码语言:javascript复制
apiVersion: networking.istio.io/v1alpha3
kind: VirtualService
metadata:
  name: micro-api-route
spec:
  #用于定义流量被发送到的目标主机(这里为部署在k8s中的micro-api服务)
  hosts:
    - micro-api.default.svc.cluster.local
  #将VirtualService绑定到Istio网关,通过网关来暴露路由目标
  gateways:
    - micro-gateway
  http:
    - route:
        #设置旧版本(V1)版本的流量占比为70%
        - destination:
            host: micro-api.default.svc.cluster.local
            subset: v1
          #通过权重值来设置流量占比
          weight: 0
        #设置新版本(V2)版本的流量占比为30%
        - destination:
            host: micro-api.default.svc.cluster.local
            subset: v2
          weight: 100

继续通过Istio网关访问目标服务,命令如下:

代码语言:javascript复制
# for i in {1..10}; do curl -H "Host:micro-api.default.svc.cluster.local" 10.98.178.61:/test/test; done

{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}
{"code":,"data":"V3|无依赖测试接口返回->OK!","message":"成功"}

可以观察到,此时流量已经全部切换到了新版本服务!

后记

在微服务时代,不同的服务之间相互联系,关系错综复杂,部署升级一个服务,可能造成整个系统的瘫痪,因此,需要选择合适的部署方式,从而将风险降到最低。金丝雀(灰度)发布只是多种部署方式的一种,还有蓝绿部署、滚动部署(如K8s的滚动升级)等,可以根据不同的业务场景选择不同的发布形式。

—————END—————

参考文档:

#Istio 流量管理官方文档(英文版)

https://istio.io/latest/docs/concepts/traffic-management/#introducing-istio-traffic-management

#Istio Fault Injection介绍

https://istio.io/latest/docs/tasks/traffic-management/fault-injection/

#网文参考

https://www.kubernetes.org.cn/5556.html

https://zhuanlan.zhihu.com/p/263569381

0 人点赞