一次完整的 RPC 流程
因为 RPC 是远程调用,首先会涉及网络通信, 又因为 RPC 用于业务系统之间的数据交互,要保证数据传输的可靠性,所以它一般默认采用 TCP 来实现网络数据传输。
网络传输的数据必须是二进制数据,可是在 RPC 框架中,调用方请求的出入参数都是对象,对象不能直接在网络中传输,所以需要提前把对象转成可传输的二进制数据,转换算法还要可逆,这个过程就叫“序列化”和“反序列化”。
另外,在网络传输中,RPC 不会把请求参数的所有二进制数据一起发送到服务提供方机器上,而是拆分成好几个数据包(或者把好几个数据包封装成一个数据包),所以服务提供方可能一次获取多个或半个数据包,这也就是网络传输中的粘包和半包问题。为了解决这个问题,需要提前约定传输数据的格式,即“RPC 协议”。 大多数的协议会分成数据头和消息体:
数据头一般用于身份识别,包括协议标识、数据大小、请求类型、序列化类型等信息;
消息体主要是请求的业务参数信息和扩展属性等。
在确定好“ RPC 协议”后,一次完整的 RPC 调用会经过这样几个步骤:
1、调用方持续把请求参数对象序列化成二进制数据,经过 TCP 传输到服务提供方;
2、服务提供方从 TCP 通道里面接收到二进制数据;
3、根据 RPC 协议,服务提供方将二进制数据分割出不同的请求数据,经过反序列化将二进制数据逆向还原出请求对象,找到对应的实现类,完成真正的方法调用;
4、然后服务提供方再把执行结果序列化后,回写到对应的 TCP 通道里面;
5、调用方获取到应答的数据包后,再反序列化成应答对象。
这样调用方就完成了一次 RPC 调用。
RPC 通信流程中的核心组成部分包括了协议、序列化与反序列化,以及网络通信。