Kafka是如何应用NIO实现网络通信的?

2022-11-30 15:38:28 浏览数 (1)

网络通信层

Kafka网络通信层架构

kafka请求全处理流程

请求处理流程:

  1. Clients或其他Broker通过Selector机制发起创建连接请求
  2. Processor线程接收请求,并将其转换成可处理的Request对象
  3. Processor线程将Request对象放入Request队列
  4. KafkaRequestHandler线程从Request队列中取出待处理请求,并进行处理
  5. KafkaRequestHandler线程将Response放回到对应Processor线程的Response队列
  6. Processor线程发送Response给Request发送方

生产者-消费者模式的应用

Acceptor和Processor之间缓存SocketChannel newConnections队列,保证线程安全顺序。

Processor和KafkaRequestHandler之间缓存阻塞队列RequestChannel的Request全局队列和Response局部队列。

Kafka网络通信组成

  • SocketServer 核心,主要实现了Reactor模式,用于处理外部多个Clients(广义Clients,可能包含Producer、Consumer或其他Broker)的并发请求,并负责将处理结果封装进Response中,返还给Clients。 SocketServer是Kafka网络通信层中最重要的子模块。它的Acceptor线程、Processor线程和RequestChannel等对象,都是实施网络通信的重要组成部分。
  • KafkaRequestHandlerPool I/O线程池,里面定义了若干个I/O线程,用于执行真实的请求处理逻辑。KafkaRequestHandlerPool线程池定义了多个KafkaRequestHandler线程,而KafkaRequestHandler线程是真正处理请求逻辑的地方。

两者共通处在于SocketServer中定义的RequestChannel对象和Processor线程。 在代码中,线程本质都是Runnable类型,不管是Acceptor类、Processor还是KafkaRequestHandler类。

相较于KafkaRequestHandler,Acceptor和Processor最多算请求和响应的“搬运工”。

SocketServer

  • AbstractServerThread类 这是Acceptor线程和Processor线程的抽象基类
  • Acceptor线程类 接收和创建外部TCP连接的线程。每个SocketServer实例只会创建一个Acceptor线程。 唯一作用创建连接,并将接收到的Request传递给下游的Processor线程。
  • Processor线程类 每个SocketServer实例默认创建若干个(num.network.threads)Processor线程。 负责
    • 将接收到的Request添加到RequestChannel的Request队列
    • 将Response返还给Request发送方
  • Processor伴生对象类 仅定义一些与Processor线程相关的常见监控指标和常量等,如Processor线程空闲率等。
  • ConnectionQuotas类
  • TooManyConnectionsException类
  • SocketServer类 实现了对以上所有组件的管理和操作,如创建和关闭Acceptor、Processor线程。
  • SocketServer伴生对象类 定义了一些有用的常量,同时明确了SocketServer组件中的哪些参数是允许动态修改的。

Acceptor线程

经典Reactor模式的Dispatcher接收外部请求并分发给下面的实际处理线程。在Kafka中,这个Dispatcher就是Acceptor线程。

参数

endPoint

定义的Kafka Broker连接信息,比如PLAINTEXT://localhost:9092

sendBufferSize

recvBufferSize

如果在你的生产环境中,Clients与Broker的通信网络延迟很大(RTT>10ms),推荐增加控制缓冲区大小的两个参数:sendBufferSize和recvBufferSize,一般默认值100KB太小了。

Acceptor线程的自定义属性:

  • nioSelector Java NIO库的Selector对象实例,也是后续所有网络通信组件实现Java NIO机制的基础
  • processors 网络Processor线程池。Acceptor线程在初始化时,需要创建对应的网络Processor线程池。Processor线程是在Acceptor线程中管理和维护的。

Processor相关API

  • addProcessors
  • removeProcessors

于是Acceptor类就具备Processor线程池管理功能。

  • Acceptor类的run方法 - 处理Reactor模式中分发

Acceptor线程会先为每个入站请求确定要处理它的Processor线程

Acceptor线程使用Java NIO的Selector、SocketChannel循环轮询就绪的I/O事件(SelectionKey.OP_ACCEPT)。一旦接收到外部连接请求,Acceptor就指定一个Processor线程,并将该请求交由它,让它创建真正的网络连接。

Processor线程

  • 源码
  • 执行流程
  • 每个Processor线程在创建时都会创建3个队列:可能是阻塞队列,也可能是一个Map对象

newConnections

每当Processor线程接收新连接请求,都会将对应SocketChannel放入该队列。 之后调用configureNewConnections创建连接时,就从该队列中取出SocketChannel,然后注册新连接。

inflightResponses

  • 临时Response队列
  • 为何是临时? 有些Response回调逻辑要在Response被返回发送方后,才能执行,因此需要暂存临时队列。

responseQueue

每个Processor线程都会维护自己的Response队列, 而非像网上的某些文章说Response队列是线程共享的或是保存在RequestChannel中的。Response队列里面保存着需要被返还给发送方的所有Response对象。

工作逻辑

configureNewConnections

  • 负责处理新连接请求,注意每个Processor线程都维护着一个Selector类实例。

processNewResponses

  • 负责发送Response给Request发送方,并且将Response放入临时Response队列

poll

processCompletedReceives

  • 接收和处理Request

processCompletedSends

processDisconnected

closeExcessConnections

  • 关闭超限连接

0 人点赞