Socket编程
网络编程又可称为Socket编程。编程分为基于Server端开发与基于Client端开发两部分。基于Server端的编程由四大步骤组成,开发者首先创建Socket,利用bind与listen函数绑定监听地址及相应的端口,最后使用accept函数接受来自监听端的请求。Client端的操作较为简便,开发者在创建Socket后使用connect函数对服务器端进行连接即可实现。
下图所示为Client端与Server端的协作示意图。Client端首先向Server端发起带有SYN标识的握手请求,Server端接受到请求后,返回给Client端带有SYN与ACK标识的请求并将Client端中的RCVD文件加载至队列中,在三次握手完成之后,该文件描述符将被添加至accept队列中等待下一步逻辑处理。
下图所示为Socket编程的实现代码
在Socket编程中,Socket的读写状态判断十分重要。Socket可读条件分为以下四条:
- 该套接字接收缓冲区中的数据字节数大于等于套接字接收缓存区低水位。
- 该连接的读半部关闭(也就是接收了FIN的TCP连接)。
- 有新链接到达可读,该套接字是一个listen的监听套接字,并且目前已经完成的连接数不为0。
- 有一个Socket有异常错误条件待处理.对于这样的Socket读操作将不会阻塞,并且返回一个错误(-1),errno则设置成明确的错误条件。以上条件中,第一条件与第三条件较为重要。对于TCP和UDP套接字而言,缓冲区低水位的值默认为1,在默认情况下,缓冲区中的数据均为可读。当为Socket收到connect请求,执行了三次握手的第一步接收SYN请求后,Socket便处于可读状态。对这样的套接字进行accept操作通常不会阻塞。
对应于Socket可读条件的判断,Socket可写条件也分为以下四条:
- 该套接字发送缓冲区中的可用空间字节数大于等于套接字发送缓存区低水位标记时,并且该套接字已经成功连接。
- 该连接的写半部关闭。
- 使用非阻塞的connect套接字已建立连接,或者connect已经以失败告终。
- 有一个错误的套接字待处理。
下图举了生活中与网络阻塞类似的生活事例来展示该过程。在用户到手机店修手机的过程中,用户在手机店不做任何事,等待老板将手机修好类似于网络同步阻塞过程;用户在店中做些其他工作,不时询问老板手机是否修好类似于同步非阻塞过程;用户回到家中,等待手机店老板修好后的电话类似于异步阻塞过程;用户回到家中做其他事情,等待老板修好后的电话类似于多路IO 复用、异步非阻塞过程。
在一款应用开发初期,应用的用户不多,服务器相对的要求同样不高,此时开发者可以使用多进程策略进行应用的开发,以此加快开发效率。下图所示为多进程同步阻塞开发的伪代码。
当业务量扩大,系统需要进行优化时,开发者可以对每个子进程中的套接字进行监听,其伪代码如下图所示。
IO复用与Reactor
当系统的用户及业务量扩大到一定规模时,开发者可以使用多路IO复用、Reactor及异步非阻塞等方法对系统进行改进。如下图所示,在这些系统调用中,Select方法存在内存开销大,支持文件描述符数量少的缺点。
目前Epoll系统调用方式占据开发的主流位置,Epoll方式采用了红黑树的数据结构模式,同时拥有就绪列表rdlist,当套接字中存在可读或可写的事件时,该事件将被直接添加到就绪列表当中,从而使系统省去了轮询所有套接字属性的过程,提高了系统的执行效率。
(1)操作系统调度原理
操作系统进程调用时分为正在运行,阻塞运行及等待运行三个状态。在处理进程的过程中,内核会不断发生中断,比如三次握手过程中,当ACK发送时,内核会触发中断,系统此时需要放下正在执行的任务,去处理TCP的任务。处理完成后,系统结束中断处理并恢复运行被打断的进程。下图所示为操作系统进程调度的一些方法。
在三次握手中,系统执行以下三个步骤完成操作系统的调度:
- 网卡收到数据:网卡收到SYN消息,触发内核中断,系统将直接打断当前执行的进程,同时CPU将会把套接字加入到Socket Queue队列当中进行存储。
- 中断回调:若当前没有新的连接,accept将阻塞到系统调用上,并将套接字注册到Wait Queue上。
- 系统中断回调:当新的连接产生时,Wait Queue队列将触发回调函数,将相应数据加载至rdlist列表中。
若网卡收到ACK消息,则继续触发内核中断,内核完成标准的三次握手,将连接从半连接队列移入连接队列,于是 listen Socket有可读事件,内核调用listen Socket的Wait Queue的唤醒回调函数,将之前阻塞的accept进程置为 Ready调度状态。
(2)Epoll的在调度中的作用
Epoll主要用来监听Socket的可读可写过程,在Epoll创建时,开发者需要传对应文件描述符EPOLLIN与EPOLLOUT作为可读与可写的参数标志,epoll_wait函数拥有accept的功能,会在事件发送后提醒开发者。下图罗列了Epoll中的参数与主要方法。
将Socket创建与accept过程转化为Epoll的代码示意图如下所示。首先将fd作为描述符加入创建好的Epoll中,同时把开发者想要监听的可读可写事件也注册入Epoll之中。
当listen fd监听到事件时,使用accept方法将该fd描述符设为可读事件,并再次将其加入到Epoll的监听数组中,此时代表真正的客户端连接已接入。