1、select诞生的原因
在上文《socket网络编程(二)—— 实现持续发送》我们提到了多客户端的时候,多台客户端发送数据到服务端的话,只能有一台客户端可以正常发送和接受数据,另外一台完全没有反应,那这个问题怎么解决呢?很多人可能第一反应想到利用多线程技术,线程多的话用线程池来维护。的确,多线程确实可以实现这个效果,但是,可能很多看见这个但是就不怎么开心了,却不知很多科学科技的进步都是这个但是引发的。但是一个多线程编程很麻烦又容易出错,二是如果连接有几千个的话,线程间切换的开销确实是很大。如果能够在一个线程里就实现这个效果的话,那该多好啊!
于是select就横空出世!
这个又叫做非阻塞IO多路复用,就是进程或线程执行此函数时不必非要等待事件的发生,一旦执行肯定返回,以返回值的不同来反映函数的执行情况,如果事件发生则与阻塞方式相同,若事件没有发生则返回一个代码来告知事件未发生,而进程或线程继续执行,所以效率较高可能很多人会说,现在都是用epoll,都不用select了,还讲这个干嘛?可我想说,因为我这个是socket网络编程的一系列教程,一定要一步步的推进,历史上是有诞生了select,然后epoll是为了完善select的缺陷的,做为学习,我们必须先了解select,然后才能知道epoll的特别之处。
2、具体实现
首先,还是先不扯其他的,我先扔出代码,然后结合代码讲解select,我本人是比较喜欢这种学习方式,带着疑问去学习,如果大家不习惯的话,可以先跳过以下的代码,先看代码下方的讲解部分。
2.1、服务端代码:
代码语言:javascript复制#include <stdio.h>
#include <sys/socket.h>
#include <netinet/in.h>
#include <stdlib.h>
#include <arpa/inet.h>
#include <unistd.h>
#include <string.h>
#define PORT 39002
#define MAX_FD_NUM 3
#define BUF_SIZE 512
#define ERR_EXIT(m)
do
{
perror(m);
exit(EXIT_FAILURE);
} while (0)
int main()
{
//创建套接字
int m_sockfd = socket(AF_INET, SOCK_STREAM, 0);
if (m_sockfd < 0)
{
ERR_EXIT("create socket fail");
}
//初始化socket元素
struct sockaddr_in server_addr;
int server_len = sizeof(server_addr);
memset(&server_addr, 0, server_len);
server_addr.sin_family = AF_INET;
//server_addr.sin_addr.s_addr = inet_addr("0.0.0.0"); //用这个写法也可以
server_addr.sin_addr.s_addr = INADDR_ANY;
server_addr.sin_port = htons(PORT);
//绑定文件描述符和服务器的ip和端口号
int m_bindfd = bind(m_sockfd, (struct sockaddr *)&server_addr, server_len);
if (m_bindfd < 0)
{
ERR_EXIT("bind ip and port fail");
}
//进入监听状态,等待用户发起请求
int m_listenfd = listen(m_sockfd, MAX_FD_NUM);
if (m_listenfd < 0)
{
ERR_EXIT("listen client fail");
}
//定义客户端的套接字,这里返回一个新的套接字,后面通信时,就用这个m_connfd进行通信
//struct sockaddr_in client_addr;
//socklen_t client_len = sizeof(client_addr);
//int m_connfd = accept(m_sockfd, (struct sockaddr *)&client_addr, &client_len);
printf("client accept successn");
struct sockaddr_in client_addr;
socklen_t client_len = sizeof(client_addr);
//接收客户端数据,并相应
char buffer[BUF_SIZE];
int array_fd[MAX_FD_NUM];
//客户端连接数量
int client_count = 0;
fd_set tmpfd;
int max_fd = m_sockfd;
struct timeval timeout;
for (int i = 0; i < MAX_FD_NUM; i )
{
array_fd[i] = -1;
}
//array_fd[0] = m_sockfd;
while (1)
{
FD_ZERO(&tmpfd);
FD_SET(m_sockfd, &tmpfd);
int i;
//所有在线的客户端加入到fd中,并找出最大的socket
for (i = 0; i < MAX_FD_NUM; i )
{
if (array_fd[i] > 0)
{
FD_SET(array_fd[i], &tmpfd); //set array_fd in red_set
if (max_fd < array_fd[i])
{
max_fd = array_fd[i]; //get max_fd
}
}
}
int ret = select(max_fd 1, &tmpfd, NULL, NULL, NULL);
if (ret < 0)
{
ERR_EXIT("select fail");
}
else if (ret == 0)
{
//ERR_EXIT("select timeout"); //超时不是错误,不可断掉连接
printf("select timeoutn");
continue;
}
//表示有客户端连接
if (FD_ISSET(m_sockfd, &tmpfd))
{
int m_connfd = accept(m_sockfd, (struct sockaddr *)&client_addr, &client_len);
if (m_connfd < 0)
{
ERR_EXIT("server accept fail");
}
//客户端连接数已满
if (client_count >= MAX_FD_NUM)
{
printf("max connections arrive!!!n");
// char buff[]="max connections arrive!!!";
// send(m_connfd, buff, sizeof(buff) - 1, 0);
close(m_connfd);
continue;
}
//客户端数量加1
client_count ;
printf("we got a new connection, client_socket=%d, client_count=%d, ip=%s, port=%dn", m_connfd, client_count, inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));
for (i = 0; i < MAX_FD_NUM; i )
{
if (array_fd[i] == -1)
{
array_fd[i] = m_connfd;
break;
}
}
}
//遍历所有的客户端连接,找到发送数据的那个客户端描述符
for (i = 0; i < MAX_FD_NUM; i )
{
if (array_fd[i] < 0)
{
continue;
}
//有客户端发送过来的数据
else
{
if (FD_ISSET(array_fd[i], &tmpfd))
{
memset(buffer, 0, sizeof(buffer)); //重置缓冲区
int recv_len = recv(array_fd[i], buffer, sizeof(buffer) - 1, 0);
if (recv_len < 0)
{
ERR_EXIT("recv data fail");
}
//客户端断开连接
else if (recv_len == 0)
{
client_count--;
//打印断开的客户端数据
printf("client_socket=[%d] close, client_count=[%d], ip=%s, port=%dnn", array_fd[i], client_count, inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port));
close(array_fd[i]);
FD_CLR(array_fd[i], &tmpfd);
array_fd[i] = -1;
}
else
{
printf("server recv:%sn", buffer);
strcat(buffer, " ACK");
send(array_fd[i], buffer, sizeof(buffer) - 1, 0);
}
}
}
}
}
//关闭套接字
close(m_sockfd);
printf("server socket closed!!!n");
return 0;
}
2.1、客户端代码:
代码语言:javascript复制#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 512
#define ERR_EXIT(m)
do
{
perror(m);
exit(EXIT_FAILURE);
} while (0)
int main()
{
//创建套接字
int m_sockfd = socket(AF_INET, SOCK_STREAM, 0);
if (m_sockfd < 0)
{
ERR_EXIT("create socket fail");
}
//服务器的ip为本地,端口号
struct sockaddr_in server_addr;
memset(&server_addr, 0, sizeof(server_addr));
server_addr.sin_family = AF_INET;
server_addr.sin_addr.s_addr = inet_addr("81.68.140.74");
server_addr.sin_port = htons(39002);
//向服务器发送连接请求
int m_connectfd = connect(m_sockfd, (struct sockaddr *)&server_addr, sizeof(server_addr));
if (m_connectfd < 0)
{
ERR_EXIT("connect server fail");
}
//发送并接收数据
char buffer[BUF_SIZE];
while (1)
{
memset(buffer, 0, sizeof(buffer)); //重置缓冲区
printf("client send:");
scanf("%s", buffer);
send(m_sockfd, buffer, sizeof(buffer) - 1, MSG_NOSIGNAL);
recv(m_sockfd, buffer, sizeof(buffer) - 1, 0);
printf("client recv:%sn", buffer);
}
//断开连接
close(m_sockfd);
printf("client socket closed!!!n");
return 0;
}
3、select结构刨析
说到select的IO多路复用就不得不提fd_set这个变量类型,首先我们打开Linux的fd_set数据结构的源码我们可以看到,就是一个长度为32的long int类型的数组(要注意,windows的源码和Linux的不一样)。每一位可以代表一个文件描述符,所以fd_set最多表示1024个文件描述符!
这里为啥是1024个描述符呢?long int长度是32bit,数组长度是32,32*32=1024!
如果知道epoll用法的童鞋,可能就会知道,最多只能表示1024个文件描述符恰恰也成为了select的缺陷!
言归正传,fd_set中的每一bit可以对应一个文件描述符fd,则1字节长的fd_set最大可以对应8个fd。现在我们来看看fd_set定义的几个宏
代码语言:javascript复制#include <sys/select.h>
int FD_ZERO(fd_set *fdset);
int FD_SET(int fd, fd_set *fd_set);
int FD_ISSET(int fd, fd_set *fdset);
int FD_CLR(int fd, fd_set *fdset);
我们假设fdset就一个字节,就是8位,那么
(1)执行FD_ZERO(&fdset),则set用位表示是00000000,就是所有位都清空成0,一般刚开始的时候就需要清空。
(2)执行FD_SET(fd,&fdset),若fd=5,后set变为00010000,第5位置为1,就是将客户端连接的描述字(一般就是一个整数啦)放入到set当中。
(3)执行FD_ISSET(fd,&fdset),若fd=5,则就是判断set的第5位是否是1,一般用来判断是否客户端的连接。
(4)执行FD_CLR(fd,&fdset),若fd=5,则就是将第5位置成0,在断开客户端连接的时候,一定要记得调用这个。
以上的铺垫都做完之后,我们将要引出重量级的选手select,首先我们先来看下select的函数定义。
代码语言:javascript复制int select(int maxfdp, fd_set *readset, fd_set *writeset, fd_set *exceptset,struct timeval *timeout);
参数说明:
maxfdp:被监听的文件描述符的总数,它比所有文件描述符集合中的文件描述符的最大值大1,因为文件描述符是从0开始计数的;
fd_set *readset: 该参数是我们所关心的文件是否可读的文件描述符的集合,如果这个集合中有个文件可读了,那select返回一个大于0的数,表示有文件可读了,比如说服务端接收到客户端的数据,服务端都是读的状态,所以正常读的文件都放在这里。
fd_set *writeset:那这个大家就比较好理解了,服务端发到客户端的数据,要写入到缓冲区,那么所有正常写的文件都放在这里。
fd_set *exceptset:在所有正常读和正常写的时候,产生了异常情况,那么异常文件就放在这里。
timeval *timeout:用于设置select函数的超时时间,即告诉内核select等待多长时间之后就放弃等待。这个参数使select处于三种状态:(1)timeout传入NULL,则select一直等到文件状态有变化时才返回,这段时间一直处于阻塞状态。(2):timeout传入0,则select会立即返回(非阻塞),如果文件状态有变化则返回一个大于0的值没有变化则返回0;(3)timeout传入一个大于0的数,则select在timeout时间内阻塞,一旦文件状态有变化就会返回,超时后不管怎样都会返回值同样是文件状态右边话就返回一个大于0的值,无变化则返回0;
timeval结构体定义如下:
代码语言:javascript复制struct timeval
{
long tv_sec; /*秒 */
long tv_usec; /*微秒 */
};
说完了用到的知识点,我来解释一下代码的部分实现。首先定义了一个array_fd的整形数据,数组的最长长度是MAX_FD_NUM,数组中存放的就是客户端连接的描述符,说白了就是客户端的连接,初始化的时候置成-1,只要客户端连接上了,就是描述符插入数组(实际上就是将其中的一个-1置成描述符)。最后遍历所有的客户端连接,找到发送数据的那个客户端描述符。
刚开始看这些代码的时候可能有点难,但是只要掌握了以上知识点,那么再看这些代码就很简单了。
4、新的问题,千万级的并发
我们刚才说到了select的IO多路复用最多只能支持1024个连接,超过了就不支持了,这个最大值用宏FD_SETSIZE定义的。可是我们实际的有些大的应用,连接数很容易超过这个数字,那如果还用这个就需要更改linux内核的select.h文件,然后重新编译内核了,这是一个问题。另一个是我们select的原理是遍历所有的连接,找到需要的那个,一旦连接数越多,就耗费资源,这是一对相互的矛盾体。最后假设我们的服务器需要支持100万的并发连接,则在FD_SETSIZE为1024的情况下,则我们至少需要开辟1k个进程才能实现100万的并发连接。除了进程间上下文切换的时间消耗外,从内核/用户空间大量的无脑内存拷贝、数组轮询等,是系统难以承受的。因此,基于select模型的服务器程序,要达到10万级别的并发访问,是一个很难完成的任务。
那么在高并发下,我们又该怎么做呢?你能想的到解决方法吗?