前言
之前在做一个关于数据传输的时候,使用到了 WiFi 传输数据,而在传输数据时使用到的协议就是 LwIP 协议栈中的 udp 协议。现在来回顾总结一下。要叙述 LwIP 协议栈,那自然得明白 LwIP 协议栈具体是个啥。总的来说,LwIP 是 TCP/IP 协议中一种独立、简单的实现,其设计目的在于保证嵌入式产品拥有完整 TCP/IP 功能的同时,又能够保证协议栈对处理器资源的有效消耗,其运行一般仅需要几十 KB 的 RAM 和 40KB 左右的 ROM。上述所说便是关于 LwIP 协议栈的相关叙述。
LwIP 的分层机制
在叙述 udp 协议概念之前,先对 LwIP 协议的框架有一个简单的了解,LwIP 在实现的时候,参考了 TCP/IP 协议的分层思想,每一层都在一个单独的模块中实现,并为其他层次模块提供一些输入/输出接口函数。下面是分层结构示意图:
image-20201219165628915
如同前面所说,LwIP 协议只是参考了 TCP/IP 的分层结构,但是它并没有严格地遵循上述所示地分层机制,其为了节省时间和空间上地消耗,各个层次之间存在着交叉存取地现象。
我们通过上述地框图可以知道 UDP 属于传输层协议。要明白为什么有传输层协议,我们需要明白在传输层的下一层,也就是网络互连层,有 IP 协议,IP 协议是用于数据报在各个主机中传递的,但是我们在实际的应用过程中,我们所需要的是数据报在各个应用之间传递,说白了也就是在进程与进程之间通信,而传输层的存在就是为了实现数据报在进程与进程之间通信的。
而要完成进程到进程之间的通信,传输层需要完成几个重要的任务:
- 第一:为两个通信的进程提供连接机制,也就是说传输层在接收了 IP 层传输过来的数据之后,应该将这个数据传到哪一个应用程序中。在这里是通过端口号来完成的。
- 第二:传输层需要提供数据传送服务。在数据发送端,传输层将数据进行组装、编号,将数据分割成可运输的单元,然后依次递交给 IP 层发送出去。而接收端的传输层需要等属于同一应用程序的数据都到达之后,对他们进行差错校验、最后将整个数据交付给应用程序。
- 第三:为了提供更为可靠的传输服务,传输层还应该提供流量控制机制。
UDP 协议
在简单地叙述了关于 LwIP 的框架之后,接下来详细阐述 UDP 地相关概念。UDP 称之为用户数据报协议,是一种无连接地、不可靠地传输协议,它只在低级程度上实现了上述地传输层功能,为什么说只在低级程度上实现了上述功能呢?因为它只是简单地完成数据从一个进程到另一个进程地交付,它没有提供任何流量控制机制,收到地报文也没有确认,差错控制上,只提供了检验和计算,当校验和计算不成功时,它将丢弃掉这个报文。
当用户的进程使用 UDP 来传送数据的时候,会经历三个过程
- (1)UDP 协议会在数据前加上首部组成 UDP 报文,并交给 IP 协议来发送
- (2)IP 层将报文封装在 IP 数据报中并交给底层发送
- (3)底层,IP 数据报被封装在物理数据帧中
UDP 数据的封装
在 UDP 的接收端,物理网络先接收到数据帧,然后逐层将数据递交给上层协议,每一层都在向上一层去除掉一个首部。
## UDP 报文格式
UDP 报文成为用户数据报,从结构上可以分为两部分:UDP 首部和 UDP 数据区,下面是报文结构示意图:
image-20201219205656710
UDP 校验和的计算超过了 UDP 报文本身,为了计算校验和,UDP 引入了伪首部的概念,加入了伪首部之后的 UDP 报文格式如下图所示:
image-20201219210404321
这里需要指出的一点是,伪首部完全是虚拟的,它并不会和用户数据报一起被发送出去,只是在校验和的计算过程中会被使用到,伪首部主要来自于运载 UDP 报文的 IP 数据报首部,将源 IP 地址和目的 IP 地址加入到校验和的计算中可以验证用户数据报是否已经到达正确的终点。
UDP 数据结构体解析
报文首部结构
先来看下 UDP 数据报首部,代码如下:
代码语言:javascript复制#define UDP_HLEN 8
PACK_STRUCT_BEGIN
struct udp_hdr {
PACK_STRUCT_FIELD(u16_t src);
PACK_STRUCT_FIELD(u16_t dest); /* src/dest UDP ports */
PACK_STRUCT_FIELD(u16_t len);
PACK_STRUCT_FIELD(u16_t chksum);
} PACK_STRUCT_STRUCT;
PACK_STRUCT_END
这个结构体很简洁,使用结构体封装宏定义的每个字段,还应该注意的是四个字段保存的值应该与网络字段保持一致。
udp 控制块
控制块是整个 UDP 中最为核心的东西,用户使用 UDP 进行编程,以及对于 UDP 报文的处理,本质上都是对 UDP 控制块进行操作。一个 UDP 的控制块包含 UDP 连接时需要的所有信息,主要包括:
- 端口号
- 目的端口号
- 源 IP 地址
- 目的 IP 地址
总体来说,系统会为每一个连接分配一个 UDP 控制块,然后将他们组织在一个全局的链表上,当 UDP 收到 IP 层递交的报文的时候,就会去遍历这个链表,找出与报文中首部信息匹配的控制块,并调用控制块中注册的函数最终完成报文的处理。
在定义 UDP 控制块的时候,会使用到 IP的控制块
代码语言:javascript复制#define IP_PCB struct ip_addr local_ip;
struct ip_addr remote_ip;
/* Socket options */
u16_t so_options;
/* Type Of Service */
u8_t tos;
/* Time To Live */
u8_t ttl;
如上述所示,IP 控制块的定义是通过一个宏来实现的,它包含了本地 IP 地址、远端 IP 地址、socket 选项、服务类型、生存时间这几个字段。有了 UP 控制块之后,我们再来看 UDP 控制块,下面是 UDP 控制块的代码:
代码语言:javascript复制// 定义回调函数的类型
typedef void (*udp_recv_fn)(void *arg, struct udp_pcb *pcb, struct pbuf *p,
ip_addr_t *addr, u16_t port);
// 定义 UDP 控制块结构体
struct udp_pcb {
/* Common members of all PCB types */
IP_PCB;
/* Protocol specific PCB members */
struct udp_pcb *next;
u8_t flags;
/** ports are in host byte order */
u16_t local_port, remote_port;
#if LWIP_IGMP
/** outgoing network interface for multicast packets */
ip_addr_t multicast_ip;
#endif /* LWIP_IGMP */
#if LWIP_UDPLITE
/** used for UDP_LITE only */
u16_t chksum_len_rx, chksum_len_tx;
#endif /* LWIP_UDPLITE */
/** receive callback function */
udp_recv_fn recv;
/** user-supplied argument for the recv callback */
void *recv_arg;
}
UDP 协议实现的本质就是对链表上各个 UDP 控制块进行操作,再上述所示的结构体中,next 是一个 UDP 控制块类型的指针,他就是用来构成链表的。最后,需要注意的一点是,上述控制块中的最后两个字段的是用于用户和协议栈内核通信的纽带,反应再 udp 协议里,就是用来执行用户自定义的报文数据处理函数的。下面是三个控制块构成的一个链表的一个示意图:
image-20201220141759180
通过上述示意图我们可有看到第一个控制块和第二个控制块中,包含了本地和远程的 IP 地址和端口,所以他们处于连接状态。第三个控制块中,只包含了本地IP地址和端口,所以它处于未连接的状态。UDP 的的工作流程是什么呢?简单来说就是如果当前 UDP 控制块收到一个目的端口为 1234的数据报,那么内核就会从链表的起始处开始遍历整个链表,直到查出具有本地端口号 1234 的控制块。当找到控制块之后,控制块的 recv 字段指向的函数 proc1 会被调用以处理报文数据。
总结
上述就是关于 LwIP 中 udp 的一个解析,只是简单地说明了 UDP 地一个基本原理,它所涉及地控制块以及当 UDP 接收到数据报地时候,又是一个怎样地处理过程。当然,除了这些,关于 UDP 还有很多地内容,如何使用 UDP 发送数据和接收数据都没涉及到,关于 LwIP 内核地内容也还需要继续仔细研读。