前言
前面我们也涉及到了结构体的讲解,但是只是粗略的讲了一下。 接下里详细讲解。
1.0 结构体声明
代码语言:javascript复制struct tag {
member-list
member-list
member-list
...
} variable-list ;
结构体定义已经讲过了,但是不够全面,现在来重新看看,用具体的例子来理解结构体的声明,
代码语言:javascript复制struct num
{
int num1;
int num2;
}s1;///声明类型的同时定义变量是s1
struct num s2;//定义结构体变量s2
struct num s3 = { 3,4 };//顺序初始化
//代码2
struct book
{
char name[20];
int num;
}b1 = { {"zhuangji"},1001 };//顺序初始化
struct book b2 = { .name = "tangmu",.num = 1002 };//指定顺序初始化
//代码3
struct Node
{
struct num;
struct Node* next;
}n1 = { {1,2},NULL };//结构体嵌套定义
struct Node n2 = { {5, 6}, NULL };//结构体嵌套初始化
以上初始化已经很详细了。
2.0 匿名结构体
什么是匿名结构体呢?
匿名结构体就是省略类型标签(tag),只有成员变量,没有成员名称。无结构体类型,不能创建变量,只能在空号外定义变量,不能再创建变量。
代码语言:javascript复制struct//匿名结构体
{
int a;
char arr[20];
}Node = {1,"zhangsan"};//匿名初始化
//}Node = {.a=1,"lisi"};匿名选择初始化
int main()
{
printf("%d %s",Node.a,Node.arr);
return 0;
}
这就是一个匿名结构体, 以及它的初始化,打印方式跟正常结构体相似。
注意
匿名的结构体类型,如果没有对结构体类型重命名的话,基本上只能使⽤⼀次。
3.0 自引用
代码语言:javascript复制struct Node
{
int data;
struct Node* next;//指针
}p;
这就是结构体自引用的表达式,这是正确的表达式。
倘若将代码改成这样,你认为合理吗?
代码语言:javascript复制struct Node
{
int data;
struct Node next;
}p;
这其实是不对的。 因为⼀个结构体中再包含⼀个同类型的结构体变量,这样结构体变量的⼤ ⼩就会⽆穷的⼤,是不合理的。
4.0 内存对齐
我们知道了结构体的声明,以及初始化和使用,那么我们创建的结构体是多少字节呢?这也是一个常考的知识点。
4.1 对齐规则
⾸先得掌握结构体的对⻬规则: 1. 结构体的第⼀个成员对⻬到和结构体变量起始位置偏移量为0的地址处 2.其他成员变量要对⻬到某个数字(对⻬数)的整数倍的地址处。
- 对⻬数=编译器默认的⼀个对⻬数与该成员变量⼤⼩的较⼩值。
- VS中默认的值为8
- Linux中gcc没有默认对齐数,对对齐数就是成员自身的大小。
3. 结构体总⼤⼩为最⼤对⻬数(结构体中每个成员变量都有⼀个对⻬数,所有对⻬数中最⼤的)的 整数倍。 4. 如果嵌套了结构体的情况,嵌套的结构体成员对⻬到⾃⼰的成员中最⼤对⻬数的整数倍处,结构 体的整体⼤⼩就是所有最⼤对⻬数(含嵌套结构体中成员的对⻬数)的整数倍。
什么意思呢?单看规则很难理解,我们直接上代码。
4.2 练习1
代码语言:javascript复制struct S1
{
char c1;
int i;
char c2;
};
int main()
{
printf("%zdn", sizeof(struct S1));
return 0;
}
输出结果:
12
那这个结果是怎么来的呢?
4.2.1 分析
注意:表中的一格代表一个字节。
偏移量:第一个字节相对于起始位置偏移量是0,第二个字节相对于起始位置偏移量是1。
假设我们从0开始存放,char c1的变量大小为1,所以存放一个字节(这时候的对齐数是1)。int i占四个字节,虽然vs默认值为8,但是int类型更小(这时候的对齐数是4),既偏移量1,2,3,都不是4的倍数,所以int放在偏移量为4的位置,char c2的大小是1,偏移量8是一的倍数,所以可以放。
你以为9就是struct S1的字节吗,那你就错了,我们还得对齐最大对齐数(4)。所以最后的结果就是12个字节。这样虽然会浪费空间,但是也是有一定的好处,我们之后再说。
4.3 练习2
代码语言:javascript复制struct S2
{
char c1;
char c2;
int i;
};
int main()
{
printf("%zdn", sizeof(struct S1));
return 0;
}
输出结果:
8
4.3.1 分析
char c1 占1个字节;char c2占1个自己,且对齐数是1,偏移量位1符合;int i占对齐数是4,偏移量位4刚刚好符合。都放完后,字节需要是最大对齐数的整数倍,所以就是8个字节。
4.4 练习3
代码语言:javascript复制struct S1
{
char c1;
int i;
char c2;
};
struct S3
{
char c1;
struct S1 s1;
double d;
};
int main()
{
printf("%zdn", sizeof(struct S3));
return 0;
}
4.3.1 分析
char c1占1一个字节,struct S1 s1上面我们已经知道了占12个字节,但为什么是偏移量为4的地方放呢?这是因为结构体S3中有S1,S1中的最大对齐位置取决于自己的最大对齐数,而S1的最大对齐数是4,所以从偏移量为4可以开始放s1;double d占8个字节,偏移量16刚刚好是8的倍数;所struct S3中最大的对齐数是12,而且字节刚刚好是24。
4.5 小结
S1和S2的变量成员是一样的,但字节大小却是不同的,所以我们再创建结构体变量的时候,尽可能的将字节较小的类型集中在一起,这样可以在一定程度上节省空间。
4.6 对齐数存在的意义
1. 平台原因(移植原因): 不是所有的硬件平台都能访问任意地址上的任意数据的;某些硬件平台只能在某些地址处取某些特定 类型的数据,否则抛出硬件异常。
2. 性能原因: 数据结构(尤其是栈)应该尽可能地在⾃然边界上对⻬。原因在于,为了访问未对⻬的内存,处理器需要 作两次内存访问;⽽对⻬的内存访问仅需要⼀次访问。假设⼀个处理器总是从内存中取8个字节,则地 址必须是8的倍数。如果我们能保证将所有的double类型的数据的地址都对⻬成8的倍数,那么就可以 ⽤⼀个内存操作来读或者写值了。否则,我们可能需要执⾏两次内存访问,因为对象可能被分放在两 个8字节内存块中。
总体来说:结构体的内存对⻬是拿空间来换取时间的做法。
4.7 修改默认对齐数
代码语言:javascript复制#pragma 这个预处理指令,可以改变编译器的默认对⻬数。
我们直接看代码
代码语言:javascript复制#pragma pack(1)//设置默认对⻬数为1
struct S1
{
char c1;
int i;
char c2;
};
#pragma pack()//取消设置的对⻬数,还原为默认
int main()
{
printf("%zdn", sizeof(struct S1));
return 0;
}
原本打印的结果是12,但这这里改了。
输出结果:
6
结构体在对⻬⽅式不合适的时候,我们可以⾃⼰更改默认对⻬数。
5.0 结构体传参
通过上面的学习我们知道,结构体所占字节一般都是很大的,所以在函数应用过程中,往往会采用传址,传地址只需要48个字节,不需要开辟那么大的空间;传值浪费空间,需要拷贝,占的空=空间是比较大的。
代码语言:javascript复制struct S1
{
char c1;
int i;
char c2;
}p = {.i=10};
void test(struct S1*P)
{
printf("%d", P->i);
}
int main()
{
test(&p);
return 0;
}
如果是传值:函数传参的时候,参数是需要压栈,会有时间和空间上的系统开销。如果传递⼀个结构体对象的时候,结构体过⼤,参数压栈的的系统开销⽐较⼤,所以会导致性能的下降。
结论: 结构体传参,传结构体的地址。
6.0 结构体实现位段
5.1 定义
结构体位段(bit field)是一种数据结构,在C语言中用于存储和操作内存中的位级数据。结构体位段允许程序员指定一个变量只占用指定位数的内存空间,而不是整个字节或字。这种灵活性允许在一个字节或字中存储多个不同的位级信息,从而节省内存空间。
5.2 位段声明
位段的声明和结构是类似的,有两个不同:
- 位段的成员必须是 int 、 unsigned int 或 signed int ,在C99中位段成员的类型也可以 选择其他类型。
- 位段的成员名后边有⼀个冒号和⼀个数字。
//位段式结构
struct A
{
int _a : 2;//2个bit位
int _b : 5;//5个bit位
int _c : 10;//10个bit位
int _d : 30;//30个bit位
};
int main()
{
printf("%zd",sizeof(struct A));
return 0;
}
有的同学可能会算2 5 10 30 = 47bit位,那么就是6个字节。是不是这样?我们来看啊看结果
输出结果:
8
为什么会是8呢?这就与 位段内存分配有关了。
5.3 位段内存分配
- 位段的成员可以是 int、unsigned int、signed int或者char等类型。
- 位段的空间上是按照需要以4个字节( signed int 或者是 char 等类型 int )或者1个字节( char )的⽅式来开辟的。
- 位段涉及很多不确定因素,位段是不跨平台的,注重可移植的程序应该避免使⽤位段。
struct S
{
char a : 3;
char b : 4;
char c : 5;
char d : 4;
};
struct S s = { 0 };
s.a = 10;
s.b = 12;
s.c = 3;
s.d = 4;
5.4 位段的跨平台问题
- int 位段被当成有符号数还是⽆符号数是不确定的。
- 位段中最⼤位的数⽬不能确定。(16位机器最⼤16,32位机器最⼤32,写成27,在16位机器会 出问题。
- 位段中的成员在内存中从左向右分配,还是从右向左分配标准尚未定义。
- 当⼀个结构包含两个位段,第⼆个位段成员⽐较⼤,⽆法容纳于第⼀个位段剩余的位时,是舍弃 剩余的位还是利⽤,这是不确定的。
总结:
跟结构相⽐,位段可以达到同样的效果,并且可以很好的节省空间,但是有跨平台的问题存在
5.5 位段使⽤的注意事项
在使用结构体位段时需要注意以下几点:
- 内存对齐:位字段的大小通常由编译器自动选择,为了满足对齐要求,可能会在位字段之间插入额外的填充位。因此,位字段的大小可能不等于字段成员所占的位数之和。开发者需要了解编译器对位字段进行内存对齐的规则,以确保结构体的大小和内存布局符合预期。
- 位字段的类型:位字段的类型可以是整型或枚举类型,但不能是浮点型、指针类型等。这是因为浮点型和指针类型的大小是可变的,无法确定应该占多少个位。
- 位字段的命名和长度:位字段的命名要足够清晰明确,以便其他开发者能够理解其含义。位字段的长度要根据具体需求进行选择,过长的位字段可能会造成浪费,而过短的位字段可能无法容纳所需要的数据。
- 位字段的操作:位字段是以位为单位进行操作的,因此在对位字段进行赋值和取值操作时,需要使用位运算符来进行操作。开发者需要熟悉位运算符的使用方法,以确保对位字段进行正确的操作。
总之,使用结构体位段时需要了解内存对齐规则,选择适当的位字段类型、命名和长度,并使用正确的位运算符进行操作。这样才能正确地使用结构体位段,并确保代码的可读性和可维护性。