1、聊一聊
今天分享一首bug技术交流群里小伙伴推荐的歌曲,bug菌听了以后心情久久难以平复,一首非常伤感的歌曲,当然更特别的是其背后的故事。(记得做好心理准备再听!)
本文跟大家分享的是C语言中sizeof一些需要注意的知识点,一方面可以避免大家再次掉坑,另一方面可以拿去吹吹牛!
2、正确认识sizeof
01
非函数
首先大家需要明确,sizeof不是一个函数而是一个操作符,一些小伙伴经常口头上挂着"sizeof函数",这种说法是不正确的。
应该也好理解,比如sizeof(int),里面并没有传递实参,如果其为函数便不成立,所以sizeof仅仅只是一个操作符,继续实验一下:
代码语言:javascript复制参考demo:
#include <stdio.h>
#include <stdlib.h>
/***************************************
* Fuction: sizeof简单测试
* Author: (公众号:最后一个bug)
**************************************/
int main(int argc, char *argv[]) {
int a = 5;
printf("sizeof(char)= %dn",sizeof(char));
printf("sizeof(int)= %dn",sizeof(int));
printf("sizeof(float)= %dn",sizeof(float));
printf("sizeof(double)= %dn",sizeof(double));
printf("sizeof(a)= %dn",sizeof(a));
return 0;
}
汇编与结果:
分析一下:
- 汇编中5个红线标记处对应着C语言中5个sizeof使用点,在最终的汇编代码中并没有看到sizeof的痕迹。
- 同时还可以确认一点的是sizeof在编译阶段就完成了转化,所以经常有小伙伴考虑到sizeof会不会很耗时间等等,从这里看它仅仅只是一个常量,对程序的运行影响与常量是一致的。
02
便于移植
因为在不同的平台或者是编译器,这些基础的数据类型所占用的内存字节空间不一定是相同的。
sizeof功能就是计算出数据类型在内存空间所占的字节数,这样就增强了程序的可移植性,特别是当我们进行内存拷贝的时候显得尤为有用。
比如一个大型结构体数据的内存拷贝,当由于内存数据类型发生变化,或者是数据对齐等等原因导致该结构体所占内存发生变化,如果你采用的memcpy函数指定的大小没有跟随发生改变,则会出现问题,如下面示例:
代码语言:javascript复制参考demo:
#include <stdio.h>
#include <stdlib.h>
#include <malloc.h>
//采用默认对齐
typedef struct _tag_Test1
{
char Val1;
int Val2;
char Val3;
}sTest1;
sTest1 stTest1={1,2,3};
//采用一个字节对齐
#pragma pack(1)
typedef struct _tag_Test2
{
char Val1;
int Val2;
char Val3;
}sTest2;
#pragma pack(0)
sTest2 stTest2={4,5,6};
/***************************************
* Fuction: sizeof可移植性
* Author: (公众号:最后一个bug)
**************************************/
int main(int argc, char *argv[]) {
sTest1 stTest1_ds;
sTest2 stTest2_ds;
printf("sizeof(sTest1) = %dn",sizeof(sTest1));
printf("sizeof(sTest2) = %dn",sizeof(sTest2));
// memcpy(&stTest1_ds,&stTest1,12); //12和6硬编程,可移植性不好
// memcpy(&stTest2_ds,&stTest2,6);
memcpy(&stTest1_ds,&stTest1,sizeof(sTest1));
memcpy(&stTest2_ds,&stTest2,sizeof(sTest2));
printf("%d %d %dn",stTest1_ds.Val1,stTest1_ds.Val2,stTest1_ds.Val3);
printf("%d %d %dn",stTest2_ds.Val1,stTest2_ds.Val2,stTest2_ds.Val3);
return 0;
}
输出结果:
分析一下:
- 上面bug菌为了解释结构体在不同平台占用空间有所不同,通过设置结构体对齐来进行了模拟(如何设置结构体对其字节个数可要学会!),使用sizeof明显要比硬编程的移植性更好。
- 结构体对齐不太不理解的可以参考<听说因为代码没"对齐"程序就奔了?(深度剖析)>。
03
无符号类型
在之前的文中bug菌讲到了strlen返回的是size_t类型,其为无符号类型,参考<【C进阶】一不小心就被"strlen"给坑了!>,那么sizeof编译器会处理成什么类型呢? 不防做个实验:
代码语言:javascript复制参考demo:
#include <stdio.h>
#include <stdlib.h>
/***************************************
* Fuction: sizeof类型测试
* Author: (公众号:最后一个bug)
**************************************/
int main(int argc, char *argv[]) {
int i= -1;
if(i > sizeof(int))
{
printf("sizeof 采用无符号类型n");
}
else
{
printf("sizeof 采用有符号类型n");
}
return 0;
}
输出结果:
分析一下:
- -1 > 4的结果是C语言进行了自动类型转化,不理解的可参考<【重磅】“整形数”还真没那么简单(C语言版)>;
- sizeof和strlen函数的返回类型一样,都是size_t类型(可能有些平台指定为unsigned int),而该类型一般定义无符号整形,这样也就会出现如上的实验现象,以后多加小心。其实也很好理解,它们都是计算数据长度的方法也就没有必要使用有符号类型。
- 这里提到strlen与sizeof,也是经常使用过程中容易混淆的,这两者有些相似也有不同,不过大家只要从定义出发就没有问题了,如下Demo:
#include <stdio.h>
#include <stdlib.h>
/***************************************
* Fuction: sizeof与strlen
* Author: (公众号:最后一个bug)
**************************************/
int main(int argc, char *argv[]) {
char * cbug = "bug";
printf("sizeof(cbug) = %dn",sizeof(cbug)); // b u g n
printf("strlen(cbug) = %dn",strlen(cbug)); // b u g
return 0;
}
04
作用单一
这一点大家可能会疑惑,这里所说的单一不是说功能单一,而是sizeof只在编译阶段检测并计算其后的类型,其他表达式均不处理,见代码见真相 :
代码语言:javascript复制参考demo:
#include <stdio.h>
#include <stdlib.h>
/***************************************
* Fuction: Cal
* Author: (公众号:最后一个bug)
**************************************/
int Cal(int *param1,int *param2,int *result)
{
*result = *param1 *param2;
return 1;
}
/***************************************
* Fuction: sizeof重点实例
* Author: (公众号:最后一个bug)
**************************************/
int main(int argc, char *argv[]) {
int i = 1;
char j = 1;
int a = 2;
int b = 2;
int ret = 0;
printf("sizeof(i ) = %dn",sizeof(i ));
printf("sizeof( i) = %dn",sizeof( i));
printf("sizeof i = %dn",sizeof j);
printf("sizeof(Cal) = %dn",sizeof(Cal(&a,&b,&ret)));
printf("sizeof Cal = %dn",sizeof Cal(&a,&b,&ret));
printf("i = %dn",i);
printf("j = %dn",j);
printf("ret = %dn",ret);
return 0;
}
输出结果:
分析一下:
- 通过上面的实验大家可以发现sizeof后的表达式均没有执行,编译器把sizeof修饰部分通过计算其类型占用空间大小直接替换。
- 所以很多小伙伴编码比较随意容易出现这种类型的bug,当然sizeof后面接具体的数据类型一定需要小括号,而是其他非void表达式均可以省略该小括号,上面的实例中为大家展示了。
05
其他
最后两个小细节:
- 1 ) sizeof(数组名)和sizeof(指针)的差别。前者为总的数组字节个数,而后者仅为平台指针所占字节个数。
- 2 ) sizeof不能用来计算位域大小。其实也很好理解,sizeof仅仅只计算字节个数,位域bit个数编译器不识别。
前提条件
现以上内容暂不考虑C99标准下的sizeof的使用情况。
由于在C99标准下存在不定长数组的使用,从而使得sizeof会在程序运行阶段确定对应的类型字节个数
5、结束语
本文到这里就结束了,sizeof理解好了其实并不难,就怕你阅读一些反人类的代码,从而造成理解上的困难!当然面试官也可能考你一波!