【C进阶】拿着"sizeof这些用法和坑"去吹牛吧!

2020-10-29 12:55:33 浏览数 (1)

1、聊一聊

今天分享一首bug技术交流群里小伙伴推荐的歌曲,bug菌听了以后心情久久难以平复,一首非常伤感的歌曲,当然更特别的是其背后的故事。(记得做好心理准备再听!)

本文跟大家分享的是C语言中sizeof一些需要注意的知识点,一方面可以避免大家再次掉坑,另一方面可以拿去吹吹牛!

2、正确认识sizeof

01

非函数

首先大家需要明确,sizeof不是一个函数而是一个操作符,一些小伙伴经常口头上挂着"sizeof函数",这种说法是不正确的。

应该也好理解,比如sizeof(int),里面并没有传递实参,如果其为函数便不成立,所以sizeof仅仅只是一个操作符,继续实验一下:

参考demo:

代码语言:javascript复制
#include <stdio.h>
#include <stdlib.h>

/***************************************
 * Fuction: sizeof简单测试 
 * Author:   (公众号:最后一个bug) 
 **************************************/
int main(int argc, char *argv[]) {
    int a = 5; 
    printf("sizeof(char)= %dn",sizeof(char));
    printf("sizeof(int)= %dn",sizeof(int));
    printf("sizeof(float)= %dn",sizeof(float));
    printf("sizeof(double)= %dn",sizeof(double));
    printf("sizeof(a)= %dn",sizeof(a));
    return 0;
}

汇编与结果:

分析一下:

  • 汇编中5个红线标记处对应着C语言中5个sizeof使用点,在最终的汇编代码中并没有看到sizeof的痕迹。
  • 同时还可以确认一点的是sizeof在编译阶段就完成了转化,所以经常有小伙伴考虑到sizeof会不会很耗时间等等,从这里看它仅仅只是一个常量,对程序的运行影响与常量是一致的。

02

便于移植

因为在不同的平台或者是编译器,这些基础的数据类型所占用的内存字节空间不一定是相同的。

sizeof功能就是计算出数据类型在内存空间所占的字节数,这样就增强了程序的可移植性,特别是当我们进行内存拷贝的时候显得尤为有用。

比如一个大型结构体数据的内存拷贝,当由于内存数据类型发生变化,或者是数据对齐等等原因导致该结构体所占内存发生变化,如果你采用的memcpy函数指定的大小没有跟随发生改变,则会出现问题,如下面示例:

参考demo:

代码语言:javascript复制
#include <stdio.h>
#include <stdlib.h>
#include <malloc.h>

//采用默认对齐 
typedef struct _tag_Test1
{
    char Val1;
    int  Val2;
    char Val3;  
}sTest1;

sTest1 stTest1={1,2,3};

//采用一个字节对齐 
#pragma pack(1)
typedef struct _tag_Test2
{
    char Val1;
    int  Val2;
    char Val3;  
}sTest2;

#pragma pack(0)
sTest2 stTest2={4,5,6};
/***************************************
 * Fuction: sizeof可移植性 
 * Author:   (公众号:最后一个bug) 
 **************************************/
int main(int argc, char *argv[]) {

    sTest1 stTest1_ds;
    sTest2 stTest2_ds; 

    printf("sizeof(sTest1) = %dn",sizeof(sTest1));
    printf("sizeof(sTest2) = %dn",sizeof(sTest2));

  // memcpy(&stTest1_ds,&stTest1,12);  //12和6硬编程,可移植性不好 
  // memcpy(&stTest2_ds,&stTest2,6);

    memcpy(&stTest1_ds,&stTest1,sizeof(sTest1));
    memcpy(&stTest2_ds,&stTest2,sizeof(sTest2));

    printf("%d  %d  %dn",stTest1_ds.Val1,stTest1_ds.Val2,stTest1_ds.Val3);
    printf("%d  %d  %dn",stTest2_ds.Val1,stTest2_ds.Val2,stTest2_ds.Val3);

    return 0;
}

输出结果:

分析一下:

  • 上面bug菌为了解释结构体在不同平台占用空间有所不同,通过设置结构体对齐来进行了模拟(如何设置结构体对其字节个数可要学会!),使用sizeof明显要比硬编程的移植性更好。
  • 结构体对齐不太不理解的可以参考<听说因为代码没"对齐"程序就奔了?(深度剖析)>。

03

无符号类型

在之前的文中bug菌讲到了strlen返回的是size_t类型,其为无符号类型,参考<【C进阶】一不小心就被"strlen"给坑了!>,那么sizeof编译器会处理成什么类型呢? 不防做个实验:

参考demo:

代码语言:javascript复制
#include <stdio.h>
#include <stdlib.h>

/***************************************
 * Fuction: sizeof类型测试 
 * Author:   (公众号:最后一个bug) 
 **************************************/
int main(int argc, char *argv[]) {

    int i= -1;

    if(i > sizeof(int))
    {
        printf("sizeof 采用无符号类型n");   
    }
    else
    {
        printf("sizeof 采用有符号类型n");   
    } 

    return 0;
}

输出结果:

分析一下:

  • -1 > 4的结果是C语言进行了自动类型转化,不理解的可参考<【重磅】“整形数”还真没那么简单(C语言版)>;
  • sizeof和strlen函数的返回类型一样,都是size_t类型(可能有些平台指定为unsigned int),而该类型一般定义无符号整形,这样也就会出现如上的实验现象,以后多加小心。其实也很好理解,它们都是计算数据长度的方法也就没有必要使用有符号类型。
  • 这里提到strlen与sizeof,也是经常使用过程中容易混淆的,这两者有些相似也有不同,不过大家只要从定义出发就没有问题了,如下Demo:
代码语言:javascript复制
#include <stdio.h>
#include <stdlib.h>

/***************************************
 * Fuction: sizeof与strlen 
 * Author:   (公众号:最后一个bug) 
 **************************************/
int main(int argc, char *argv[]) {

    char * cbug = "bug"; 

    printf("sizeof(cbug) = %dn",sizeof(cbug)); // b u g n 

    printf("strlen(cbug) = %dn",strlen(cbug)); // b u g 

    return 0;
}

04

作用单一

这一点大家可能会疑惑,这里所说的单一不是说功能单一,而是sizeof只在编译阶段检测并计算其后的类型,其他表达式均不处理,见代码见真相 :

参考demo:

代码语言:javascript复制
#include <stdio.h>
#include <stdlib.h>

/***************************************
 * Fuction:  Cal 
 * Author:   (公众号:最后一个bug) 
 **************************************/
int Cal(int *param1,int *param2,int *result)
{
    *result = *param1   *param2;
     return 1;
} 

/***************************************
 * Fuction: sizeof重点实例 
 * Author:   (公众号:最后一个bug) 
 **************************************/
int main(int argc, char *argv[]) {

    int i = 1; 
    char j = 1; 
    int a = 2;
    int b = 2;
    int ret = 0;

    printf("sizeof(i  )  = %dn",sizeof(i  ));  
    printf("sizeof(  i)  = %dn",sizeof(  i));  
    printf("sizeof   i   = %dn",sizeof   j);   

    printf("sizeof(Cal)  = %dn",sizeof(Cal(&a,&b,&ret)));
    printf("sizeof Cal   = %dn",sizeof Cal(&a,&b,&ret)); 

    printf("i            = %dn",i);
    printf("j            = %dn",j);    
    printf("ret          = %dn",ret);  
    return 0;
}

输出结果:

分析一下:

  • 通过上面的实验大家可以发现sizeof后的表达式均没有执行,编译器把sizeof修饰部分通过计算其类型占用空间大小直接替换。
  • 所以很多小伙伴编码比较随意容易出现这种类型的bug,当然sizeof后面接具体的数据类型一定需要小括号,而是其他非void表达式均可以省略该小括号,上面的实例中为大家展示了。

05

其他

最后两个小细节:

  • 1 ) sizeof(数组名)和sizeof(指针)的差别。前者为总的数组字节个数,而后者仅为平台指针所占字节个数。
  • 2 ) sizeof不能用来计算位域大小。其实也很好理解,sizeof仅仅只计算字节个数,位域bit个数编译器不识别。

前提条件

现以上内容暂不考虑C99标准下的sizeof的使用情况。

由于在C99标准下存在不定长数组的使用,从而使得sizeof会在程序运行阶段确定对应的类型字节个数

5、结束语

本文到这里就结束了,sizeof理解好了其实并不难,就怕你阅读一些反人类的代码,从而造成理解上的困难!当然面试官也可能考你一波!

0 人点赞