整型之韵,数之舞:大小端与浮点数的内存之旅

2024-10-09 20:16:16 浏览数 (1)

1.0 整形提升

我们先来看看代码。

代码语言:javascript复制
int main()
{
	char a = 3;
	char b = 127;
	char c = a   b;
	pritnf("%d", c);
	return 0;
}

这是char类型的相加,但你以为答案是130,那就是错了,事实没那么简单。

1.1 什么是整形提升

C语⾔中整型算术运算总是⾄少以缺省整型类型的精度来进⾏的。 为了获得这个精度,表达式中的字符和短整型操作数在使⽤之前被转换为普通整型,这种转换称为 型提升。

1.2 如何整形提升?

规则:

  1. 有符号整数提升是按照变量的数据类型的符号位来提升的
  2. ⽆符号整数提升,⾼位补0

打印结果:

-126

分析

代码语言:javascript复制
	char a = 3;
	00000000000000000000000000000011  //3的二进制
	00000011 char a
	char b = 127;
	00000000000000000000000001111111  //127的二进制
	01000000 char b
	char c = a   b;
	00000011 char a
	01000000 char b  //这里还不能直接相加,要对a和b进行整形提升
    //在vs下char是有符号的char,所以对char a进行整形的提升,符号位是0
	00000000000000000000000000000011 //char a的整形提升
	//同理,char b也是有符号的char,符号位是0
	00000000000000000000000001111111 //char b的整形提升
	00000000000000000000000010000010 //a   b,d但是char c中只能存放8个比特位
	10000010 //char c
	printf("%d", c);//%d是按十进制打印有符号的整数,但我们是char c,所以需要进行整形提升
	//char c是有符号数,最高位是1全补1.
	11111111111111111111111110000010 //char c整形提升的结果(补码)
	//打印的方式是原码,我们要对c补码进行,取反 1
	00000000000000000000000001111110 //原码
	//结果是-127

1.3 整形提升的意义

表达式的整型运算要在CPU的相应运算器件内执⾏,CPU内整型运算器(ALU)的操作数的字节⻓度⼀般就是int的字节⻓度,同时也是CPU的通⽤寄存器的⻓度。因此,即使两个char类型的相加,在CPU执⾏时实际上也要先转换为CPU内整型操作数的标准⻓ 度。 通⽤CPU(general-purposeCPU)是难以直接实现两个8⽐特字节直接相加运算(虽然机器指令中可能有这种字节相加指令)。所以,表达式中各种⻓度可能⼩于int⻓度的整型值,都必须先转换为 int或unsigned int,然后才能送⼊CPU去执⾏运算。

也就是说,小于整形的类型就要进行提升。

注意:char的是unsigned char 还是 signed char ,这是不确定的,而是取决于编译器。 但常见的编译器上char 一般都是signed char。

2.0 算术转换

如果某个操作符的各个操作数属于不同的类型,那么除⾮其中⼀个操作数的转换为另⼀个操作数的类 型,否则操作就⽆法进⾏。下⾯的层次体系称为寻常算术转换。

long double double float unsigned long int long int unsigned int int

如果某个操作数的类型在上⾯这个列表中排名靠后,那么⾸先要转换为另外⼀个操作数的类型后执⾏ 运算。

3.0 大小端

3.1 什么是大小端

大端小端是计算机存储数据的一种方式。在内存中,数据被分割为多个字节进行存储。大小端指的是字节的存储顺序。

大端存储是指高位字节被存储在低位地址,低位字节存储在高位地址。大端存储方式常用于网络协议中。

小端存储是指低位字节被存储在低位地址,高位字节存储在高位地址。小端存储方式常用于x86架构的计算机。

我们在vs2022提示可知,vs2022中采用的是小端存储的方式。

图示:

接下里我们用程序来判断vs2022里的是大端还是小端。

3.2 判断大小端

3.2.1指针判断
代码语言:javascript复制
#include<stdio.h>
int check_sys()
{
	int i = 1;
	return *(char*)&i;

}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	return 0;
}
3.2.2联合体判断
代码语言:javascript复制
int check_sys()
{
	union check {
		char j;
		int i;
	};
	union check u = { 0 };
	u.j = 1;
	return u.j;

}
int main()
{
	int ret = check_sys();
	if (ret == 1)
	{
		printf("小端");
	}
	else
	{
		printf("大端");
	}
	return 0;
}

打印结果:

小端

3.3大小端的意义

我们知道了大小端,然后有什么用呢?

  1. 确保数据传输的准确性:在不同系统或设备之间进行数据交换时,了解大小端可以确保数据被正确解释。
  2. 兼容不同的系统:有助于软件在各种平台上的移植和运行。
  3. 优化性能:根据大小端特点进行针对性的优化。
  4. 调试和排错:当出现数据解析问题时,能更快地定位问题。
  5. 理解系统架构:加深对计算机系统内部工作原理的理解。
  6. 网络通信:确保网络协议的正确实现和数据的无误传输。
  7. 硬件设计:对硬件设计和开发具有指导意义。
  8. 数据恢复:在数据恢复过程中,正确解读存储的数据。
  9. 提高编程效率:避免因大小端问题导致的错误。
  10. 增强系统安全性:防止因数据解读错误引发的安全漏洞。

两种存储方式的区别在于字节的存储顺序,对于单个字节的操作没有影响,但对于多个字节的数据,如整数和浮点数,字节顺序的不同会导致数据的解释和处理方式不同。因此,当不同大小端的计算机之间进行数据传输时,需要进行字节序的转换。

4.0浮点数在内存中的存储

浮点数在内存中的存储是怎么样的呢,跟整形的存储一样吗?答案:不是!接下里往下看。

4.1 浮点数的存储

根据国际标准IEEE(电⽓和电⼦⼯程协会)754,任意⼀个⼆进制浮点数V可以表⽰成下⾯的形式:

V = (−1) ^S*M *2^E • (-1)^S 表⽰符号位,当S=0,V为正数;当S=1,V为负数 • M表⽰有效数字,M是⼤于等于1,⼩于2的 • 表⽰指数位

二进制对应的十进制图

举例 ⼗进制的5.0,写成⼆进制是101.0 ,相当于1.01×2^2 。 那么,按照上⾯V的格式,可以得出S=0,M=1.01,E=2。 ⼗进制的-5.0,写成⼆进制是-101.0 ,相当于-1.01×2^2 。那么,S=1,M=1.01,E=2。 IEEE 754规定: 对于32位的浮点数,最⾼的1位存储符号位S,接着的8位存储指数E,剩下的23位存储有效数字M对于64位的浮点数,最⾼的1位存储符号位S,接着的11位存储指数E,剩下的52位存储有效数字M。

float类型浮点数内存分配 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/1b0c0e99b9084031924925b93dc6b415.png) double类型浮点数内存分配 ![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/6cf9f51a9a614d388262edfa1a31cc8b.png)

4.2 浮点数存的过程

IEEE 754对有效数字M和指数E,还有⼀些特别规定。 对于M 1≤M<2 ,也就是说,M可以写成1.xxxxxx 的形式,其中xxxxxx 表⽰⼩数部分。IEEE 754规定,在计算机内部保存M时,默认这个数的第⼀位总是1,因此可以被舍去,只保存后⾯的xxxxxx部分。⽐如保存1.01的时候,只保存01,等到读取的时候,再把第⼀位的1加上去。这样做的⽬的,是节省1位有效数字。以32位浮点数为例,留给M只有23位,将第⼀位的1舍去以后,等于可以保存24位有效数字。 对于E ,E为⼀个⽆符号整数(unsignedint) 这意味着,如果E为8位,它的取值范围为0255;如果E为11位,它的取值范围为02047。但是,我们知道,科学计数法中的E是可以出现负数的,所以IEEE754规定,存⼊内存时E的真实值必须再加上⼀个中间数,对于8位的E,这个中间数是127;对于11位的E,这个中间数是1023。⽐如,2^10的E是10,所以保存成32位浮点数时,必须保存成10 127=137,即10001001。

4.3 浮点数取的过程

指数E取出内存,情况有三。 1.E不全为0或不全为1 这时,浮点数就采⽤下⾯的规则表⽰,即指数E的计算值减去127(或1023),得到真实值,再将有效数字M前加上第⼀位的1。 ⽐如:0.5的⼆进制形式为0.1,由于规定正数部分必须为1,即将⼩数点右移1位,则为1.0*2^(-1),其阶码为-1 127(中间值)=126,表⽰为01111110,⽽尾数1.0去掉整数部分为0,补⻬0到23位00000000000000000000000,则其⼆进制表⽰形式为:

代码语言:javascript复制
 0 01111110 00000000000000000000000

2.E全为0

这时,浮点数的指数E等于1-127(或者1-1023)即为真实值,有效数字M不再加上第⼀位的1,⽽是还原为0.xxxxxx的⼩数。这样做是为了表⽰±0,以及接近于0的很⼩的数字。

代码语言:javascript复制
0 00000000 00100000000000000000000

3.E全为1 这时,如果有效数字M全为0,表⽰±⽆穷⼤(正负取决于符号位s);

代码语言:javascript复制
0 11111111 00010000000000000000000

这一篇到这里就完结了,感谢各位的观看。

0 人点赞