数据的表示和存储——

文章列表

数据的表示和存储——

浮点数的编码表示

浮点数类型

编辑

浮点数的表示

（1）浮点数（Float Point）的表示范围

（2）规格化数形式

（3）IEEE 754标准

其他形式的机器数表示

个人总结

浮点数的编码表示

浮点数类型

C语言声明	操作数类型	存储长度（位）
float	单精度浮点数	32
double	双精度浮点数	64
long double	扩展精度浮点数	80 / 96

实数类型分为：单精度浮点，浮点双精度和扩展精度浮点

科学计数法（Scientific Notation）与浮点数

从上面可以看出，对于一个实数都可以用一个定点整数和定点小数来表示，其中规格化的形式，小数点前面只有一个非0的数，对于二进制表示时，必定是1

浮点数的表示

（1）浮点数（Float Point）的表示范围

以下面的32位浮点数格式的规格化数为例，计算表示范围

1、第0位数代表符号位

2、第1~8位为8位移码表示阶码E（偏置常数为128）

3、第9~31位为24位二进制原码小数表示的尾数M（tips：注意这里定点小数表示尾数是采用的原码表示）

规格化尾数的小数点后第一位总是1，故规定第一位默认的1不明显的表示出来，这样可以用23位表示24位的尾数

因为原码对称，故其表示范围关于原点对称。可表示范围包括图中的阴影部分和0

机器0：即尾数为0或落在下溢区中的数

浮点数范围比定点数大，但数的个数没变多，故数之间更稀疏，且不均匀

（2）规格化数形式

为了能表示更多有效数字，通常规定规格化数的小数点前为1

32bit规格化数

其中：

1）S是符号位（Sign）

2) Exponent用移码表示（移码其实就是原码加上一个偏置常数）来表示

3）Significand表示xxxxxxxxxx（部分尾数）基可以是2/4/8/16，约定信息，无需显示表示

早期的计算机各自用自己的浮点数，这样会带来的结果是在不同的计算机中采用不同的格式解析数据，其实是不通用的，所以出现了IEEE754标准

（3）IEEE 754标准

这里插入一个链接，讲解IEEE 754非常详细的一个博客

IEEE754标准: 一 , 浮点数在内存中的存储方式 - 知乎 (zhihu.com)

其中，需要注意的是上面的博客中没有指出阶码全0和全1是用来表示特殊情况的。

Q：为什么移码的偏置常数采用127而不是像之前的128

A: IEEE 754标准中，单精度浮点数可表示的范围是0000 0001（-126）~1111 1110（127）；如果偏置常数采用的是128，则32位浮点数可表示的范围是0000 0001（-127）~1111 1110（126），2^-126~2^127比2^-127~2^126可表示的范围大

Q:已知float型变量x的机器数为BEE0 0000H，求x的值是多少？

A:转换为2进制，1 0111 1101 110 0000 0000 0000 0000 0000

符号位：1（负数）

阶码（指数）：为避免混淆，用阶码表示阶的编码，用阶或者指数表示阶码的值

阶码：0111 1101B = 125

阶码的值：125-127 = -2（指数为-2）

尾数数值部分： 1 +1x2-1+ 1x2-2+ 0x2-3+ 0x2-4+ 0x2-5+… =1+2-1+2-2= 1+0.5 +0.25 = 1.75

所以真值是：-1.75x2^-2 = -0.4375

Q: 已知float型变量x的值为-12.75，求x的机器数是多少？
A: -12.75=-1100.11B =-1.10011B x 2^3

符号S=1
阶码E=127+3=128+2=1000 0010
显式表示的部分尾数Significant = 100 1100 0000 0000 0000 0000(第一个1可以不用显示表示出来，因为规格化规定小数点前面一个数是非0的而且只有一位，必定是一个1)

所以： x 的机器数表示为： 1 ，1000 0010， 100 1100 0000 0000 0000 0000
转换为十六进制表示为：C14C0000H

其他形式的机器数表示

前面定义的是针对规格化形式（normalized form）的数，那么，其他形式的机器数表示什么样的信息呢？

（1）0的机器数表示

0其实就是尾数部分和阶码部分都是为0的，不同的符号位表示+0和-0，二者都是有效的

How to represent 0?
exponent: all zeros
significand: all zeros
What about sign?Both cases valid.
+0: 0 00000000 00000000000000000000000
-0: 1 00000000 00000000000000000000000
（2）+∞/-∞的机器数表示

无穷其实就是阶码全为1，其中尾数部分全为0，不同的符号位表示正无穷和负无穷
浮点数除0的结果是+/-∞, 而不是溢出异常.（整数除0为异常）
为什么要这样处理? 可以利用+∞/-∞作比较。例如：X/0>Y可作为有效比较
How to represent +∞/-∞?
Exponent: all ones (11111111B = 255)
Significand: all zeros
+∞: 0 11111111 00000000000000000000000
-∞: 1 11111111 00000000000000000000000
（3）“非数”的表示（NaN)

非数，这个错误其实在编写程序的时候也是经常遇到的一种情况，其中非数就是阶码全为1，尾数部分不为0的情况
例如“Sqrt (-4.0) ”，“0/0”等的结果称为Not a Number (NaN) ，即“非数”
NaNs 可以帮助调试程序
How to represent NaN ？
Exponent： 255
Significand: nonzero
4. 非规格化数(Denorms)的表示

除了上面的三种情况，其实只剩下一种，就是阶码全为0，尾数部分不为0，这表示的就是非规格化数
How to represent Denorms?
Exponent： 0
Significand: nonzero

这张图，其实包含了很多信息，其中用规格化数表示浮点数其实不能表示完全，比如最小的整数用规格化数表示其实就是上面图中的1.0000....x2^-126，对于比如说2^-125~2^-124和2^-124~2^-123，其中后者长度是前者的两倍，但是由于尾数部分的位数是固定的，其实二者之间可以表示的数据的个数是一样的，都是2^23个，所以对于浮点数来说，数据越大，可以表示的最近的两个浮点数的距离是越来越大的，数据越小其实可以表示的数据精度越高，越有可能可以精确表示，但是数字越大，由于可以表示的数字间距越来越大，所以表示的就可能更不精确，这也是为什么我之前一直不知道为什么计算机不能表示任意的浮点数，比如0.1+0.2不是0.3会有偏差的原因，就是不能表示0.3只能取离它最近的一个浮点数来表示。

个人总结

1、任何一个实数都可以用一个定点整数和一个定点小数来表示，其中定点整数其实就是指的整数（来表示科学计数法中的指数部分），定点小数一般表示科学计数法中的小数部分（尾数）。

2、浮点数是有精度的，之前是不知道为什么有的浮点数在计算机中是没有办法存储和表示的，只能根据某个特定的规则进行舍入和表示，而且浮点数数字越小越有可能精确表示，对于浮点数越大，精确表示的可能就越小，因为数越大，可表示的两个浮点数之间的距离越来越大。

3、浮点数采用科学计数法，只需要定点小数表示尾数（采用原码）和定点整数表示指数部分就可以表示任意一个浮点数

4、IEEE 754标准的一个好的博客

IEEE754标准: 一 , 浮点数在内存中的存储方式 - 知乎 (zhihu.com)

数据的表示和存储——

浮点数的编码表示

浮点数类型