1整数的存储

大家知道，整数包括负数，零，和正数。计算机中的整数分为有符号数和无符号数。有符号数的最高位表示符号：即最高位为0，表示正数，最高位为1，表示负数。无符号数表示非负数，整个位数都用来表示整数的值。如果用N位来表示整数，那么有符号数的范围为：[-2^(N-1)，(2^(N-1))-1]；无符号数的表示范围为[0，(2^N)-1]。比如，用8位来表示有符号整数数，由于第8位用于表示了符号，因此，整数的表示范围为[-128，+127]；如果是表示无符号整数，则表示范围为[0，255]。

一、整数的编码

整数的编码分为原码、反码、和补码。计算里使用的是补码的存储方式。它们的定义如下：

原码：在数值前面增加了一位符号位（即最高位为符号位），该位为0表示正数，该位为1表示负数，其余位表示数值的大小。

反码：正整数的反码就是其自身，而负整数的反码可以通过对其绝对值逐位求反来求得。

补码：正数的补码与原码相同，负数的补码就是对该负数的绝对值求反加1，0的补码是0。

因为计算机是以补码来存储整数的，所以补码就显得很重要。那么如何计算整数的补码呢？

下面以具体例子来说明。

100的补码：01100100

0的补码：0

-100的补码：绝对值：01100100 -->取反加1：10011011+1 -->10011100

1的补码：00000001

-1的补码：绝对值：00000001 -->取反加1：111111110+1 -->11111111

127的补码：01111111

-128的补码：绝对值：10000000 -->取反加1：01111111+1 -->10000000 在计算机系统中，数值一律用补码来表示（存储）。下表是一个原码，反码，补码的表示例子。

知道了一个补码，如何求出它对应的值呢？

正数：就是本身

0:0

负数：补码取反+1就是它本身绝对值。

从定义可以看出，正数的补码，反码，原码相同。0的补码就是本身。那么负数的原码和补码如何转换呢？已知一个负数求补码方法：绝对值原码按位求反加1。已知负数补码求负数方法：符号位不变，其他位按位求反加1。对于8位整数来说，补码的表示范围为[-128，127]。大家应该记住一些常见的补码的表示，这些数包括但不局限于下面表中列出的数：

那么有了原码，计算机为什么还要用补码呢？

来看看它们的运算情况。假设字长为8位，那么原码的运算方式为：

1 - 1 
= 1 + ( -1 ) 
= (00000001) + (10000001)
= (10000010) 
= -2，

这显然不正确。原码在两个整数的加法运算中是没有问题的，问题出现在带符号位的负数身上。原码无法满足运算要求，因此对除符号位外的其余各位逐位取反就产生了反码。反码的取值空间和原码相同且一一对应。下面是反码的减法运算：

1 - 1 
= 1 + ( -1 )
= (00000001) + (11111110) 
= (11111111) 
= ( -0 )

有问题。

1 – 2 
= 1 + ( -2 ) 
= (00000001) + (11111101) 
= (11111110) 
= ( -1 )

正确。反码的问题出现在(+0)和(-0)上，因为在人们的计算概念中零是没有正负之分的。再来看补码的加减运算如下：

1 - 1 
= 1 + （-1） 
= (00000001) + (11111111) 
= (00000000) = 0

正确。

1 – 2 
= 1 + （-2） 
= (00000001) + (11111110) 
= (11111111) 
= ( -1 )

正确。

通过补码的运算，可以看出补码的设计目的是：

⑴ 使符号位能与有效值部分一起参加运算，从而简化运算规则。

⑵ 使减法运算转换为加法运算，进一步简化计算机中运算器的线路设计。

此外，在补码中用-128代替了-0，所以没有+0和-0之分，符合常理，所以补码的表示范围为： -128~0~127共256个。

注意-128没有相对应的原码和反码，-128的补码为：10000000。

二、整数的存储

整数的存储分为高位优先存储（big-endian）和低位优先存储（little-endian）。

高位优先存储：高位首先存在低地址。

低位优先存储：低位首先存在低地址。

假设一个32位整数的值为25000。25000的补码为： 0x000061a8，共4个字节(注意到，在十六进制中，2个数为一个字节），其中最左边的00是最高位，然后依次为00次高位，61次低位，a8低位。那么在内存中如何存放这4个字节呢？也就是内存中的低地址是优先存放最高位还是最低位呢？下图是这一个整数的低位优先和高位优先的存储实例：

在上图中，高位优先的系统中，会优先把高位的00存放在低地址；而低位优先的系统正好相反，将低位a8优先存放在内存中的低地址。

如何判断一个系统是低位优先或者高位优先？这个问题曾经在笔者面试SUN公司的时候被考查过，并且要求写出判断代码。首先，来看整数1在高位优先和低位优先的系统中的存储。如下图所示：

通过上面的存储格式可以判断出，低位优先时，低字节的值为1，高位优先时，低字节的值为0。所以，给出下面2种判断方法的代码：

//第一种方法：
bool is_integer_lower_store()
{
    int x = 0x1;
    char *p = (char *)&x;
    if (*p == 1)
        return true;
    else
        return false;
}
//第二种方法：
typedef union {
    char c;
    int a;
} U;
bool is_integer_lower_store()
{
    U u;
    u.a = 1;
    if (u.c == 1)
        return true;
    else
        return false;
 }

在这两种判断方法中，都利用了0x01在低位优先中最低字节值为1，在高位优先中最低值为0的特性。用一个指向字符的指针就可以获得int整数的第一个字节。获得了第一个字节的值，就可以根据上面的特性来判断出系统究竟是低位优先还是高位优先。

题目：设计一个算法，改变一个整数的存储方式，即低位优先<-->高位优先

int change_int_storage(int val)
{
    int iRun = 0, i = 0;
    char* pByte= (char*)&val;       // 指向整数的低地址，取一个字节
    i = sizeof(int)-1;
    while (i >= 0)
    {
        iRun |= *pByte<<(i*8);// 把整数的第1字节，第2字节，第3字节，第四4字节
                                    // 一次左移24位，16位，8位和0位
        pByte++;                    // 前进一个字节
        i--;
     }
    return iRun;
}

三、网络字节序

由于现实的系统中，不同的系统采取的整数存储的方式不一样，有的使用的是低位优先，有的使用的是高位优先存储方式。那么将一个整数值，通过网络从一台机器发送到另外一台机器之后，整数的存储方式可能就变了。

因此，为了使得整数在传输的过程中保持值不变，需要定义一个网络字节序和本地字节序。也就是，把一个整数传输到网络的时候，统一转化为网络字节序。当这个整数通过网络传输到对方本地之后，再统一把网络字节序转化为对应的本地字节序。实际上，网络字节序是高位优先存储方式。而到达对方系统之后，再根据对方使用的整数存储方法，转化为对应的本地字节序。

比如网络上有2台机器，一个整数0x12345678，从一台系统中使用的是低位优先存储，传输到另外一台使用的是高位优先存储方式的机器中。那么整数的传输为：

本地字节序：0x78563421-->网络字节序：0x12345678-->本地字节序：0x12345678

在实际的网络编程中，我们一般使用htonl()来实现本地字节序到网络字节序转换；使用ntohl()来实现从网络字节序到本地字节序的转换。

思考题1（阿里巴巴2015实习生笔试真题）：

IP数据报头采用（）字节序，在此字节序下从低地址到高地址0x1234的表示形式为（）。

A.big_endian,0x12 0x34 0 0

B.little_endian,0x34 0x12 0 0

C.big_endian,0 0 0x12 0x34

D.little_endian, 0 0 0x34 0x12

思考题2：（阿里巴巴面试题）：

下面代码在16位系统中，打印输出为：

int i = 65536;
printf("%d\n",i);
i=65535;
printf("%d\n",i);

本页共142段，4341个字符，8789 Byte(字节)