大端(Big Endian)与小端(Little Endian)详解

大端(Big Endian)与小端(Little Endian)详解

【大端(Big Endian)与小端(Little Endian)简介】
Byte Endian是指字节在内存中的组织，所以也称它为Byte Ordering，或Byte Order。
对于数据中跨越多个字节的对象，我们必须为它建立这样的约定:
(1) 它的地址是多少?
(2) 它的字节在内存中是如何组织的?
针对第一个问题，有这样的解释:
对于跨越多个字节的对象，一般它所占的字节都是连续的，它的地址等于它所占字节最低地址。(链表可能是个例外，但链表的地址可看作链表头的地址)。
比如: int x，它的地址为0x100。那么它占据了内存中的Ox100， 0x101， 0x102， 0x103这四个字节（32位系统，所以int占用4个字节）。
上面只是内存字节组织的一种情况: 多字节对象在内存中的组织有一般有两种约定。考虑一个W位的整数。
它的各位表达如下:[Xw-1， Xw-2， … ， X1， X0],它的
MSB (Most Significant Byte，最高有效字节)为 [Xw-1， Xw-2， … Xw-8];
LSB (Least Significant Byte，最低有效字节)为 [X7，X6，…， X0]。
其余的字节位于MSB， LSB之间。

LSB和MSB谁位于内存的最低地址，即谁代表该对象的地址?
这就引出了大端(Big Endian)与小端(Little Endian)的问题。
如果LSB在MSB前面，既LSB是低地址，则该机器是小端; 反之则是大端。
DEC (Digital Equipment Corporation，现在是Compaq公司的一部分)和Intel的机器（X86平台）一般采用小端。
IBM， Motorola(Power PC)， Sun的机器一般采用大端。
当然，这不代表所有情况。有的CPU即能工作于小端，又能工作于大端，比如ARM， Alpha，摩托罗拉的PowerPC。具体情形参考处理器手册。
具体这类CPU是大端还是小端，应该和具体设置有关。
（如，Power PC支持little-endian字节序，但在默认配置时是big-endian字节序）
一般来说，大部分用户的操作系统（如windows, FreeBsd,Linux）是Little Endian的。少部分，如MAC OS ,是Big Endian 的。
所以说，Little Endian还是Big Endian与操作系统和芯片类型都有关系。

Linux系统中，你可以在/usr/include/中（包括子目录）查找字符串BYTE_ORDER(或
_BYTE_ORDER, __BYTE_ORDER)，确定其值。BYTE_ORDER中文称为字节序。这个值一般在endian.h或machine/endian.h文件中可以找到,有时在feature.h中，不同的操作系统可能有所不同。

对于一个数0x1122
使用Little Endian方式时，低字节存储0x22，高字节存储0x11
而使用Big Endian方式时, 低字节存储0x11, 高字节存储0x22

经一网友指正,才知道,上面的描述,是不准确的.

想了下,觉得如下描述可能更合适:

使用Little Endian方式存储数据时,数据的LSB相对最没意义的数据位,存放在低地址位置,这里的LSB也就是22了.也即,

低地址存储0x22, 高地址存储0x11

而使用Big Endian方式存储数据时,数据的MSB最有意义的数据位,存放在低地址位置,这里的MSB也就是11了.也即

低地址存储0x11, 高地址存储0x22

助记:

1)所谓MSB (Most Significant Byte),名字很复杂,不知是否有人没搞懂,反正我开始看到这个词时候,就很糊涂,有点不完全理解.其实简单说MSB就是,一个数字中,最重要的那位,

举例来说,12004,中文读作,一万两千零四,那最高位的1,就表示了一万,此处就称作MSB,最有意义的位.

2)一般常见的数据存储,用文字写出来的时候,其内容书写格式,多数是从低地址到高地址.

举例,一个16进制数是 0x11 22 33, 而存放的位置是

地址0x3000 中存放11

地址0x3001 中存放22

地址0x3002 中存放33

连起来就写成地址0x3000-0x3002中存放了数据0x112233.

而这种存放和表示方式,正好符合大端.

解释的有点乱,希望有人能看懂.

如果还有哪里有误,还请各位继续指正.谢谢.

【用函数判断系统是Big Endian还是Little Endian】

bool IsBig_Endian()
//如果字节序为big-endian，返回true;
//反之为little-endian，返回false
{
     unsigned short test = 0x1122;
    if(*( (unsigned char*) &test ) == 0x11)
        return TRUE;
    else
        return FALSE;
 
}//IsBig_Endian()

以上内容，整理自：

如何判断系统是Big Endian还是Little Endian？
http://jlingmei.spaces.live.com/blog/cns!77254CCC13222C11!391.entry?wa=wsignin1.0

判断机器字节存储顺序是big endian还是little endian
http://hi.baidu.com/cppyun/blog/item/9625c8396d5ff7f33b87ce33.html

动态判断cpu字节序是big-endian还是little-endian
http://chongyanglee.bokee.com/4919503.html

转载请注明：在路上 » 大端(Big Endian)与小端(Little Endian)详解

Post Views: 3,187

不错，谢谢

流星niky13年前 (2011-01-26)回复

void main()
{
__int64 a = 0x1122334455667788;
__int64 *pa =&a;
unsigned char *c = (unsigned char *)pa;
for (int i=0; i!=sizeof(a); ++i)
{
printf("&a = %lX Va = %lX ", c++, *c);
}
}

匿名网友15年前 (2009-09-03)回复

我觉得你对操作系统这部分说的不正确
大端和小端是CPU对内置多字节数据类型(如short、int、long等)字节顺序的解读，和相关机器指令等硬件实现相关
操作系统是纯软件，对内置数据类型的解读对它来说是透明的。操作系统没有大端和小端之分

匿名网友15年前 (2009-05-22)回复

1)所谓MSB (Most Significant Byte),名字很复杂,不知是否有人没搞懂,反正我开始看到这个词时候,就很糊涂,有点不完全理解.其实简单说MSB就是,一个数字中,最重要的那位

Most Significant Byte理解成最重要的那位是错的.
二进制的基础.

匿名网友15年前 (2009-05-10)回复

//8楼的程序有两个问题，我给补充一下： int _tmain(int argc, _TCHAR* argv[]) { long long a = 0; unsigned char *c = (unsigned char *)&a; //1.必须的用unsigned char，否则0X88会越界变成负数 *c = 0x11; *(c + 1) = 0x22; *(c + 2) = 0x33; *(c + 3) = 0x44; *(c + 4) = 0x55; *(c + 5) = 0x66; *(c + 6) = 0x77; *(c + 7) = 0x88; printf("a = %llX ", a); //2.格式化输出是必须用%llX而不是%lX return 0; } 感谢楼主让我理解了，不过相见恨晚，早看到的话，也许当初就不会被HR拒了！

匿名网友16年前 (2008-11-20)回复

解释的很清楚

行到水穷16年前 (2008-10-10)回复

用VC 6测试了你的代码，的确是有那个问题，VC 6是32位编译器不支持long long的数据类型，只能改为__int64 才可以。实际显示时候，我将你的std::cout << a;改为 getchar(); 测试了，显示只能显示出来44332211，不能显示完整。具体的只有查看内存，才能看到我们要的88到11

againinput416年前 (2008-10-02)回复

先说一句，我这个人有时候也很懒，自己懒得去动手测试。要说的是，原先帖子里，说的算是比较明白了“其余的字节位于MSB， LSB之间。”，说的就是这个意思，两头的确定了，剩下的，就是位于他俩之间了。

昨天测试了一下，发现如果是小端就整个儿颠倒过来，测试代码如下： int _tmain(int argc, _TCHAR* argv[]) { long long a = 0L; char *c = (char *)&a; //char *c = new char[8]; *c = 0x11; *(c + 1) = 0x22; *(c + 2) = 0x33; *(c + 3) = 0x44; *(c + 4) = 0x55; *(c + 5) = 0x66; *(c + 6) = 0x77; *(c + 7) = 0x88; //long long *a = (__int64 *)c; printf("a = %lX ", a); //貌似无法以十六斤这方式输出longlong类型的数据，不过可以调试时查看内存。 std::cout << a; return 0; }

freedom_j16年前 (2008-10-02)回复

呵呵，总结的很好，十分感谢！不过你文中只提到在2个字节长度的情况，如果说是一个长达8字节的字符串呢？我们以little endian为例，一个串是这样的：0x1122334455667788，那么保存在内存中时是0x2211443366558877还是0x8877665544332211呢？对于32bit-CPU和64bit-CPU又有什么区别呢？希望和你更进一步探讨。

freedom_j16年前 (2008-09-29)回复

对着咧~

Gubuntu16年前 (2008-09-18)回复

最左边的是低字节吧，作者没错

匿名网友16年前 (2008-06-25)回复

正确的如下：对于一个数0x1122 使用Big Endian方式时，低字节存储0x22，高字节存储0x11 而使用Little Endian方式时, 低字节存储0x11, 高字节存储0x22

匿名网友16年前 (2008-06-22)回复

我又仔细看了，没发现错误。如果你觉得错了，还请指正。

againinput416年前 (2008-06-21)回复

你下面的这句话和你的程序是矛盾的，仔细看看。 ———————————————————————————————— 对于一个数0x1122 使用Little Endian方式时，低字节存储0x22，高字节存储0x11 而使用Big Endian方式时, 低字节存储0x11, 高字节存储0x22

匿名网友16年前 (2008-03-18)回复

讲得很透彻，谢谢

匿名网友16年前 (2008-02-10)回复

大端(Big Endian)与小端(Little Endian)详解

与本文相关的文章

Hi，您需要填写昵称和邮箱！

网友最新评论 (17)