2.2.2.2. ISO/IEC 8859的编码规则

我们已经知道了,ASCII是7位的单字节编码,其中0x20-0x7E的可见字符。

而ISO/IEC 8859,是在ASCII中的普通的可见字符(0x20-0x7E)的基础上,利用了ASCII的7位编码所没有用到的第8位,这样就编码范围就从原先ASCII的0x00-0x7F多扩展出了0x80-0xFF,其中的0xA0-0xFF部分,被ISO/IEC 8859编码所用到。

有别于ASCII的单个独立的编码规则,ISO/IEC 8859是一组编码规则的总称,其下包含了共15个字符集,即ISO/IEC 8859-n,其中n=1,...,11,13,...,16。

关于这15种字符集是如何分类的,可以参考:表 8 “ISO/IEC 8859编码标准中的15种字符集”

这15个字符集,每一个字符集,编码取值都是0xA0-0xFF,但是对于同一个值,不同字符集所对应的字符,都不太一样。

此处截取那15个字符集的其中一部分,以便更加直观的了解不同字符集的区别:

图 2.1. ISO/IEC 8859的15个字符集的部分比较

ISO/IEC 8859的15个字符集的部分比较


完整的字符表,请参见表 8 “ISO/IEC 8859编码标准中的15种字符集”

[注意]ASCII编码有时候也会写成ISO/IEC 8859-1编码

另外,需要注意的是,对于原先的美国的英文字母,即普通的英语,其虽然没有重音,音标等字母,但是由于其本身也还是包含在ASCII中,而ISO/IEC 8859-1包括了ASCII,所以,很多时候,对于英文字母来说,也仍会标明为ISO/IEC 8859-1编码。