字符编码详解

版本:v2.3.1

Crifan Li

摘要

本文主要介绍了字符编码的基础知识,以及常见的字符编码类型,比如ASCII,Unicode,UTF-8,ISO 8859等,以及各种编码之间的关系,同时专门解释了中文字符相关的编码标准,包括GB2312,GBK,GB18030,也专门解释了Windows系统中的Code Page,以及相关的BOM等内容

[提示]本文提供多种格式供:

HTML版本的在线地址为:

http://www.crifan.com/files/doc/docbook/char_encoding/release/html/char_encoding.html

有任何意见,建议,提交bug等,都欢迎去讨论组发帖讨论:

http://www.crifan.com/bbs/categories/char_encoding/

2015-05-24

修订历史
修订 2.3.12015-05-24crl
  1. 通过Docbook发布
  2. 合并了原先在zhcn_charset中的内容
  3. 详细解释了Code Page
  4. 详细解释了ANSI编码
  5. 解释BOM
  6. 添加很多xml:id
  7. 添加常见字符英文读法和字符编码简明教程的链接
  8. 添加字符编码应用的链接
修订 1.02011-11-02crl
  1. 添加了编码相关背景知识介绍
  2. 添加了ASCII和EASCII编码介绍
  3. 添加了ISO/IEC 8859相关的编码和各种单字节编码的关系
  4. 添加了Unicode和ISO 10646的解释
  5. 添加了UTF-8和Unicode的区别和联系