最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

字符编码详解 v1.0

工作和技术 crifan 2006浏览 0评论

字符编码详解

版本: 1.0

作者: crifan

邮箱: green-waste at163.com

 


PDF下载:

1. 字符编码详解 v1.0.pdf (937.93 KB)

2. 字符编码详解 v1.0 - crifan - work and job 字符编码详解 v1.0.pdf    


 

内容简介

介绍了编码相关背景知识;
介绍了ASCII,EASCII,ISO/IEC 8859,Unicode,ISO 10646的解释;
添加了UTF-8和Unicode的区别和联系

 

关键字

字符编码,ASCIIISO 8859ISO 10646UCSUnicodeUTF-8

  

版本

版本

日期

内容更新

1.0

2011-11-02

添加了编码相关背景知识介绍

添加了ASCIIEASCII编码介绍

添加了ISO/IEC 8859相关的编码和各种单字节编码的关系

添加了UnicodeISO 10646的解释

添加了UTF-8Unicode的区别和联系

 
目录
1 正文之前 5
1.1 目的 5
1.2 本文内容 5
1.3 声明 5
2 字符编码相关的背景知识 6
2.1 拉丁字母 6
2.2 什么是字符编码 6
3 字符编码标准 8
3.1 只支持基本的拉丁字符的字符编码:ASCII 8
3.1.1 ASCII的由来 8
3.1.2 ASCII编码规则 8
3.1.3 ISO 646 9
3.1.4 ASCII码表/编码字符表 9
3.2 支持多种衍生拉丁字母的字符编码:EASCII和ISO 8859 10
3.2.1 EASCII 11
3.2.2 ISO 8859 11
3.2.2.1 ISO/IEC 8859出现的背景 11
3.2.2.2 ISO/IEC 8859的编码规则 11
3.2.2.3 ISO/IEC 8859的特点 13
3.2.2.4 ISO/IEC 6429 14
3.2.2.5 ISO 8859和ISO-8859的区别和联系 14
3.2.2.5.1 原先的ISO 8859-1和我们常说的ISO 8859-1 15
3.3 各种单字节编码标准的关系 17
3.4 支持世界上几乎所有字符的字符编码:Unicode 17
3.4.1 Unicode和ISO 10646的关系 18
3.4.1.1 ISO 10646=UCS 18
3.4.1.2 Unicode 和ISO 10646的联系 18
3.4.1.3 Unicode和ISO 10646的区别 19
3.4.2 Unicode编码规则 20
3.4.3 Unicode字符编码所对应的存储和交换标准:UTF-8, UTF-16, UTF-32 21
3.4.3.1 UTF-8 21
3.4.3.2 Unicode与UTF-8之间的转换 22
3.4.3.2.1 关于UTF-8的BOM:“EF BB BF” 23
3.5 字符存储(交换)标准 24
3.6 字形和你所看到的字符的关系 25
4 引用 26
图表
图表 1 ASCII编码表 10
图表 2 ISO/IEC 8859编码标准中的15种字符集 12
图表 3 ISO/IEC 8859的15个字符集的部分比较 13
图表 4 ISO/IEC 8859-1字符集表 16
图表 5 各种单字节编码标准之间的关系 17
图表 6 ISO/IEC 10646与Unicode的版本对应关系 19
图表 7 Unicode中的各种平面划分 20
图表 8 Unicode与UTF-8之间的编码映射关系 22
图表 9 Notepad中的各种编码 22
图表 10 字符(存储)交换标准 24
图表 11 汉字“宋”的不同字体 25
 

缩写

缩写

全称

含义

ASCII

American Standard Code for Information Interchange

美国信息交换标准代码

BMP

Basic Multilingual Plane

基本多文种平面

EBCDIC

Extended Binary Coded Decimal Interchange Code

扩展二进制编码十进制交换码

IANA

Internet Assigned Numbers Authority

互联网号码分配局

ISO/IEC

International Organization for Standardization /

International Electrotechnical Commission

国际标准化组织和国际电工委员会

UCS

Universal Character Set

通用字符集

UTF

Unicode Transformation Format

Unicode转换格式

转载请注明:在路上 » 字符编码详解 v1.0

发表我的评论
取消评论

表情

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
80 queries in 0.172 seconds, using 22.22MB memory