常用的字符集及其编码 ■ ASCII字符集 10个数字 52个英文字母(包括大、小写) 其它一些常用符号(如标点符号、数学运算符 等) 采用7位二进制编码表示(占用一个字节), 可扩充成8位,最多表示256个字符。 0w9十个数字、26个大写英文字母以及26个 小写英文字母的编码各自是连续的。 在C++中用char类型描述ASCII字符
常用的字符集及其编码 ◼ ASCII字符集 • 10个数字 • 52个英文字母(包括大、小写) • 其它一些常用符号(如标点符号、数学运算符 等) • 采用7位二进制编码表示(占用一个字节), 可扩充成8位,最多表示256个字符。 • 0~9十个数字、26个大写英文字母以及26个 小写英文字母的编码各自是连续的。 ◼ 在C++中用char类型描述ASCII字符
常用的宇符集及其编码(续〉 ■Unicode(国际通用字符集) 包含大部分语言中的字符 2~4个字节编码 C++用wchar t描述 GB2312(简体中文) 包含中文简体和部分繁体汉字字符 2个字节编码 C++用2个char描述 Big5(繁体中文) 包含台湾、香港繁体汉字字符 2个字节编码 C++用2个char描述 ■ Shift-JIS(日文) 包含日语汉字、假名字符 2个字节编码 C++用2个char描述
常用的字符集及其编码(续) ◼ Unicode(国际通用字符集) • 包含大部分语言中的字符 • 2~4个字节编码 • C++用wchar_t描述 ◼ GB2312(简体中文) • 包含中文简体和部分繁体汉字字符 • 2个字节编码 • C++用2个char描述 ◼ Big5(繁体中文) • 包含台湾、香港繁体汉字字符 • 2个字节编码 • C++用2个char描述 ◼ Shift-JIS(日文) • 包含日语汉字、假名字符 • 2个字节编码 • C++用2个char描述