汉字交换码 1981年,我国颁布了《信息交换用汉字编码字符 集基本集》(代号G231280)。它是汉字交换 码的国家标准,所以有称“国标码”。该标准收 入了6763个常用汉字(其中一级汉字3755,二级 汉字3008个),以及英、法、日等文字母与其他 符号687个,共有700多个符号。 国标码规定,每个字符由一个2字节代码组成。 每个字节的最高位恒为“0”,其余7位用于各种 不同的码值。两个字节的代码,共可表示 128×128=1638个符号,而国标码
1 汉字交换码 • 1981年,我国颁布了《信息交换用汉字编码字符 集.基本集》(代号GB2312-80)。它是汉字交换 码的国家标准,所以有称“国标码” 。该标准收 入了6763个常用汉字(其中一级汉字3755,二级 汉字3008个),以及英、法、日等文字母与其他 符号687个,共有7000多个符号。 • 国标码规定,每个字符由一个2字节代码组成。 每个字节的最高位恒为“0”,其余7位用于各种 不同的码值。两个字节的代码,共可表示 128×128=1638个符号,而国标码
汉字机内码 计算机要处理汉字,也要处理西文。为了 实现中、西文兼容,通常采用字节的最高 来区分莫个码值是代表汉字或AS肼码字 具体的做法是,若最高位是“1”是为 汉符, 为“0”视为AS字符。所以,汉字几内吗 可在上述国标码的基础上的以体现。 图19国标码和汉字/AS机内码的比较 图(略)
2 汉字机内码 • 计算机要处理汉字,也要处理西文。为了 实现中、西文兼容,通常采用字节的最高 位来区分莫个码值是代表汉字或ASCII码字 符。具体的做法是,若最高位是“1”是为 汉符, 为“0”视为ASCII字符。所以,汉字几内吗 可在上述国标码的基础上的以体现。 图1-9国标码和汉字/ASCII机内码的比较 图(略) 顺便指出,当两个想邻字节的机内码值为
汉字输入码(1) 西文输入时,想输入什么字符便3按什么键,输 入码与机内码总是一致的。汉字输入则不同,假 设现在要输入汉字“大”字,在键盘上并无表有 “大”字的按键。如果采用“拼音输入法”,便 需在键盘上依次按下“a”和“矿两键,这里便是 所要的字 如果我们能够把键盘掌握的很熟练的话,那么我 们打的字的速度也会很快的。换句话说,汉字输 入码不仅不不同与它的机内码,而且当改变汉字 输入法时,同一汉字的输入码也随只改变,这就 是计算机打字的变化形式我们要先学会它,就得 下工夫,这就是我的看法。不知道还有什么不足
3 汉字输入码 (1) • 西文输入时,想输入什么字符便3按什么键,输 入码与机内码总是一致的。汉字输入则不同,假 设现在要输入汉字“大”字,在键盘上并无表有 “大”字的按键。如果采用“拼音输入法”,便 需在键盘上依次按下“a” 和“b”两键,这里便是 所要的字 • 如果我们能够把键盘掌握的很熟练的话,那么我 们打的字的速度也会很快的。换句话说,汉字输 入码不仅不不同与它的机内码,而且当改变汉字 输入法时,同一汉字的输入码也随只改变,这就 是计算机打字的变化形式我们要先学会它,就得 下工夫,这就是我的看法。不知道还有什么不足
汉字输入码(2) 需要指出,无论采用那一种汉字输入法,当 用户向计算机输入汉字时,存人计算机中的 总是它的机内码,与所才用的输入法无关 实际上不管使用何种输入法,在输入码与机 内码之间总是存在着一一对应关系,很容易 通过“输入管理程序”把输入码转换为机内 码 可见输入码仅是用户选用的编码,故也称为 “外码”,而机内码则是供计算机识别的 “内码”,其码值是唯一的。两者之间通过 键盘管理程序来实现转换的,如图110所示
3 汉字输入码 (2) • 需要指出,无论采用那一种汉字输入法,当 用户向计算机输入汉字时,存人计算机中的 总是它的机内码,与所才用的输入法无关。 • 实际上不管使用何种输入法,在输入码与机 内码之间总是存在着一一对应关系,很容易 通过“输入管理程序”把输入码转换为机内 码。 • 可见输入码仅是用户选用的编码,故也称为 “外码”,而机内码则是供计算机识别的 “内码”,其码值是唯一的。两者之间通过 键盘管理程序来实现转换的,如图1-10所示 • 图1-10(略)
表13特殊控制符号 控制符功控制符功控制符功控制符功 机空「横向列垂直列的1设备控 台正文换型联走纸控设备控 SH标题暖 单元分R会场设备控 用B给正文结80移为数E否定设备控 E传输结S移为数MK否定换码 孔0询问S STN空转SUR减 A承认F文字分哪M作废E作废 BEL 振铃08组分隔B信息传 Bs退一记录隔纸尺 格 分
表1-3 特殊控制符号 RS 记录隔 EM 纸尽 分 BS 退一 格 ETB 信息传 递 GS 组分隔 分 BEL 振铃 FS 文字分 CAN 作废 DEL 作废 割 ACK 承认 STN 空转 SUB 减 同步 ENQ 询问 SP 空格 SI 移为数 NAK 否定 ESC 换码 入 EOT 传输结 束 DC4 设备控 制4 SO 移为数 DLE 否定 出 ETX 正文结 束 DC3 设备控 制3 US 单元分 CR 会场 隔 STX 正文 开始 DC2 设备控 制2 FF 走纸控 制 SOH 标题 LF 换型 开始 DC1 设备控 制1 VT 垂直列 表 HT 横向列 表 NUL 空 控制符 功 能 控制符 功 能 控制符 功 能 控制符 功 能