2机器数的表示 机器数:一个数及其符号在机器中的表示数值化。 真值:机器数所代表的数 假定一个数在机器中占用8位。 (1)原码 →0X0<=X +7:00000111+0:00000000 1XX<=0-7:1000011-0:1000000 (2)反码 0X0<=X+7:00000111 +0:00000000 X<=0 7:11111000-0:11ll1111 3)补码 0X0<=X+7:00000111 +0:00000000 [X]反= 1|X|+1X<=0 7:11111001-0:00000000
2. 机器数的表示 机器数:一个数及其符号在机器中的表示数值化。 真值:机器数所代表的数。 假定一个数在机器中占用8位。 (1) 原码 0X 1|X| 0<=X X<=0 0X 1|X| 0<=X X<=0 0X 1|X|+1 0<=X X<=0 +7: 00000111 +0:00000000 -7: 10000111 -0:10000000 +7: 00000111 +0:00000000 -7:11111 000 -0:11111111 +7: 00000111 +0:00000000 -7:11111001 -0:00000000 (2)反码 (3)补码 [X]原= [X]反= [X]反=
三、守的表示 1.西文字符 25=(00100101)BcD 每一个字符有一个唯一的编码 (1)ACSII (American Standard Code for Information Interchange) 常用字符有128个,编码从0到127 空格 20H 32 30H~39H 48~57 A 4IH5AH 65~90 61HZAH 97~122 控制字符:0~32,127;普通字符:94个 每个字符占一个字节,用7位,最高位不用,一般为0。 例如:“a3字符的编码为1100001,对应的十进制数是97; (2) EBCDIO码 Extended binary coded decimal Interchange Code 扩展的二一十进制交换码
三、字符的表示 1. 西文字符 每一个字符有一个唯一的编码。 (1) ACSII码(American Standard Code for Information Interchange) 常用字符有128个,编码从0到127。 空格 20H 32 ‘0’~‘9’ 30H~39H 48~57 ‘A’~‘Z’ 41H~5AH 65~90 ‘a’~‘z’ 61H~7AH 97~122 控制字符:0~32,127;普通字符:94个。 每个字符占一个字节,用7位,最高位不用,一般为0。 例如:“a”字符的编码为1100001,对应的十进制数是97; (2) EBCDIC码 Extended Binary Coded Decimal Interchange Code 扩展的二-十进制交换码。 25=(0010 0101) BCD 2 5
2.汉字编码 输入码 国标码 机内码:斗地址码 字形码 汉字输入 汉字输出 (1)汉字输入码 音码类全拼、双拼、微软拼音、自然码和智能ABC等 形码类五笔字型法、郑码输入法等 (2)汉字内码 汉字在设备或信息处理系统内部最基本的表达形式 国标码(GB2312-80)及其机内码 级汉字:3755个;二级汉字:3008个 汉字分区,每个区94个汉字。 区号区中位置 每个汉字占两个字节。 机内码:最高位为1。 汉字 国标码 汉字内码 中8680(0101011001010000 (1101011011010000)g 华5942(0011101100100103(101101110101010)
2. 汉字编码 (1) 汉字输入码 音码类 全拼、双拼、微软拼音、自然码和智能ABC等 形码类 五笔字型法、郑码输入法等 。 (2) 汉字内码 汉字在设备或信息处理系统内部最基本的表达形式。 • 国标码(GB2312-80)及其机内码 一级汉字:3755个;二级汉字:3008个。 汉字分区,每个区94个汉字。 每个汉字占两个字节。 区号 区中位置 汉字 国标码 汉字内码 中 8680(01010110 01010000)B (11010110 11010000)B 华 5942(00111011 00101010)B (10111011 10101010)B • 机内码:最高位为1。 输入码 国标码 机内码 地址码 字形码 汉字输出 汉字输入
(3)汉字字形码 汉字字形码通常有两种表示方式:点阵和矢量表示方式。 点阵:汉字字形点阵的代码 01234 g101l12131415十方进码吗 16×16、24×24、32×32、48×48。 矢量:存储的是描述汉字字形的轮廓特征 0123 018 点阵和矢量方式区别 2|0oc ●●cl0|o7 前者特点编码、存储方式简单、无需转换直接输出,但字形放大后 产生的效果差,而且同一种字体不同的点阵需要不同的字库;矢量方式特 点正好与前者相反。 (4)汉字地址码 汉字地址码:每个汉字字形码在汉字字库中的相对位移地址。 地址码和机内码要有简明的对应转换关系
(3) 汉字字形码 汉字字形码通常有两种表示方式:点阵和矢量表示方式。 点阵:汉字字形点阵的代码 16×16、24×24、32×32、48×48。 矢量:存储的是描述汉字字形的轮廓特征。 点阵和矢量方式区别: 前者特点 编码、存储方式简单、无需转换直接输出,但字形放大后 产生的效果差,而且同一种字体不同的点阵需要不同的字库;矢量方式特 点正好与前者相反。 (4)汉字地址码 汉字地址码:每个汉字字形码在汉字字库中的相对位移地址。 地址码和机内码要有简明的对应转换关系
(5)其他汉字编码 UCS码、 Unicode码、GBK码、BIG5码等 UCS码 国际标准:通用多八位编码字符集UCS( Universal code set 世界各种文字的统一的编码方案,一个字符占4个字节。分为: 组平面行字位 最高位为0 基本多文种平面(BMP):0组0平面,包含字母、音节及表意文字等 例如:‘A 41H(ASCID 00000041H(UCS) 大 3473H(GB2312)00005927H(UCS)
(5)其他汉字编码 UCS码、Unicode码、GBK码、BIG5码等 • UCS码 国际标准:通用多八位编码字符集UCS(Universal Code Set) 世界各种文字的统一的编码方案,一个字符占4个字节。分为: 基本多文种平面(BMP):0组0平面,包含字母、音节及表意文字等。 组 平面 行 字位 最高位为0 例如:‘A’ 41H(ASCII) 00000041H(UCS) ‘大’ 3473H(GB2312) 00005927H(UCS)