回顾:编码字符集「1月6日 1字符( character)记录语言的符号 2编码字符集( (coded character set) 按某种规则编码的有序集合。两个重要的属性: ■字汇 repertoire:编码字符集中有哪些字符 编码规则:如何确定每个字符的代码 3码长:字符代码的长度。它决定了代码空间的大小 定长码:7位,8位,双字节,4字节 可变长码:单一双-4字节码
11月6日
1稳定的西文字符编码 ASCII与ISO2022 2.多变的汉字编码 我国汉字编码的国家标准:要点: GB2312-80 ·字符集 GBK-95 GB18030-2000 ·编码及码长 全球统一编码系列: ·向下兼容 ISO2022 UCS/Unicode(UTF-8)
要点: •字符集 •编码及码长 •向下兼容
6763 IS0646 GB2312-80 汉字 兼 穴 谷 CJK汉字字汇 ISO 2022 GBK 20902 兼容 耒容 汉字 UCS/Unicode GB18030-2000 映射 27484 汉字
00 FF 00 FF 27484 汉字 GB2312-80 GB18030-2000 GBK CJK汉字字汇 兼 容 兼容 UCS/Unicode ISO 646 ISO 2022 兼 容 兼容 映射 00 FF 00 FF 20902 汉字 00 FF 00 FF 6763 汉字
回顾 文本按一定格式组织起来的、具有相关性的字符流。 字符:是文本的细胞,计算机中用二进制表示 字符集与其编码:计算机信息处理的基础。 文本处理 文本生成 文本编辑 文本展现 计算机对文本的处理流程图 网络传
文本展现 (阅读器) 文本处理 文本生成 (文本处理软件) 其他 媒体 电子 文本 文本编辑 (编辑器) 格式化的 电子文本 网 络 传 输 计算机对文本的处理流程图
文本的准备 文本信息的输入:P90 文本信息的输入 人T输入 自腧入 键输入联手输入‖语输入 印刷以别 手写以别 文本的编辑(使文本内容正确,版面清晰整齐、美观大方): 对字、词、句、段落进行添加、删除、修改等操作; 字的处理:设置字体、字号、字的排列方向、间距、颜色、效果等; 段落的处理:设置行距、段间距、段缩进、对称方式等; 页面布局处理:设置页边距、每页行列数、分栏、页眉、页脚等
自动识别输入 自动文字识别 印刷体识别 手写体识别 文本信息的输入 人工输入 自动文字识别 键盘输入 联机手写输入 语音输入