文本处理( Text Processing 对文本中包含的文字信息进行深层次的分析、加工和处理。 (例如对字、词、短语、句子、篇章的检査、统计、识别 转换、压缩、存储、检索、分析、理解和生成等) 释义 Paraphrase) 相同含义但 不同的表达 文摘生成 Summarizing 摘要、关键字 翻译( Translation) 相同含义但 不同的语种 Question-Answering 提问 回答 自动分类 文档分类 文本过滤/文本检索 文档 多文档自动综述 综述
翻译(Translation) 文摘生成 Summarizing 释义(Paraphrase) 摘要、关键字 相同含义但 不同的表达 相同含义但 不同的语种 多文档自动综述 Question-Answering 自动分类 提问 回答 综述 文档分类 文本过滤/文本检索 文档
文本的分类 按是否格式化分: 简单文本( plain tex)/丰富格式文本 (rich tex 按结构分: 线性文本/超文本 hypertext 按是否可执行来分: 静态文本/动态文本/主动文档
应用举例 实验12利用HTML标记语言制作网页
A B C D E F G H a1 a2 b2 c2 f1 d1 c1 b1 e1 g1 h1 应用举例 实验12“利用HTML标记语言制作网页
文本处理软件 (1)面向通信的文本处理软件 Outlook Express (2)面向办公的文本处理软件: MS Word. WPS2000 (3)面向印刷出版的文本处理软件: “飞腾”排版软件, PageMaker, PDE Writer (4)面向网络信息发布和电子出版的文本处理软件: FrontPage, PDF Writer
文本的输出 (阅读、浏览与打印) 过程: 对文本的格式描述进行解释 生成文字和图表的映像( bitmap) 传送到显示器或打印机输出 两种文本阅读器/浏览器: 嵌入在文本编辑(处理)软件中,如微软的Word, 独立的软件:如 Adobe公司的 lAcrobat reader, 微软公司的IE等