1.多媒体技术概述 14多媒体技术的发展历程(略) 口1990年:由 Microsoft公司和多家厂商共同制定了CD Rom标准,真正带动了CD出版物的流行。 ¤20世纪90年代以后,多媒体的逐渐成熟,从以研究为重心 逐渐转移到以应用为重心,同时在多媒体通信方面也制定 了一系列的标准,并逐步投入到商业运行中。 河南中医学院/许成刚(13937107985,Xcg@hactcm.edu.cn)/阮晓龙(13938213680,rxl@hactcm.edu.cn)
河南中医学院 / 许成刚(13937107985,xcg@hactcm.edu.cn) / 阮晓龙(13938213680,rxl@hactcm.edu.cn) 1.多媒体技术概述 1990年:由Microsoft公司和多家厂商共同制定了CDRom标准,真正带动了CD出版物的流行。 20世纪90年代以后,多媒体的逐渐成熟,从以研究为重心 逐渐转移到以应用为重心,同时在多媒体通信方面也制定 了一系列的标准,并逐步投入到商业运行中。 11 1.4多媒体技术的发展历程(略)
12 2文本处理技术 2.1文本的采集 口键盘输入 键盘是我们在操作电脑时常用的标准输入设备,键盘不断向计算机 存储器传输各种信号,计算机再根据这些信号执行相应的操作。 英文信息可直接通过键盘输入。而中文输入则需要通过不同的输入 编码(输入法)来完成,常见的输入编码有“智能拼音″输入法、 “五笔字形”输入法、‘“智能ABC′″输入,“全拼”输入法和 微软拼音输入法 河南中医学院/许成刚(13937107985,Xcg@hactcm.edu.cn)/阮晓龙(13938213680,rxl@hactcm.edu.cn)
河南中医学院 / 许成刚(13937107985,xcg@hactcm.edu.cn) / 阮晓龙(13938213680,rxl@hactcm.edu.cn) 2.文本处理技术 键盘输入 ◼ 键盘是我们在操作电脑时常用的标准输入设备,键盘不断向计算机 存储器传输各种信号,计算机再根据这些信号执行相应的操作。 ◼ 英文信息可直接通过键盘输入。而中文输入则需要通过不同的输入 编码(输入法)来完成,常见的输入编码有“智能拼音”输入法、 “五笔字形”输入法、“智能ABC”输入,“全拼”输入法和 “微软拼音输入法” 12 2.1文本的采集
13 2文本处理技术 2.1文本的采集 口OCR技术 OCR( Optical Character Recognition,光学字符识别)是指电 子设备(例如扫描仪)检查纸上打印的字符,通过检测暗、亮的模 式确定其形状。然后用字符识别方法将形状翻译成计算机文字的过 程 OCR技术是指对文本资料进行扫描,并对图像文件进行分析处理 从而获取文字及版面信息的过程。 获得图片之后,要通过软件进行图文转换,在处理图形时通常要经 过图像输入与预处理,预处理主要包括二值化、噪声去除、倾斜矫 正等。 河南中医学院/许成刚(13937107985,Xcg@hactcm.edu.cn)/阮晓龙(13938213680,rxl@hactcm.edu.cn)
河南中医学院 / 许成刚(13937107985,xcg@hactcm.edu.cn) / 阮晓龙(13938213680,rxl@hactcm.edu.cn) 2.文本处理技术 OCR技术 ◼ OCR (Optical Character Recognition,光学字符识别)是指电 子设备(例如扫描仪)检查纸上打印的字符,通过检测暗、亮的模 式确定其形状。然后用字符识别方法将形状翻译成计算机文字的过 程; ◼ OCR技术是指对文本资料进行扫描,并对图像文件进行分析处理, 从而获取文字及版面信息的过程。 ◼ 获得图片之后,要通过软件进行图文转换,在处理图形时通常要经 过图像输入与预处理,预处理主要包括二值化、噪声去除、倾斜矫 正等。 13 2.1文本的采集
14 2文本处理技术 2.1文本的采集 口OCR技术 OCR技术中,要首先对彩色图片进行处理,将图片转化为黑白两种 颜色。这个过程称为二值化 ■二值化之后,再对文本进行特征提取,并与文字数据库进行对比 找出相应的文本。 OCR技术集名片识别,文档识别,证件识别,车牌识别多项专有技 术于一体,轻松实现图片转WORD,PDF转WORD多方面的文字处 理功能。 河南中医学院/许成刚(13937107985,Xcg@hactcm.edu.cn)/阮晓龙(13938213680,rxl@hactcm.edu.cn)
河南中医学院 / 许成刚(13937107985,xcg@hactcm.edu.cn) / 阮晓龙(13938213680,rxl@hactcm.edu.cn) 2.文本处理技术 OCR技术 ◼ OCR技术中,要首先对彩色图片进行处理,将图片转化为黑白两种 颜色。这个过程称为二值化。 ◼ 二值化之后,再对文本进行特征提取,并与文字数据库进行对比, 找出相应的文本。 ◼ OCR技术集名片识别,文档识别,证件识别,车牌识别多项专有技 术于一体,轻松实现图片转WORD, PDF转WORD多方面的文字处 理功能。 14 2.1文本的采集
2文本处理技术 2.1文本的采集 汉王OCR软件的编辑界面如图所示。 净宙么Q4愚日的”Q4国+→6 3ss05j8? 33其趑音频压缩编弱方法 3.3其他音频压缩编码方法 1.3.1子带编码 子带编码的出发点在于:无论是音频信号还是视频成其他信号,均具有比较宽的频带 在带中不同频率段上的分量对信号的质量影响是不一样的,一般来说,低频段的分量对信 质量的影响大而高频段影响要小一些 基于上述因素,可以设想,首先用一组带通滤波器将输入的音频信号分成若干个连续的 段,这些频段称为子带:而后,再分别对这些子带中的音频分量进行采集和编码:最后 意0行1列 河南中医学院/许成刚(13937107985,Xcg@hactcm.edu.cn)/阮晓龙(13938213680,rxl@hactcm.edu.cn)
河南中医学院 / 许成刚(13937107985,xcg@hactcm.edu.cn) / 阮晓龙(13938213680,rxl@hactcm.edu.cn) 2.文本处理技术 ◼ 汉王OCR软件的编辑界面如图所示。 15 2.1文本的采集