DjVu压缩格式的研究摘要:随着电子存储,检索,和分发文件变得更快和更便宜,我们的生活越来越数字化。DiVu是一种专门针对在彩色扫描文档图像高质量,高分辨率的图像压缩的技术。有了DiVu连接到互联网的任何屏幕都可以访问和显示扫描的页面图像,真实地再现的字体,颜色,绘画,照片,和纸张的纹理,比一个类似的JPEG格式图像客观上质量要好5至10倍。关键词:数字图书馆:图像压缩;图像分割:算术编码;小波编码:JBIG2Abstract: As electronic storage, retrieval, and distribution of documents becomes faster andcheaper, our life is becoming increasingly digital.DjVu is a image compression technique that isspecically geared towards the compression of high-resolution, high-quality images of scanneddocuments in color. With DjVu,any screen connected to the Internet can access and displayimages of scanned pages while faithfully reproducing the font, color, drawing, pictures, and papertexture, and 5 to 10 times better than JPEG for a similar level of subjective qualityKeywords: digital libraries, image compression, image segmentation, arithmetic coding, waveletcoding,JBIG21.引言1.1Djvu应用的相关背景Djvu是一种用于保存图书的文件格式,和PDF有相似之处。DjVu是由AT&T实验室自1996年起开发的一种图像压缩技术,已发展成为标准的图像文档格式之一。国际上大量应用实例已证明,DjVu可替代PDF成为网络传输扫描文档、数码照片、图像文件的主流技术2.DjVu的原理它的原理是把图像分离成前景层和背景层进行压缩。通过将文字和背景分离开来,DjVu可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性;同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。DjVu格式背后的一项主要技术是将图像分为背景(纸的纹理和图片)和前景层(文本和线条)。传统的图像压缩格式对于简单的图片来说,还可以接受,但对于强对比色彩区域之间的色彩反差的表现则大打折扣,这也是为什么它们对于文学的还原难以令人满意的原因。一般来说,要确保文字和线条的清晰度需要较高的分辨率(通常为300dpi),而反映连续色彩图像和纸张的背景机理则不需要那么高的分辨率(通常为100dpi)。因此,要提高清晰度,最好的方法就是将这些元素分为不同的层来进行处理。通过将文字和背景分离开来DjVu可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性,同时用较低的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。对于彩色扫描影像而言,它的内容元素特性是不同的,如果针对这些不同的元素采用与其相适应的压缩技术进行处理,就有可能获得较小的文件尺寸。DjVu真实遵循这一原理,根据扫描影像的内容特点,将其分离为蒙皮、背景、前景三大层次,分别应用JB2数据压缩方法和IW44Wavelet的方法进行处理,从而大大减小文件的尺寸。其中,1.IW44Wavelet的算法主要用于彩色图片、照片、背景纹理及其他连续色调的影像压缩,这些元素的对比度远不如文字、线条强烈,因此对它们进行低分辨率(通常是100dpi)的压缩编码仍能保持很好的视觉效果。IW44在进行影像重建时使用渐进模式,所以消耗的内存极少。IW44主要用于对下列影像进行压缩编码:照片型文档影像、彩色文档型影像的背景
DjVu 压缩格式的研究 摘要:随着电子存储,检索,和分发文件变得更快和更便宜,我们的生活越来越数字化。 DjVu 是一种专门针对在彩色扫描文档图像高质量,高分辨率的图像压缩的技术。有了 DjVu 连接到互联网的任何屏幕都可以访问和显示扫描的页面图像,真实地再现的字体,颜色,绘 画,照片,和纸张的纹理,比一个类似的 JPEG 格式图像客观上质量要好 5 至 10 倍。 关键词:数字图书馆;图像压缩;图像分割;算术编码;小波编码;JBIG2 Abstract:As electronic storage, retrieval, and distribution of documents becomes faster and cheaper, our life is becoming increasingly digital. DjVu is a image compression technique that is specically geared towards the compression of high-resolution, high-quality images of scanned documents in color. With DjVu , any screen connected to the Internet can access and display images of scanned pages while faithfully reproducing the font, color, drawing, pictures, and paper texture, and 5 to 10 times better than JPEG for a similar level of subjective quality. Keywords: digital libraries, image compression, image segmentation, arithmetic coding, wavelet coding,JBIG2 1.引言 1.1 Djvu应用的相关背景 Djvu 是一种用于保存图书的文件格式,和 PDF 有相似之处。DjVu 是由 AT&T 实验室 自 1996 年起开发的一种图像压缩技术,已发展成为标准的图像文档格式之一。国际上大量 应用实例已证明,DjVu 可替代 PDF 成为网络传输扫描文档、数码照片、图像文件的主流技 术. 2.DjVu 的原理 它的原理是把图像分离成前景层和背景层进行压缩。通过将文字和背景分离开来,DjVu 可以用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性;同时用较低 的分辨率来压缩背景图片,从而使整个图像的质量得到了保证。 DjVu 格式背后的一项主要技术是将图像分为背景 (纸的纹理和图片)和前景层(文本和 线条)。传统的图像压缩格式对于简单的图片来说,还可以接受,但对于强对比色彩区域之 间的色彩反差的表现则大打折扣,这也是为什么它们对于文字的还原难以令人满意的原因。 一般来说,要确保文字和线条的清晰度需要较高的分辨率(通常为 300dpi),而反映连续色彩 图像和纸张的背景机理则不需要那么高的分辨率(通常为 100dpi)。因此,要提高清晰度,最 好的方法就是将这些元素分为不同的层来进行处理。通过将文字和背景分离开来 DjVu 可以 用高分辨率来还原文字,使锐利边缘得以保留,并最大限度地提高可辨性,同时用较低的分 辨率来压缩背景图片,从而使整个图像的质量得到了保证。 对于彩色扫描影像而言,它的内容元素特性是不同的,如果针对这些不同的元素采用与 其相适应的压缩技术进行处理,就有可能获得较小的文件尺寸。DjVu 真实遵循这一原理, 根据扫描影像的内容特点,将其分离为蒙皮、背景、前景三大层次,分别应用 JB2 数据压 缩方法和 IW44 Wavelet 的方法进行处理,从而大大减小文件的尺寸。其中, 1. IW44 Wavelet 的算法主要用于彩色图片、照片、背景纹理及其他连续色调的影像压缩, 这些元素的对比度远不如文字、线条强烈,因此对它们进行低分辨率(通常是 100dpi)的压 缩编码仍能保持很好的视觉效果。IW44 在进行影像重建时使用渐进模式,所以消耗的内存 极少。IW44 主要用于对下列影像进行压缩编码:照片型文档影像、彩色文档型影像的背景
两层彩色文档型的前景层。2.JB2数据压缩主要针对黑白文字、线条图案进行处理(通常是在300dpi的分辨率),保持这些元素的高清晰度和可打印性,通过采用一种叫做软模式匹配(Softpatternmatching)的模式方法,将类似的字符形状先行编码为模板,而对其类似的形状只进行差异编码,极大地减少了重复形状数据的编码与存储,大大减小了文件的尺寸,获得的压缩比相当高DiVu将描述获取的影像分为三种类型:1、照片型文档影像:指通过扫描获得的彩色、灰度及其他连续色调的影像,通常采用IW44Wavelet方法,以全分辨率对其进行压缩编码。2、色调型文档影像:指通过扫描获得的包含黑白文字、简单线条图形的影像,例如CAD图、房屋平面布置图、报纸、音乐五线谱等的影像。这类影像通常采用JB2的方法进行压缩编码。3、彩色文档影像:指通过高分辨率扫描获取的同时包含图片、文字的彩色或灰度影像,例如杂志、产品目录、地图、历史文献等。这类影像文件在压缩编码时会背分离出多层分别处理,各层分别使用IW44Wavelet或JB2的原理进行压缩。当今世界,超过90%的资料仍然是以纸张的形式保存,而无法在网络上下载或存放于光盘中。由于这些资料多半是极具价值的历史文件或是重要的记录报告,因此往住必须花费许多的金钱与人力来加以保存。造成许多纸张资料无法数字化储存的原因是:若要维持图像的高品质及字体的清晰度,则档案将会变得极大:但如果降低分辨率以达到较小的档案及较快的下载速度,也就意味看必须丧失图像的品质及清晰度。原始灰度图象版面分析Layout AnalyzeOriginalGrayscale Image文图象区域文字区域图形区域Text RegionGraphic RegionPicture Region-V文字编码图形编码图象编码Picture CodingText CodingGraphic CodingDiVu分层压缩框图一般常见的JPEG、PDF、TIFF压缩技术都无法同时达成高分辨率及较小的图像档案。但DjVu的压缩技术则可以完全解决这些问题。1000:1高压缩比,使用DjVu将没有任何延迟的等待时间。若比较PDF格式及DiVu格式的下载时间,对同一份50页的彩色文件而言当DiVu下载完成后,PDF格式仅下载了一贞文件。DiVu下载后的图像直接储存在计算机的内存中,并且可以在浏览器上快速地对文件进行实时的移动、缩放。换句话说,DjVu能使人们只花很少的时间来扫描、储存及下载大量文件。3.DjVu的优势通过DjVu压缩格式,以300dpi的分辨率扫描的彩色页面可以从25MB缩小到30至80KB,而且图像质量十分优秀。对于同时包括文字和图像的彩色文件来说,DiVu文件在同等
两层彩色文档型的前景层。 2. JB2 数据压缩主要针对黑白文字、线条图案进行处理(通常是在 300dpi 的分辨率), 保持这些元素的高清晰度和可打印性,通过采用一种叫做软模式匹配(Soft pattern matching) 的模式方法,将类似的字符形状先行编码为模板,而对其类似的形状只进行差异编码,极大 地减少了重复形状数据的编码与存储,大大减小了文件的尺寸,获得的压缩比相当高 DjVu 将描述获取的影像分为三种类型: 1、照片型文档影像:指通过扫描获得的彩色、灰度及其他连续色调的影像,通常采用 IW44 Wavelet 方法,以全分辨率对其进行压缩编码。 2、色调型文档影像:指通过扫描获得的包含黑白文字、简单线条图形的影像,例如 CAD 图、房屋平面布置图、报纸、音乐五线谱等的影像。这类影像通常采用 JB2 的方法进行压 缩编码。 3、彩色文档影像:指通过高分辨率扫描获取的同时包含图片、文字的彩色或灰度影像, 例如杂志、产品目录、地图、历史文献等。这类影像文件在压缩编码时会背分离出多层分别 处理,各层分别使用 IW44 Wavelet 或 JB2 的原理进行压缩。 当今世界,超过 90%的资料仍然是以纸张的形式保存,而无法在网络上下载或存放于 光盘中。由于这些资料多半是极具价值的历史文件或是重要的记录报告,因此往住必须花费 许多的金钱与人力来加以保存。 造成许多纸张资料无法数字化储存的原因是:若要维持图像的高品质及字体的清晰度, 则档案将会变得极大;但如果降低分辨率以达到较小的档案及较快的下载速度,也就意味着 必须丧失图像的品质及清晰度。 DjVu 分层压缩框图 一般常见的 JPEG、PDF、TIFF 压缩技术都无法同时达成高分辨率及较小的图像档案。 但 DjVu 的压缩技术则可以完全解决这些问题。1000:1 高压缩比,使用 DjVu 将没有任何延迟 的等待时间。若比较 PDF 格式及 DjVu 格式的下载时间,对同一份 50 页的彩色文件而言, 当 DjVu 下载完成后,PDF 格式仅下载了一页文件。DjVu 下载后的图像直接储存在计算机 的内存中,并且可以在浏览器上快速地对文件进行实时的移动、缩放。换句话说,DjVu 能 使人们只花很少的时间来扫描、储存及下载大量文件。 3.DjVu 的优势 通过 DjVu 压缩格式,以 300dpi 的分辨率扫描的彩色页面可以从 25 MB 缩小到 30 至 80 KB,而且图像质量十分优秀。对于同时包括文字和图像的彩色文件来说,DjVu 文件在同等
质量下通常比JPEG文件小5到10倍。对于黑白页面来说,DiVu文件通常比JPEG文件小10到20倍,比GIF文件小5倍。对于那些由扫描文件制作而成的黑白PDF图像来说,DjVu文件也要小3到8倍。除了扫描文件之外,DjVu也可用于电子生成的文件,如阿杜比的PostScript文件或PDF文件。以这些文件为对象压缩而成的DjVu文件,其每页大小在30Odpi的分辨率下通常在15到20KB之间。这使得高质量的彩色扫描页面的大小直逼普通的HTML页面(平均50KB)。通过插件,DjVu页面可以在浏览器窗口中任意放大和缩小,而无须占用25MB的内存来对图像进行全解码。通过将解码的图像部分存储在一种只占2MB内存的数据结构中,实际显示在屏幕上的像素是在传输过程中被解码的。这就使得图片下载的功效达到大幅度提高。同时,由于采用分层显示,而不是等到整副图片都被解码之后才显示,也使得图片显示的速度大天提高,用户在两三秒之内就能够迅速看到文字,其他的图像信息也会在几秒钟之内陆续显示出来。这种网上高质量图像发布的体验在传统压缩格式上是无法实现的。DiVu的另一个优点是,它是一个公开标准。其解码程序和部分编码程序可在网上免费获得。DjVu网络浏览器插件,也即DjVu文件的解码软件,可直接在LizardTech公司的主页上下载(http:/www.lizardtech.com/download.html),而且有针对Linux,Windows95/98/NT,Mac,和各种UNIX操作系统的不同版本可供选择。4.DjVu的应用DjVu应用范围非常广泛:图书档案、古籍数字化,政府单位、金融档案单据的电子化管理,加工制造业相关说明书、维修手册、图纸等的电子化,城市建设,地图等。任何扫描的高分辨率图像和数字生成的文件都可以通过DjVu的方式在网上进行发布。有了DjVu,网络内容提供商们就可以将大量宝贵的书籍、杂志、索引、手稿、报纸和古代历史资料通过扫描而在网上发布了。原来被保存在这些物质载体上的信息,现在可以通过比特的形式被更为广泛的受众所获取了。具体来说,DjVu的应用主要体现在以下几个方面:1、商业方面,产品照片的网上发布是一个重要用途。虽然电子商务正在逐渐普及,但网上产品的图像质量却另人难以满意。一般来说,这些产品图片不是只有邮票大小,就是要花上儿分钟来下载,而且对于局部的细节无法放大观看。DVu则可以解决这些问题。通过分层逐步解码,图像可以很快显示出来,而且还可以利用拖动和放大功能来观察所有细节。这些特点也非常适用于拍卖物品的图片发布。商业应用的另一个方面是公司报告的网上发布。目前,PDF格式是公司报告的一个主要发布方式。一份60页A4大小公司报告用PDF格式来发布,其大小大概在4MB左右,而扫描之后以DjVu格式保存,其文件大小则不超过800K。此外,其他公司文件,如技术手册、CAD绘图、财务文件、税务和邮件等,都可通过DiVu在公司内部网中保存。2、教育方面,DiVu将成为电子图书网上发行的最佳手段。即使已经有了完全电子生成的数字版本,DjVu仍然是屏幕显示的最佳选择。例如,对于页面上包括一定数量的颜色、图片、公式、线条和其它非文字对象(如大学教材)时,DjVu的超强压缩功能将大大缩小文件的尺寸,使其在性能上优于PDF格式。对于网页设计者来说,DiVu插件的压缩界面和自动装载功能,以及和网页浏览器的完全兼容等也是可圈可点之处。另外,DjVu格式的电子书也具有文字查找功能,对于读者查找关键词也非常方便。对于学术作品的网络发布来说,DVu也是很好的方式。自前,人们主要是将文学处理软件完成的作品压缩,然后在网上发布。这样做的缺点在于,必须先将整个文件下载,之后才能阅读,而且一旦文件当中插有图片时,文件又大得惊人。用DjVu则可以将数字生成或扫描生成的任何文件进行有效的压缩和快速的显示,而且不受文件内容的限制,这也是为什么越来越多的科学家、研究者和学生开始在网上利用DjVu来发布他们作品的原因。图书馆的资料保存和文件管理也将受益于DjVu。原来以各种形态出现的文档,现在都可通过扫描压缩成DjVu格式,并在网络数据库
质量下通常比 JPEG 文件小 5 到 10 倍。对于黑白页面来说,DjVu 文件通常比 JPEG 文件小 10 到 20 倍,比 GIF 文件小 5 倍。对于那些由扫描文件制作而成的黑白 PDF 图像来说,DjVu 文件也要小 3 到 8 倍。除了扫描文件之外,DjVu 也可用于电子生成的文件,如阿杜比的 PostScript 文件或 PDF 文件。以这些文件为对象压缩而成的 DjVu 文件,其每页大小在 300dpi 的分辨率下通常在15 到20KB 之间。这使得高质量的彩色扫描页面的大小直逼普通的HTML 页面(平均 50KB)。通过插件,DjVu 页面可以在浏览器窗口中任意放大和缩小,而无须占 用 25MB 的内存来对图像进行全解码。通过将解码的图像部分存储在一种只占 2MB 内存的 数据结构中,实际显示在屏幕上的像素是在传输过程中被解码的。这就使得图片下载的功效 达到大幅度提高。同时,由于采用分层显示,而不是等到整副图片都被解码之后才显示,也 使得图片显示的速度大大提高,用户在两三秒之内就能够迅速看到文字,其他的图像信息也 会在几秒钟之内陆续显示出来。这种网上高质量图像发布的体验在传统压缩格式上是无法实 现的。DjVu 的另一个优点是,它是一个公开标准。其解码程序和部分编码程序可在网上免 费获得。DjVu 网络浏览器插件,也即 DjVu 文件的解码软件,可直接在 LizardTech 公司的 主页上下载(http://www.lizardtech.com/download.html),而且有针对 Linux, Windows 95/98/NT, Mac, 和各种 UNIX 操作系统的不同版本可供选择。 4.DjVu 的应用 DjVu 应用范围非常广泛:图书档案、古籍数字化,政府单位、金融档案单据的电子化 管理,加工制造业相关说明书、维修手册、图纸等的电子化,城市建设,地图等。任何扫描 的高分辨率图像和数字生成的文件都可以通过 DjVu 的方式在网上进行发布。有了 DjVu, 网络内容提供商们就可以将大量宝贵的书籍、杂志、索引、手稿、报纸和古代历史资料通过 扫描而在网上发布了。原来被保存在这些物质载体上的信息,现在可以通过比特的形式被更 为广泛的受众所获取了。具体来说,DjVu 的应用主要体现在以下几个方面: 1、商业方面,产品照片的网上发布是一个重要用途。虽然电子商务正在逐渐普及,但 网上产品的图像质量却另人难以满意。一般来说,这些产品图片不是只有邮票大小,就是要 花上几分钟来下载,而且对于局部的细节无法放大观看。DjVu 则可以解决这些问题。通过 分层逐步解码,图像可以很快显示出来,而且还可以利用拖动和放大功能来观察所有细节。 这些特点也非常适用于拍卖物品的图片发布。商业应用的另一个方面是公司报告的网上发 布。目前,PDF 格式是公司报告的一个主要发布方式。一份 60 页 A4 大小公司报告用 PDF 格式来发布,其大小大概在 4MB 左右,而扫描之后以 DjVu 格式保存,其文件大小则不超 过 800K。此外,其他公司文件,如技术手册、CAD 绘图、财务文件、税务和邮件等,都可 通过 DjVu 在公司内部网中保存。 2、教育方面,DjVu 将成为电子图书网上发行的最佳手段。即使已经有了完全电子生成 的数字版本,DjVu 仍然是屏幕显示的最佳选择。例如,对于页面上包括一定数量的颜色、 图片、公式、线条和其它非文字对象(如大学教材)时,DjVu 的超强压缩功能将大大缩小 文件的尺寸,使其在性能上优于 PDF 格式。对于网页设计者来说,DjVu 插件的压缩界面和 自动装载功能,以及和网页浏览器的完全兼容等也是可圈可点之处。另外,DjVu 格式的电 子书也具有文字查找功能,对于读者查找关键词也非常方便。对于学术作品的网络发布来说, DjVu 也是很好的方式。目前,人们主要是将文字处理软件完成的作品压缩,然后在网上发 布。这样做的缺点在于,必须先将整个文件下载,之后才能阅读,而且一旦文件当中插有图 片时,文件又大得惊人。用 DjVu 则可以将数字生成或扫描生成的任何文件进行有效的压缩 和快速的显示,而且不受文件内容的限制,这也是为什么越来越多的科学家、研究者和学生 开始在网上利用 DjVu 来发布他们作品的原因。图书馆的资料保存和文件管理也将受益于 DjVu。原来以各种形态出现的文档,现在都可通过扫描压缩成 DjVu 格式,并在网络数据库
中保存。这样一来,所有的资料都能十分逼真的转化为数字形式。读者也就可以更加便利地在网上获取一些以前很难看到的珍贵材料。3、文学艺术方面,对人类早期的手稿和印刷品进行网上发布是DjVu的“杀手铜”。今为止,DjVu是唯一能够将这些材料丝毫毕现地在网上发布的压缩技术。公众以前基本无法接触到的稀有珍藏,如谷登堡于1450-1455年间用他发明的金活字印刷机印刷的著名的42行《圣经》,美国的独立宣言照片等,现在都可以毫无限制地在网上传播,公众只需花几秒钟的时间就可以在自己家里的电脑屏幕上欣赏到这些珍贵的历史资料,而历史学家和研究者们则可以对所有的色彩和细节部分进行细致的分析。除以文学为主的文献资料外,绘画作品也可通过DiVu在网上发布。虽然前文强调的是DjVu对文字边缘清晰呈现的能力,但对色彩的压缩和还原,DjVu的表现同样出色。通过基于微波理论的连续色彩压缩技术(continuous-toneimagecompressiontechnology),DjVu对绘画图像的处理要优于JPEG格式。特别对于高压缩比例的图像来说,DjVu的优势比较明显。其连续显示、放大和移动功能也使用户的读图体验超越传统。而且,与文字资料不同的是,绘画图像的压缩显示没有前景和背景的分层,因此整幅图下载起来更为流畅。4、行政司法方面,地图和土地登记文件可以通过DiVu在网上发布。由于地图对图例标记的清晰度要求极高,用传统的图像压缩技术很难将地图以高分辨率在网上发布。人们目前在网上能看到的JPEG格式的地图,要么根本看不清上面的文字和标记,要么就需要花很长的时间来下载,对电脑内存的要求也很高。通过DiVu,则可以轻松地将地图和各种土地登记文件在网上传播。5.DjVu的意义DjVu,作为一种新的彩色文件压缩技术,在纸质世界和比特世界之间搭起了一座桥梁。它使得高质量的扫描图像可以轻易地在因特网上进行发布。专门针对网络发行而设计的DjVu技术,以其友好的用户界面和网络功能博得了越来越多的商业和非商业用户的垂青,其应用将会使方兴未艾的网络传播进入一个新的阶段。1、使原有的网上图片传播更加便捷。随着读图时代的到来,网上图片传播的地位将越来越高。原来以JPEG、GIF和PNG等格式在网上发布的图片,不论是图像质量还是下载时间,都难以令人满意。DjVu以其科学有效的压缩模式,使网上图片传播的硬件和带宽瓶颈得以突破。普通网民可以在普通的计算机上方便快速地进行图片浏览和发布。2、使原来无法上网的资料能够在网上发布。当人类网络传播逐步由初期的硬件建设发展为一种文化产业,网上内容的开发和建设成为当务之急。除了直接以数字方式进行网上内容生产(如直接在电脑上用字处理软件和图像制作软件进行生产)之外,一个资源最丰富的渠道就是将人类传统的纸质信息转化成数字信息而在网上发布,也就是将人类的文化遗产数字化。要成功地实现这一转化,除了扫描技术之外,还必须要有高效的图像压缩技术。DjVu技术就是解决这一问题的关键。它可以将以前由于扫描文件大小原因而难以在网上发布的资料轻易地搬上因特网,从而使人类宝贵的知识遗产能够得到更为广泛的传播。3、有利于推进电子商务和电子政务的发展。消费者在网上无法得到全方位的产品外观,并对其细节进行研究,是制约电子商务发展的因素之一。DiVu技术的出现,使得产品图片的发布轻而易举,而且成本低廉,为电子商务的发展消除了这方面的障碍。对于电子政务来说,政府可以通过DjVu技术方便地将各种文件在网上存档和发布,不仅可以提高行政管理效率,也有利于保护公众的知情权。参考文献
中保存。这样一来,所有的资料都能十分逼真的转化为数字形式。读者也就可以更加便利地 在网上获取一些以前很难看到的珍贵材料。 3、文学艺术方面,对人类早期的手稿和印刷品进行网上发布是 DjVu 的“杀手锏”。迄 今为止,DjVu 是唯一能够将这些材料丝毫毕现地在网上发布的压缩技术。公众以前基本无 法接触到的稀有珍藏,如谷登堡于 1450-1455 年间用他发明的金活字印刷机印刷的著名的 42 行《圣经》,美国的独立宣言照片等,现在都可以毫无限制地在网上传播,公众只需花几 秒钟的时间就可以在自己家里的电脑屏幕上欣赏到这些珍贵的历史资料,而历史学家和研究 者们则可以对所有的色彩和细节部分进行细致的分析。除以文字为主的文献资料外,绘画作 品也可通过 DjVu 在网上发布。虽然前文强调的是 DjVu 对文字边缘清晰呈现的能力,但对 色彩的压缩和还原,DjVu 的表现同样出色。通过基于微波理论的连续色彩压缩技术 (continuous-tone image compression technology),DjVu对绘画图像的处理要优于JPEG格式。 特别对于高压缩比例的图像来说,DjVu 的优势比较明显。其连续显示、放大和移动功能也 使用户的读图体验超越传统。而且,与文字资料不同的是,绘画图像的压缩显示没有前景和 背景的分层,因此整幅图下载起来更为流畅。 4、行政司法方面,地图和土地登记文件可以通过 DjVu 在网上发布。由于地图对图例 标记的清晰度要求极高,用传统的图像压缩技术很难将地图以高分辨率在网上发布。人们目 前在网上能看到的 JPEG 格式的地图,要么根本看不清上面的文字和标记,要么就需要花很 长的时间来下载,对电脑内存的要求也很高。通过 DjVu,则可以轻松地将地图和各种土地 登记文件在网上传播。 5.DjVu 的意义 DjVu,作为一种新的彩色文件压缩技术,在纸质世界和比特世界之间搭起了一座桥梁。 它使得高质量的扫描图像可以轻易地在因特网上进行发布。专门针对网络发行而设计的 DjVu 技术,以其友好的用户界面和网络功能博得了越来越多的商业和非商业用户的垂青, 其应用将会使方兴未艾的网络传播进入一个新的阶段。 1、使原有的网上图片传播更加便捷。随着读图时代的到来,网上图片传播的地位将越 来越高。原来以 JPEG、GIF 和 PNG 等格式在网上发布的图片,不论是图像质量还是下载时 间,都难以令人满意。DjVu 以其科学有效的压缩模式,使网上图片传播的硬件和带宽瓶颈 得以突破。普通网民可以在普通的计算机上方便快速地进行图片浏览和发布。 2、使原来无法上网的资料能够在网上发布。当人类网络传播逐步由初期的硬件建设发 展为一种文化产业,网上内容的开发和建设成为当务之急。除了直接以数字方式进行网上内 容生产(如直接在电脑上用字处理软件和图像制作软件进行生产)之外,一个资源最丰富的 渠道就是将人类传统的纸质信息转化成数字信息而在网上发布,也就是将人类的文化遗产数 字化。要成功地实现这一转化,除了扫描技术之外,还必须要有高效的图像压缩技术。DjVu 技术就是解决这一问题的关键。它可以将以前由于扫描文件大小原因而难以在网上发布的资 料轻易地搬上因特网,从而使人类宝贵的知识遗产能够得到更为广泛的传播。 3、有利于推进电子商务和电子政务的发展。消费者在网上无法得到全方位的产品外观, 并对其细节进行研究,是制约电子商务发展的因素之一。DjVu 技术的出现,使得产品图片 的发布轻而易举,而且成本低廉,为电子商务的发展消除了这方面的障碍。对于电子政务来 说,政府可以通过 DjVu 技术方便地将各种文件在网上存档和发布,不仅可以提高行政管理 效率,也有利于保护公众的知情权。 参考文献
[1JKochut A, Beaty K, Shaikh H. Desktop Workload Study with Implications for DesktopCloud Resource Optimization[CJProceedings of IPDPSW'10. Atlanta, USA: IEEE Press,2010.[2]ITU-TStudyGroup16.TU-TT.44-20055 Mixed Raster Content(MRC)[S]Telecommunication Standardization Sector of International Telecommunications Union,2005.[3]Feng Guotong, Bouman C A. High-quality MRC Document Coding[]. IEEE Transactionson ImageProcessing,2006,15(10):3152-3169[4]AT&T Laboratories Cambridge.Virtual Network Computingg(VNC)[EB/OL](2003-03-05)[5]阎忠武.DjVu文档压缩技术概述[].数字与缩微影像,2006,3:25-26.[6]刘聪明,郑晓慧.DjVu在源建设中的应用及其探讨[J].现代情报,2008,7:85-87
[1]Kochut A, Beaty K, Shaikh H. Desktop Workload Study with Implications for Desktop Cloud Resource Optimization[C]Proceedings of IPDPSW’10. Atlanta, USA: IEEE Press, 2010. [2]ITU-T Study Group 16. TU-T T.44-2005 Mixed Raster Content(MRC)[S]. Telecommunication Standardization Sector of International Telecommunications Union, 2005. [3]Feng Guotong, Bouman C A. High-quality MRC Document Coding[J]. IEEE Transactions on Image Processing, 2006, 15(10):3152-3169. [4]AT&T Laboratories Cambridge. Virtual Network Computing (VNC)[EB/OL]. (2003-03-05). [5]阎忠武. DjVu 文档压缩技术概述[J].数字与缩微影像,2006,3:25-26. [6]刘聪明,郑晓慧.DjVu 在源建设中的应用及其探讨[J].现代情报,2008,7:85-87