多媒体数据压缩 口国际电报电话咨询委员会( CCITT):针对二值图像的一系列压缩标 准,如 CCITT Group3、 CCITT Group4等(此外还包括CCIr与SO共 同制订的JBG标准)。 口70年代末80年代初:数学家们提出了损失压缩精度以换取压缩 率的崭新新思路。国际标准化组织(IO)和CCmT联合组成了两个 委员会:静态图像联合专家小组(JPEG)和动态图像联合专家小组 MPEG)。诞生了JPEG、MPEG-1、MPEG2、MPEG4、MPEG-7等 系列标准。 口 PostScript矢量图形格式:起源于1976年的 Evans& Sutherland计算机 公司,当时的名字是 Design System。1978年, John Warnock和 Martin Newel将其演变为JAM语言。1982年, John Warnock和 huck Geschke创建了著名的 Adobe System公司,第三次设计和实现 了这个语言,并称其为 Post Script
多媒体数据压缩 ❑ 国际电报电话咨询委员会( CCITT ) :针对二值图像的一系列压缩标 准,如 CCITT Group3、CCITT Group4 等 (此外还包括CCITT与ISO共 同制订的JBIG标准) 。 ❑ 70 年代末 80 年代初:数学家们提出了损失压缩精度以换取压缩 率的崭新思路。国际标准化组织( ISO )和 CCITT 联合组成了两个 委员会:静态图像联合专家小组( JPEG )和动态图像联合专家小组 ( MPEG )。诞生了 JPEG、MPEG-1、MPEG-2、MPEG-4、MPEG-7 等 系列标准。 ❑ PostScript矢量图形格式:起源于1976 年的 Evans & Sutherland 计算机 公司,当时的名字是Design System。1978 年,John Warnock 和 Martin Newel 将其演变为 JAM 语言。1982 年,John Warnock 和 Chuck Geschke 创建了著名的Adobe System 公司,第三次设计和实现 了这个语言,并称其为PostScript
技术准备:什么是熵 熵——来源于40年代由 Claude shannon创立的信息论中的一条定理,这 定理借用了热力学中的名词“熵”( Entropy)来表示一条信息中真正 需要编码的信息量 考虑用0和1组成的二进制数码为含有n个符号的某条信息编码, 假设符号F在整条信息中重复出现的概率为Pn,则该符号的熵也即 表示该符号所需的二进制位数为 En=-log2(Pn) 整条信息的熵也即表示整条信息所需的二进制位数为: E=>k,E 例:对信息 aabbaccbaa,字符串长度为10,字符a、b、c分别出现了5、 2次,则 Ea=0g2(0.5)=1E=0g2(0.3)=1.737E=0g2(0.2)=2.322 E=5E+3Eb+2E=14855位 对比一下,我们用ASC编码表示该信息需要80位
技术准备:什么是熵 熵——来源于40年代由Claude Shannon创立的信息论中的一条定理,这 一定理借用了热力学中的名词“熵”( Entropy )来表示一条信息中真正 需要编码的信息量: 考虑用 0 和 1 组成的二进制数码为含有 n 个符号的某条信息编码, 假设符号 Fn 在整条信息中重复出现的概率为 Pn,则该符号的熵也即 表示该符号所需的二进制位数为: En = - log2 ( Pn ) 整条信息的熵也即表示整条信息所需的二进制位数为: E = ∑knEn 例:对信息aabbaccbaa,字符串长度为10,字符a、b、c分别出现了5、 3、2次,则 Ea =-log2 (0.5)=1 Eb=-log2 (0.3)=1.737 Ec =-log2 (0.2)=2.322 E= 5Ea + 3Eb + 2Ec =14.855 位 对比一下,我们用ASCII编码表示该信息需要80位
技术准备:模型 使用模型:得到字符或单词在信息中出现的概率 静态/半静态模型 统计模型 自适应模型 静态字典模型 字典模型 自适应字典模型 Claude shannon的“聚会游戏”( arty game): 他每次向听众公布一条被他隐藏起一个字符的消息,让听众来猜下 次数来确定整个信息的熵。(人的语言经验) Shannon使用猜测 个字符,一次猜一个,直到猜对为止。然后
技术准备:模型 使用模型:得到字符或单词在信息中出现的概率 静态/半静态模型 自适应模型 Claude Shannon的“聚会游戏”(party game): 他每次向听众公布一条被他隐藏起一个字符的消息,让听众来猜下 一个字符,一次猜一个,直到猜对为止。然后,Shannon 使用猜测 次数来确定整个信息的熵。(人的语言经验) 静态字典模型 自适应字典模型 统计模型 字典模型
技术准备:编码 通过模型,我们可以确定对某一个符号该用多少位二进制数进行编码。 现在的问题是,如何设计一种编码方案,使其尽量精确地用模型计算出 来的位数表示某个符号。 前缀编码规则:任何一个符号的编码都不是另一个符号编码的前缀。 最简单的前缀编码 字符编码 0 1110010101110110111100010 10 B—C—D—E 110 D A BBB 1110 11110
技术准备:编码 通过模型,我们可以确定对某一个符号该用多少位二进制数进行编码。 现在的问题是,如何设计一种编码方案,使其尽量精确地用模型计算出 来的位数表示某个符号。 前缀编码规则:任何一个符号的编码都不是另一个符号编码的前缀。 最简单的前缀编码 字符 编码 A 0 B 10 C 110 D 1110 E 11110 1110010101110110111100010 D A B B D C E A A B
技术准备:压缩=模型+编码 符号 概率 代码 输入 模型 编码 输出
技术准备:压缩=模型+编码 输入 模型 编码 输出 符号 概率 代码