3.12多媒体数据压缩的可能性 口312多媒体数据压缩的可能性 (1)图像数据表示中大量冗余 (2)图像数据压缩技术:利用图像数据冗余性减少数据量方法 ■1.空间冗余 口静态图像存在的主要冗余; 口采样点颜色之间的空间连贯性区域中各点光强、色彩、饱和度同; 口离散像素采样表示颜色没有利用这种空间连贯性; 口改变颜色的像素存储方式利用空间连贯性减少数据量 ■2.时间冗余 口序列图像(电视、运动图像)表示常包含的冗余; 口相邻帧记录了相邻时刻的同一场景画面移动物位置稍不同 Digital Campneddiow and Coding low ultimedia 3-6
Digital Compression and Coding for Multimedia 3-6 3.1.2 多媒体数据压缩的可能性 3.1.2 多媒体数据压缩的可能性 (1)图像数据表示中大量冗余 (2)图像数据压缩技术: 利用图像数据冗余性减少数据量方法 ◼ 1. 空间冗余 静态图像存在的主要冗余; 采样点颜色之间的空间连贯性:区域中各点光强、色彩、饱和度同; 离散像素采样表示颜色没有利用这种空间连贯性; 改变颜色的像素存储方式,利用空间连贯性,减少数据量. ◼ 2. 时间冗余 序列图像(电视、运动图像)表示常包含的冗余; 相邻帧记录了相邻时刻的同一场景画面,移动物位置稍不同
3.12多媒体据压缩的可能性 口3.1.2多媒体数据压缩的可能性 ■3.结构冗余 口图像纹理区的像素值存在着分布模式:如方格状地板图案; 口已知分布模式可通过某一过程生成图像. ■4.知识冗余 口有些图像的理解与某些知识有相当大的相关性如人脸的图像 有固定结构; 口规律性结构可由先验知识和背景知识获得——知识冗余; 口由已有知识,对图像中物体构造其基本模型,创建对应各种特征 的图像库:存储时只需保存图像的一些特征参数 口知识冗余是模型编码主要利用的特征 Digital Campneddiow and Coding low ultimedia
Digital Compression and Coding for Multimedia 3-7 3.1.2 多媒体数据压缩的可能性 3.1.2 多媒体数据压缩的可能性 ◼ 3. 结构冗余 图像纹理区的像素值存在着分布模式:如方格状地板图案; 已知分布模式,可通过某一过程生成图像. ◼ 4. 知识冗余 有些图像的理解与某些知识有相当大的相关性,如人脸的图像 有固定结构; 规律性结构可由先验知识和背景知识获得——知识冗余; 由已有知识,对图像中物体构造其基本模型,创建对应各种特征 的图像库:存储时只需保存图像的一些特征参数; 知识冗余是模型编码主要利用的特征
3.12多媒体据压缩的可能性 ■5.视觉冗余 (1).人类视觉系统对图像场的敏感性是非均匀的和非线性的; (2记录图像时假定视觉系统是均匀和线性的对不同敏感区同样对待产 生了视觉冗余应对不同敏感部分分开编码; (3)视觉的非均匀性 口视觉系统对图像的亮度和色彩度的敏感性相差很大,RGB→NTSC的 ylQ后发现,视觉系统的亮度y的敏感度远高于色度(Q的敏感度一 可对Q允许误差大于y的允许误差; 口亮度增加时视觉系统对量化误差的敏感度降低,人眼辨别能力与物体 周围的背景亮度成反比—一在高亮度区灰度值的量化可粗糙一些; Digital Campneddiow and Coding low ultimedia 3-8
Digital Compression and Coding for Multimedia 3-8 3.1.2 多媒体数据压缩的可能性 ◼ 5. 视觉冗余 (1).人类视觉系统对图像场的敏感性是非均匀的和非线性的; (2).记录图像时假定视觉系统是均匀和线性的,对不同敏感区同样对待,产 生了视觉冗余. 应对不同敏感部分分开编码; (3).视觉的非均匀性. 视觉系统对图像的亮度和色彩度的敏感性相差很大,RGB→NTSC的 yIQ后发现,视觉系统的亮度y的敏感度远高于色度(I,Q)的敏感度—— 可对IQ允许误差大于y的允许误差; 亮度增加时,视觉系统对量化误差的敏感度降低,人眼辨别能力与物体 周围的背景亮度成反比.——在高亮度区,灰度值的量化可粗糙一些;
3.12多媒体据压缩的可能性 口人眼的视觉系统能把图像的边缘和非边缘区域分开处理——边缘区 和非边缘区分别编码的依据; 口人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频 通道后再进行处理一一编码时把图像分解成符合这一规律(视觉内在 特性)的频率通道,可获大的压缩比;小波编码的特性. ■6.图像区域的相同性冗余 口图像中多个区域所对应的像素值相同或者相近,产生重复性存储; 口向量量化 Vector quantization)是针对这种冗余的压缩编码方法 ■7.纹理的统计冗余 口某些图像纹理在统计意义上服从某些分布规律; 口利用分布规律减少图像数据量. Digital Campneddiow and Coding low ultimedia 3-9
Digital Compression and Coding for Multimedia 3-9 3.1.2 多媒体数据压缩的可能性 人眼的视觉系统能把图像的边缘和非边缘区域分开处理——边缘区 和非边缘区分别编码的依据; 人眼的视觉系统是把视网膜上的图像分解成若干个空间有向的视频 通道后再进行处理——编码时把图像分解成符合这一规律(视觉内在 特性)的频率通道,可获大的压缩比;小波编码的特性. ◼ 6. 图像区域的相同性冗余 图像中多个区域所对应的像素值相同或者相近,产生重复性存储; 向量量化(Vector quantization)是针对这种冗余的压缩编码方法. ◼ 7. 纹理的统计冗余 某些图像纹理在统计意义上服从某些分布规律; 利用分布规律减少图像数据量
3.1.3多媒体齦据压缩编码方法 PCM预测编码变换编码统计编码静图像编码电视图像编码基于重要性 (熵编码)(无损) 傅立叶(DFT) 矢量量化 固自固自 哈夫曼三 方块 帧内预测 滤波 定 分含 离散余弦(DIT) 帧间编码 算术编码 逐渐浮现 子采样三 离散正弦(DST) 运动估计 费诺 DPCM 沃尔什哈达马香农三 逐层内插 运动补偿模型编码 △M三 分形编码三 哈尔 位平面三 条件补充 游程(RLC ADPCM斜变换 LZW 抖动 一内插混合编码 运动补偿 卡胡南-苏夫 帧间预测PEG 小波变换三 H.261 MPEG 子带编码 图3-1多媒体数据压缩编码方法 Digital Campneddiow and Coding low ultimedia 3-10
Digital Compression and Coding for Multimedia 3-10 3.1.3 多媒体数据压缩编码方法 PCM 固 定 自 适 应 自 适 应 预测编码 固 定 DPCM △M ADPCM 运动补偿 变换编码 傅立叶(DFT) 离散余弦(DIT) 离散正弦(DST) 沃尔什-哈达马 哈 尔 斜变换 卡胡南-苏夫 (K——L) 小波变换 子带编码 统计编码 (熵编码)(无损) 哈夫曼 算术编码 费 诺 香 农 游程(RLC) LZW 静图像编码 方块 逐渐浮现 逐层内插 位平面 抖动 电视图像编码 帧内预测 帧间编码 运动估计 运动补偿 条件补充 内 插 帧间预测 基于重要性 矢量量化 滤 波 子 采 样 模型编码 分形编码 混合编码 H.261 JPEG MPEG 图3-1 多媒体数据压缩编码方法