MC 为什么要压缩? 未压缩图像的数据率示例 ◆例如,扫描仪产生的图像 ▣分辨率:300×600dpi、600×1200dpi、1200×2400dpi甚 至更高 口色彩深度:24位、36位甚至更高 ▣A4纸张:8.27英寸×11.69英寸 ◆(8.27*1200)*(11.69*2400)*(24/8)≈280 M Bytes ◆如,2000万像素的数码相机 ▣20000000*3≈180 Bytes 27 ynh.cxh@ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 为什么要压缩? 未压缩图像的数据率示例 例如,扫描仪产生的图像 分辨率:300×600dpi、600×1200dpi、1200×2400dpi甚 至更高 色彩深度:24位、36位甚至更高 A4纸张: 8.27英寸×11.69英寸 (8.27*1200) * (11.69*2400) *(24/8) ≈ 280M Bytes 如,2000万像素的数码相机 20000000 * 3 ≈ 180M Bytes 27
MC 为什么要压缩? 无压缩视频源的数据率需求 ◆例如:一个512×512分辨率的一分钟视频需要如下 的存储容量: 512×512×8×3=6291456=6.3Mbit/s 6.3×30帧/s=188Mbit/s 188/8=23.5 Byte/.s 那么一张650 MBytel的光盘就只能存储 650 M byte光盘/23.5 M bytes/s=27.5秒 ◆虽然4.7G的DVD已经非常普遍,但是视频→HDTV ynh,cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 为什么要压缩? 无压缩视频源的数据率需求 例如:一个512×512分辨率的一分钟视频需要如下 的存储容量: 512× 512× 8 × 3=6291456=6.3M bit/s 6.3 × 30帧/s =188M bit/s 188/8 = 23.5MByte/s 那么一张650MByte的光盘就只能存储 650M byte光盘/23.5M bytes/s = 27.5秒 虽然4.7G的DVD已经非常普遍,但是视频HDTV 28
MC 为什么要压缩? URL的编码方式 【百度面试题】一个大的含有50M个URL的记录,一个小的含 有500个URL的记录,找出两个记录里相同的URL。 先用包含500个URL的文件创建一个hash set。 然后遍历50M的URL记录,如果URL在hash set中,则输出此URL并从 hash set中删除这个URL。 所有输出的URL就是两个记录里相同的ul。 URL示例 http://baike.baidu.com/link?url=NGckZcowcm9UOk3ObaLLoUiVRWI-xZ1IXzIyB9_4lgHHuReW3X9bvmlsSXDgHVIClywp4sKwemSAHMqzmncMSa URL的信息指纹:(网络爬虫需要存储URL)假定网址的平均 长度为一百个字符,那么存贮200亿个网址本身至少需要2 TB,即两千GB的容量。如果能够找到一个函数,将这200 亿个网址随机地映射到128二进位即16个字节的整数空间, 这样每个网址只需要占用16个字节。 ynh.cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 为什么要压缩? URL的编码方式 【百度面试题】一个大的含有50M个URL的记录,一个小的含 有500个URL的记录,找出两个记录里相同的URL。 • 先用包含500个URL的文件创建一个hash_set。 • 然后遍历50M的URL记录,如果URL在hash_set中,则输出此URL并从 hash_set中删除这个URL 。 • 所有输出的URL就是两个记录里相同的url。 URL的信息指纹:(网络爬虫需要存储URL)假定网址的平均 长度为一百个字符,那么存贮 200 亿个网址本身至少需要 2 TB,即两千 GB 的容量。如果能够找到一个函数,将这 200 亿个网址随机地映射到128 二进位即 16 个字节的整数空间, 这样每个网址只需要占用 16 个字节。 URL示例 http://baike.baidu.com/link?url=NGckZcowcm9U0k3ObaLLoUiVRWI-xZ1IXzIyB9_4lgHHuReW3X9bvmlsSXDgHVIClywp4sKwemSAHMqzmncMSa
MC 小结:为什么要压缩 海量数据与有限处理能力的矛盾 ◆多媒体信息包括文本、数据、声音、动画、图形以 及视频等多种媒体信息,经过数字化处理后其数据量 非常大,如果不进行数据压缩处理,计算机系统就无 法对它进行存储和交换; ◆多媒体信息中的图像、音频和视频这些媒体具有很 大的压缩潜力。因为这些数据中存在着空间冗余、时 间冗余、结构冗余、视觉冗余、图像区域的相同性冗 余、纹理的统计冗余等,它们为数据压缩技术的应用 提供了可能的条件。 30 ynh.cxh@ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 小结:为什么要压缩 海量数据与有限处理能力的矛盾 多媒体信息包括文本、数据、声音、动画、图形以 及视频等多种媒体信息,经过数字化处理后其数据量 非常大,如果不进行数据压缩处理,计算机系统就无 法对它进行存储和交换; 多媒体信息中的图像、音频和视频这些媒体具有很 大的压缩潜力。因为这些数据中存在着空间冗余、时 间冗余、结构冗余、视觉冗余、图像区域的相同性冗 余、纹理的统计冗余等,它们为数据压缩技术的应用 提供了可能的条件。 30
KC第2章多媒体数据压缩国际标准 ◆2.1多媒体数据压缩编码的重要性和分类 口2.1.1为什么要压缩? ▣2.1.2为什么能压缩? ▣2.1.3数据压缩编码的两大类 ◆2.2常见数据压缩方法分类与基本原理 ◆2.3音频压缩标准 ◆2.4静态图像压缩编码的国际标准 ◆2.5视频压缩的国际标准 ◆2.6可伸缩性编码和分布式编码 31 ynh.cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 第2章 多媒体数据压缩国际标准 2.1 多媒体数据压缩编码的重要性和分类 2.1.1为什么要压缩? 2.1.2 为什么能压缩? 2.1.3 数据压缩编码的两大类 2.2 常见数据压缩方法分类与基本原理 2.3 音频压缩标准 2.4 静态图像压缩编码的国际标准 2.5 视频压缩的国际标准 2.6 可伸缩性编码和分布式编码 31