© 多媒体通信 Multimedia Communications 第2章 多媒体数据压缩国际标准 关于视频在缩标准 爸2019年10月12日@ 甩于工程与后怎科学系
2019年10月12日 第2章 多媒体数据压缩国际标准 关于视频压缩标准 多媒体通信 Multimedia Communications
KC第2章多媒体数据压缩国际标准 ◆2.1多媒体数据压缩编码的重要性和分类 ◆2.2常见数据压缩方法分类与基本原理 ◆2.3音频压缩标准 ◆2.4静态图像压缩编码的国际标准 ◆2.5视频压缩的国际标准 ▣视频编解码器的框架与标准简介 ▣MPEG-1(1993)&MPEG-2/H.262(1996)视频标准 ▣MPEG-4AVC/H.264(2003)视频标准 口HEVC(2013)视频标准 ◆2.6不同应用场景下的其他编码思想 口基于模型/对象的编码思想:MPEG-4(1999) ▣视频质量可伸缩性&H.264SVC ▣多视角编码 3 ynh.cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 第2章 多媒体数据压缩国际标准 2.1 多媒体数据压缩编码的重要性和分类 2.2 常见数据压缩方法分类与基本原理 2.3 音频压缩标准 2.4 静态图像压缩编码的国际标准 2.5 视频压缩的国际标准 视频编解码器的框架与标准简介 MPEG-1(1993) & MPEG-2/H.262(1996)视频标准 MPEG-4 AVC/H.264(2003)视频标准 HEVC(2013)视频标准 2.6 不同应用场景下的其他编码思想 基于模型/对象的编码思想: MPEG-4(1999) 视频质量可伸缩性 & H.264 SVC 多视角编码 3
KC视频编码的思路 ◆现有编码技术可以分为三类 口第一类方法基于图像统计特性 ●预测编码(例如帧内预测,运动估计与补偿等) ●变换编码(例如傅立叶变换,哈达玛变换,KL变换,离散余弦变换, 离散小波变换等) ·熵编码(例如算术编码,霍夫曼编码,游程编码) ▣第二类方法基于人眼视觉特性 ●方向滤波编码 ●面向轮廓一纹理特征的编码 口第三类方法基于图像内容特征 ·分形编码 ·基于对象的编码 ◆后两类方法由于复杂度过高,技术尚未成熟等原因,仍 处于研究阶段。而第一类方法则得到不断地发展和融合, 形成了基于块的预测变换混合编码框架。 ynh.cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 视频编码的思路 现有编码技术可以分为三类 第一类方法基于图像统计特性 预测编码(例如帧内预测,运动估计与补偿等) 变换编码(例如傅立叶变换,哈达玛变换,KL变换,离散余弦变换, 离散小波变换等) 熵编码(例如算术编码,霍夫曼编码,游程编码) 第二类方法基于人眼视觉特性 方向滤波编码 面向轮廓一纹理特征的编码 第三类方法基于图像内容特征 分形编码 基于对象的编码 后两类方法由于复杂度过高,技术尚未成熟等原因,仍 处于研究阶段。而第一类方法则得到不断地发展和融合, 形成了基于块的预测/变换混合编码框架。 4
MC 问题的提出:视频与图像编码的差异 帧间冗余是最大的冗余 初 Frame 1 Frame 2 Frame 3 Frame 4 xh@ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 问题的提出:视频与图像编码的差异 帧间冗余是最大的冗余 5
KC视频编码器原理 JPEG common code words e.g.,DCT: shorter symbols spatial→frequency Huffman,arithmetic coding Frames of Motion Transform, Digital Video Estimation Quantization,Zig- Symbol & Zag Scan Run- Encoder Compensation Length Encoding Bit Stream predict current Quantization changes representation size for each symbol frame from previous >adjust rate/quality trade-off Run-length encoding. long runs of zeros>run-length symbol MPEG,H.26x (ynh,cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 视频编码器原理 6 Motion Estimation & Compensation Transform, Quantization, ZigZag Scan & RunLength Encoding Symbol Encoder Frames of Digital Video Bit Stream common code words shorter symbols Huffman, arithmetic coding e.g., DCT: spatial frequency Quantization changes representation size for each symbol adjust rate/quality trade-off Run-length encoding: long runs of zeros run-length symbol predict current frame from previous JPEG MPEG, H.26x