MPEG基础和协议分析指南 初级读本 视频 编码器 +打包器视频 节目流节目流 音频 编码器 打包器音频 基本码流 传输流L单个节目 数据 图1-3 由于人耳的听力较为灵敏,音频压缩不象视频压缩那样为用于信号传输和数字广播,若干个节目及其相关的PEs 容易实现。当掩蔽和被掩蔽的声音信号在空间上重合时,可以经复用而成为一个单独的传输流。传输流不同于节 掩蔽效应才能真正发挥作用。在单声记录的情况下总是目流,在传输流中,PES包可以进一步分解为长度较短的 空间重合,但在立体声记录时却不是这样,在立体声记且字节数固定的数据包,也可以携带使用不同时钟的已 录中,如果低电平信号处于该记录声音的不同部分,仍编码的多个节目。这是可以实现的,因为传输流具有节 然可以听见低电平信号。因此,在立体声和环绕声系统目时钟基准(PCR)机制,它允许传送多个时钟,也可从中 中,对于某一给定的音频质量,应当采用较低的压缩因选择一个时钟并在解码器中再生。单个节目传输码流 子。音频压缩较为复杂的另一因素是不良扬声器的延迟,(PTS)同样是可能的,它可存在于编码器和复用器之间 它实际上掩蔽了压缩失真。使用不良扬声器来测试压缩由于传输流能够使解码器时钟与编码器时钟相锁定,因 器,则会给出不真实的结果,那种在测试时感到满意的此SPTS比节目码流更为通用 信号,在用好设备测试时却并不令人满意 传输流不只是音频和视频PES的复用,除了已压缩的音 频、视频和数据外,传输流中还含有用于描述该比特流 1.7MPEG码流 单个MPEG音频或视频编码器的输出是基本码流。基本码 的亚数据。在亚数据中,包括有节目关联表PAT),它列 出了该传输流中的每一套节目。PAT中的每一项均指向 流是一种无限接近的实时信号。为方便使用,可以将基个节目映像表PMT,它列出了组成每套节目的各个基本 本码流分解为长度可以改变的数据包,形成打包的基本 包的起始处,数据包还需要右码流。某些节目是开放式的,但是有一些节目是用于条 件接收(加密)的,这些信息也包含在亚数据中。 包头信息,并应包含有时间标记,因为打包破坏了时间 轴的连续性 传输流由长度固定的传输流包所组成,每个传输流包中 图13表示的是一个视频PES和几个音频PES经复用后形含有188个字节。每个传输流包均携带有一个节目识别码 成一个节目流,所有的编码器均锁相于一个共有的时钟 (PID)。同一基本码流中的所有传输流包,均具有相同的 PD,这样解码器(或解复用器)就可以选择它所需要的 各PES的时间标记用于确保视音频间的唇音同步。节目基本码流,同时排斥其它基本码流。传输流包应能连续 流具有长度可变的数据包和包头。节目流用于光盘和硬 计数,这样,就能保证在被解码的码流中,其中的传输包 盘间的数据传输,码流中基本上无误码,可用于任意大均能被接收。为使解码器能正确识别每个包的起始处并 小数据量的数据文件。DVD使用节目流。 能将比特流转换为码字,需要一个有效的同步系统 Owww.tektronix.com/video_audio
MPEG 基础和协议分析指南 初级读本 由于人耳的听力较为灵敏,音频压缩不象视频压缩那样 容易实现。当掩蔽和被掩蔽的声音信号在空间上重合时, 掩蔽效应才能真正发挥作用。在单声记录的情况下总是 空间重合,但在立体声记录时却不是这样,在立体声记 录中,如果低电平信号处于该记录声音的不同部分,仍 然可以听见低电平信号。因此,在立体声和环绕声系统 中,对于某一给定的音频质量,应当采用较低的压缩因 子。音频压缩较为复杂的另一因素是不良扬声器的延迟, 它实际上掩蔽了压缩失真。使用不良扬声器来测试压缩 器,则会给出不真实的结果,那种在测试时感到满意的 信号,在用好设备测试时却并不令人满意。 1.7 MPEG 码流 单个MPEG音频或视频编码器的输出是基本码流。基本码 流是一种无限接近的实时信号。为方便使用,可以将基 本码流分解为长度可以改变的数据包,形成打包的基本 码流(PES)。为了识别数据包的起始处,数据包还需要有 包头信息,并应包含有时间标记,因为打包破坏了时间 轴的连续性。 图1-3表示的是一个视频PES和几个音频PES经复用后形 成一个节目流,所有的编码器均锁相于一个共有的时钟。 各 PES 的时间标记用于确保视音频间的唇音同步。节目 流具有长度可变的数据包和包头。节目流用于光盘和硬 盘间的数据传输,码流中基本上无误码,可用于任意大 小数据量的数据文件。DVD 使用节目流。 图 1-3 为用于信号传输和数字广播,若干个节目及其相关的PES 可以经复用而成为一个单独的传输流。传输流不同于节 目流,在传输流中,PES包可以进一步分解为长度较短的 且字节数固定的数据包,也可以携带使用不同时钟的已 编码的多个节目。这是可以实现的,因为传输流具有节 目时钟基准(PCR)机制,它允许传送多个时钟,也可从中 选择一个时钟并在解码器中再生。单个节目传输码流 (SPTS)同样是可能的,它可存在于编码器和复用器之间。 由于传输流能够使解码器时钟与编码器时钟相锁定,因 此 SPTS 比节目码流更为通用。 传输流不只是音频和视频 PES 的复用,除了已压缩的音 频、视频和数据外,传输流中还含有用于描述该比特流 的亚数据。在亚数据中,包括有节目关联表(PAT),它列 出了该传输流中的每一套节目。PAT中的每一项均指向一 个节目映像表(PMT),它列出了组成每套节目的各个基本 码流。某些节目是开放式的,但是有一些节目是用于条 件接收(加密)的,这些信息也包含在亚数据中。 传输流由长度固定的传输流包所组成,每个传输流包中 含有188个字节。每个传输流包均携带有一个节目识别码 (PID)。同一基本码流中的所有传输流包,均具有相同的 PID,这样解码器(或解复用器)就可以选择它所需要的 基本码流,同时排斥其它基本码流。传输流包应能连续 计数,这样,就能保证在被解码的码流中,其中的传输包 均能被接收。为使解码器能正确识别每个包的起始处并 能将比特流转换为码字,需要一个有效的同步系统。 6 www.tektronix.com/video_audio 视频 数据 音频 数据 视 频 编码器 音 频 编码器 打包器 打包器 基本码流 视频 PES 音频 PES 节目流 节目流 (DVD) 传输流 单个节目 传输流 数据
MPEG基础和协议分析指南 初级读本 1.8监视和分析的必要性 1.9压缩带来的问题 EG传输流有着非常复杂的结构,它通过链接表和包识MPEG压缩是有损压缩,因此,被解码的内容与原始的信 别码来分离节目以及节目中的基本码流。在每个基本码号内容是有区别的。源信号的熵是变化的,当熵变高时, 流中,同样有着复杂的结构,需要用解码器来区分如矢MPEG系统在解码时可能会出现人眼可以发现的失真。在 量、系数和量化表等 时间域压缩中,我们假设连续画面之间是有冗余的时间 传输故障可以划分为两大类。在第一类中,传输系统能域压缩是基于连续画面的相似性,如果实际情况不是这 够正确地将信息由某一编码器/复用器传送至解码器,既样,即它们之间没有冗余,系统就会出现失真。例如,在 没有比特错误也没有传输中的附加抖动,但是编码器/复新闻发布会上,当闪光灯闪烁时,包含闪烁的单个画面 用器或解码器却有故障。在第二类故障中,编码器/复用完全不同于其相邻画面,这时,编码失真就会十分明显。 器和解码器均无问题,但数据从一端至另一端的传输过如果屏幕上出现无规则的运动,或者有几个不相关的运 程中却有问题。如果要使问题得到迅速的解决,那么,判动对象,在进行编码处理时就需要大量的矢量带宽,为 断故障是在编码器/复用器中,或是在传输过程中 此,需要降低图象数据的可用带宽,才能满足这一要求。 在解码器中,这就显得十分重要了。 此外,所产生的可见失真产物,其电平也是变化的,并与 传输中的同步问题如同步的丢失或其结构的破坏,均可运动相关。这种现象通常发生在体育节目中 能影响到整个传输流的接收。传输流协议中的缺陷,可量化的精度不高会造成亮度轮廓失真和彩色斑点,看起 能会妨碍解码器去寻找节目中的所有数据,也许产生只来就象是有污点的影象或者大片彩色区上的块状。就人 传送声音而不传送图象的故障。如果传送的数据虽然正的主观感觉而言,压缩失真比由模拟电视传输系统所造 确但抖动太大,也会引起解码器的定时问题。 成的相对固定的图象损伤更令人讨厌。 如以上所述,MPEG传输系统失效,故障可能在编码器,解决上述问题的唯一途径是降低压缩因子。这样,当人 也可能在复用器或解码器。那么,怎样来判断故障呢?们在使用压缩技术时,就不得不在高压缩因子的经济性 首先,应当检查传输流是否符合MPEG编码标准。如果该和它带来的失真度之间作出有价值的判断。 码流不符合标准,就不能说是解码器的问题。如果码流 时间域编码除了会增加编码和解码的延迟之外,它还给 符合标准,那就要怀疑解码器了。 图象的编辑造成了困难。事实上,MPEG数据流是不能够 传统的视频测试工具,如信号发生器、波形监视器和矢任意编辑的。所以有这种限制,是因为在时间域编码中 量仪,它们在分析MPEG系统时并不适用,除非是将它们对某一画面的解码可能需要早先的画面内容,而这早先 用来检査MPEG系统的输入信号或输出信号是否正常。在的画面内容在编辑完成后可能就没法获得了。还有,在 MPEG系统中使用的测试工具应当是:例如一种可靠的、MPEG中,不一定是按照实际图象出现的先后顺序来发送 能产生有效MPEG测试信号的信号源,它是测试接收设备图象,这将使编辑更为复杂 和解码器的基本仪器。还应当使用合适的分析仪来评估 如果采用合适的编码技术,还是可以编辑图象的。不过 编码器、传输系统、复用器和再复用器的性能,这样才 这只能在间隔较宽的接合处进行。如果需要任意编辑,那 具有较高的置信度。作为视频行业高级测试设备的长期么,只能让MPEG码流经历解码一修改一记录这一过程, 供应商,泰克公司能够适应技术的发展不断地推出新的 当然,这会造成信号质量的下降 测试和测量解决方案,从而使MPEG用户确信,即便是复 杂的压缩系统也能实现正常运行,当系统出现问题时,能 够迅速地予以解决 ww tektronix. com/video_ audio
MPEG 基础和协议分析指南 初级读本 1.8 监视和分析的必要性 MPEG传输流有着非常复杂的结构,它通过链接表和包识 别码来分离节目以及节目中的基本码流。在每个基本码 流中,同样有着复杂的结构,需要用解码器来区分如矢 量、系数和量化表等。 传输故障可以划分为两大类。在第一类中,传输系统能 够正确地将信息由某一编码器/复用器传送至解码器,既 没有比特错误也没有传输中的附加抖动,但是编码器/复 用器或解码器却有故障。在第二类故障中,编码器/复用 器和解码器均无问题,但数据从一端至另一端的传输过 程中却有问题。如果要使问题得到迅速的解决,那么,判 断故障是在编码器/复用器中,或是在传输过程中,或是 在解码器中,这就显得十分重要了。 传输中的同步问题如同步的丢失或其结构的破坏,均可 能影响到整个传输流的接收。传输流协议中的缺陷,可 能会妨碍解码器去寻找节目中的所有数据,也许产生只 传送声音而不传送图象的故障。如果传送的数据虽然正 确但抖动太大,也会引起解码器的定时问题。 如以上所述,MPEG 传输系统失效,故障可能在编码器, 也可能在复用器或解码器。那么,怎样来判断故障呢? 首先,应当检查传输流是否符合MPEG编码标准。如果该 码流不符合标准,就不能说是解码器的问题。如果码流 符合标准,那就要怀疑解码器了。 传统的视频测试工具,如信号发生器、波形监视器和矢 量仪,它们在分析MPEG系统时并不适用,除非是将它们 用来检查MPEG系统的输入信号或输出信号是否正常。在 MPEG 系统中使用的测试工具应当是:例如一种可靠的、 能产生有效MPEG测试信号的信号源,它是测试接收设备 和解码器的基本仪器。还应当使用合适的分析仪来评估 编码器、传输系统、复用器和再复用器的性能,这样才 具有较高的置信度。作为视频行业高级测试设备的长期 供应商,泰克公司能够适应技术的发展不断地推出新的 测试和测量解决方案,从而使MPEG用户确信,即便是复 杂的压缩系统也能实现正常运行,当系统出现问题时,能 够迅速地予以解决。 1.9 压缩带来的问题 MPEG压缩是有损压缩,因此,被解码的内容与原始的信 号内容是有区别的。源信号的熵是变化的,当熵变高时, MPEG系统在解码时可能会出现人眼可以发现的失真。在 时间域压缩中,我们假设连续画面之间是有冗余的(时间 域压缩是基于连续画面的相似性),如果实际情况不是这 样,即它们之间没有冗余,系统就会出现失真。例如,在 新闻发布会上,当闪光灯闪烁时,包含闪烁的单个画面 完全不同于其相邻画面,这时,编码失真就会十分明显。 如果屏幕上出现无规则的运动,或者有几个不相关的运 动对象,在进行编码处理时就需要大量的矢量带宽,为 此,需要降低图象数据的可用带宽,才能满足这一要求。 此外,所产生的可见失真产物,其电平也是变化的,并与 运动相关。这种现象通常发生在体育节目中。 量化的精度不高会造成亮度轮廓失真和彩色斑点,看起 来就象是有污点的影象或者大片彩色区上的块状。就人 的主观感觉而言,压缩失真比由模拟电视传输系统所造 成的相对固定的图象损伤更令人讨厌。 解决上述问题的唯一途径是降低压缩因子。这样,当人 们在使用压缩技术时,就不得不在高压缩因子的经济性 和它带来的失真度之间作出有价值的判断。 时间域编码除了会增加编码和解码的延迟之外,它还给 图象的编辑造成了困难。事实上,MPEG数据流是不能够 任意编辑的。所以有这种限制,是因为在时间域编码中, 对某一画面的解码可能需要早先的画面内容,而这早先 的画面内容在编辑完成后可能就没法获得了。还有,在 MPEG中,不一定是按照实际图象出现的先后顺序来发送 图象,这将使编辑更为复杂。 如果采用合适的编码技术,还是可以编辑图象的。不过 这只能在间隔较宽的接合处进行。如果需要任意编辑,那 么,只能让MPEG 码流经历解码-修改-记录这一过程, 当然,这会造成信号质量的下降。 www.tektronix.com/video_audio 7
MPEG基础和协议分析指南 初级读本 第二章视频压缩 输入波形 频率不同 基本函 无相关性 数波形 输入波形√八八八U 高相关性 图2-1 本章将介绍基于人眼感知的视频压缩技术。对于视频压2.2空间域编码 缩中的重要部分,如变换和运动补偿,将作为MPEG编码空间域编码的第一步是通过变换以对空间域频率进行分 器的结构予以介绍 析。所谓变换,简而言之,就是波形在不同域中的表示方 法,在这里指的是频率域。频率变换的输出中含有一系 2.1是空间域编码还是时间域编码? 列系数,这些系数用来描述当前有多少个频率。通过反 正如第一章所述,视频压缩技术利用了图象的空间性冗变换就可将原始波形复原。只要在处理这些系数时具有 余和时间性冗余的特点。在MPEG中,首先是利用连续画足够高的精度,那么反变换后的输出就应与原始波形相 面之间的相似性来降低时间性冗余,具体作法是尽可能同。 多地利用已经发送的图象信息以生成或“预测”当前图 最著名的变换是付立叶变换。通过付立叶变换可以找出 象。在使用这项技术时,只需要发送差值图象,就可以 输入信号中的每一频率。在付立叶变换中,将输入波形 消除实际图象与预测图象之间的差异。而差值图象又需(函数)与某一目标频率的样值(可称为基本函数)相乘, 经过空间域压缩。从实用考虑,在解释时间压缩之前先 然后对该乘积求积分,这样就可找出每一个频率。由图 解释空间域压缩要容易些。 2-1可见,当输入波形不包含目标频率时,则积分值为零; 空间域压缩是依赖于图象大块区域中相邻象素间的相似但如果输入波形中包含该频率,则所求得的积分值就是 性和图案区的主要空间域频率。JPEG系统只使用了空间描述该分量频率的幅度系数。 域压缩,因为它是为传输单个静止图象而设计的。不过 在输入信号中,如果频率分量与基本函数同相,则得出 JPEG也可对连续的单个图象编码以用于视频。不过,在 该频率的幅度系数:如果频率分量与基本函数正交,则 所谓的“运动JPEG”应用中,与时间域编码应用相比较 积分值仍然为零。因此,有必要采用这样的方法:利用相 不会有那样高的压缩因子。尽管如此,由运动PEG生成互正交的基本函数,对输入信号的每一频率搜索两次,以 的比特流,却可以用作基于逐个画面的自由编辑。 检测输入信号中的每一频率的相位。 (ww. tektronix. com/video_audio
MPEG 基础和协议分析指南 初级读本 第二章 视频压缩 图 2-1 本章将介绍基于人眼感知的视频压缩技术。对于视频压 缩中的重要部分,如变换和运动补偿,将作为MPEG编码 器的结构予以介绍。 2.1 是空间域编码还是时间域编码? 正如第一章所述,视频压缩技术利用了图象的空间性冗 余和时间性冗余的特点。在MPEG中,首先是利用连续画 面之间的相似性来降低时间性冗余,具体作法是尽可能 多地利用已经发送的图象信息以生成或“预测”当前图 象。在使用这项技术时,只需要发送差值图象,就可以 消除实际图象与预测图象之间的差异。而差值图象又需 经过空间域压缩。从实用考虑,在解释时间压缩之前先 解释空间域压缩要容易些。 空间域压缩是依赖于图象大块区域中相邻象素间的相似 性和图案区的主要空间域频率。JPEG系统只使用了空间 域压缩,因为它是为传输单个静止图象而设计的。不过, JPEG也可对连续的单个图象编码以用于视频。不过,在 所谓的“运动JPEG”应用中,与时间域编码应用相比较, 不会有那样高的压缩因子。尽管如此,由运动JPEG生成 的比特流,却可以用作基于逐个画面的自由编辑。 2.2 空间域编码 空间域编码的第一步是通过变换以对空间域频率进行分 析。所谓变换,简而言之,就是波形在不同域中的表示方 法,在这里指的是频率域。频率变换的输出中含有一系 列系数,这些系数用来描述当前有多少个频率。通过反 变换就可将原始波形复原。只要在处理这些系数时具有 足够高的精度,那么反变换后的输出就应与原始波形相 同。 最著名的变换是付立叶变换。通过付立叶变换可以找出 输入信号中的每一频率。在付立叶变换中,将输入波形 (函数)与某一目标频率的样值(可称为基本函数)相乘, 然后对该乘积求积分,这样就可找出每一个频率。由图 2-1可见,当输入波形不包含目标频率时,则积分值为零; 但如果输入波形中包含该频率,则所求得的积分值就是 描述该分量频率的幅度系数。 在输入信号中,如果频率分量与基本函数同相,则得出 该频率的幅度系数;如果频率分量与基本函数正交,则 积分值仍然为零。因此,有必要采用这样的方法:利用相 互正交的基本函数,对输入信号的每一频率搜索两次,以 检测输入信号中的每一频率的相位。 8 www.tektronix.com/video_audio 输入波形 基本函 数波形 输入波形 基本函 数波形 频率不同 无相关性 频率相同 高相关性
MPEG基础和协议分析指南 初级读本 镜面 正弦分量 镜面处反相一抵消 弦分量 相干通过镜面 图22 付立叶变换有一个缺点,它需要每一频率的正弦和余弦图23表示的是一个8×8DCT块中各个系数的反变换结 分量系数。在余弦变换中,输入波形在乘以基本函数之果。在亮度信号的情况下,左上方的系数是整个像素块 前与其自身在时间上是呈镜象的。如图22所示,镜面处的平均亮度或DC分量。沿着象素块的上方箭头移动时 的相干效应消除了所有的正弦分量而使所有的余弦分量水平空间频率增加:沿着左列箭头移动时,垂直空间频 加倍。因此,正弦基本函数是不必要的,每一频率只需率增加。在实际图象中,会同时出现不同的垂直空间频 要一个系数。 率和水平空间频率,DCT块中的某点系数代表着所有可 离散余弦变换CT)与余弦变换有着某些相似之处,它广能的水平频率和垂直频率的组合。 泛用于MPEG的两维形式。它将图象中的一个8×8的象图2-3也表示了一维水平波形的8个系数。将这些波形与 素块变换为一个8×8系数块。由于在变换为系数块的过各个不同的系数幅度及任一极性组合在一起,就能再现8 程中,需要乘以分式,这就使得系数具有的字长要超过个象素的任意组合。因此,2维DCT的64个系数的组合, 象素样值的字长。一般而言,一个8比特的象素样值会产可以产生原始的8×8象素块。很明显,对于彩色图象, 生一个11比特的系数值。表面上看来,DCT不具备任何也需要对色差样值进行处理。将Y、Cυ、C组合成单独的 压缩作用。但实际上恰相反,DCT可以将信源象素转换为8×8阵列,然后各自独立地进行DCT变换。 便于压缩的形式 3交数 水平空间 频率波形 图23 wwtektronix. com/video_audio
MPEG 基础和协议分析指南 初级读本 图 2-2 付立叶变换有一个缺点,它需要每一频率的正弦和余弦 分量系数。在余弦变换中,输入波形在乘以基本函数之 前与其自身在时间上是呈镜象的。如图2-2所示,镜面处 的相干效应消除了所有的正弦分量而使所有的余弦分量 加倍。因此,正弦基本函数是不必要的,每一频率只需 要一个系数。 离散余弦变换(DCT)与余弦变换有着某些相似之处,它广 泛用于MPEG的两维形式。它将图象中的一个8×8的象 素块变换为一个8×8系数块。由于在变换为系数块的过 程中,需要乘以分式,这就使得系数具有的字长要超过 象素样值的字长。一般而言,一个8比特的象素样值会产 生一个 11 比特的系数值。表面上看来,DCT 不具备任何 压缩作用。但实际上恰相反,DCT可以将信源象素转换为 便于压缩的形式。 图 2-3 图2-3表示的是一个8×8 DCT块中各个系数的反变换结 果。在亮度信号的情况下,左上方的系数是整个像素块 的平均亮度或 DC 分量。沿着象素块的上方箭头移动时, 水平空间频率增加;沿着左列箭头移动时,垂直空间频 率增加。在实际图象中,会同时出现不同的垂直空间频 率和水平空间频率,DCT 块中的某点系数代表着所有可 能的水平频率和垂直频率的组合。 图2-3也表示了一维水平波形的8个系数。将这些波形与 各个不同的系数幅度及任一极性组合在一起,就能再现8 个象素的任意组合。因此,2维DCT的64个系数的组合, 可以产生原始的 8 × 8 象素块。很明显,对于彩色图象, 也需要对色差样值进行处理。将Y、Cb、Cr组合成单独的 8 × 8 阵列,然后各自独立地进行 DCT 变换。 www.tektronix.com/video_audio 9 镜面 正弦分量 镜面处反相-抵消 分弦分量 相干通过镜面 水平空间 频率波形
MPEG基础和协议分析指南 初级读本 在大量的实际节目素材中,有许多DT系数均为零或接 因此,这些系数可不必传送。基于这一事实,在 进行压缩的情况下也不会造成实际图象 果需要更高的压缩因子 减少非零系数的字长。不 过,字长的缩短会降低这些系数的精度,从而带来处理人眼对 噪声的 过程中的损耗。如果仔细观察的话 够看出损耗 敏感度 对图象质量所产生的影响。 23加权 4表明,人眼对图象噪声的感受是空间频率的函数而 并非与频率无关。人们也许能够忍受较高空间频率处的 空间频率 噪声。还有,图象中的精密细节会有效地掩蔽视频噪声, 但在大片图象区的噪声就十分明显了读者可能知道,在·图24 传统的噪声测量中要按频率进行加权处理,其目的就是 使噪声的测量结果更接近于人眼的主观感受。 这样,代表较低空间频率的DCT系数用相对较小的步长 变换编码中的压缩降低了DCT系数的精度,它与PCM中来量化,噪声只有少量增加:代表较高空间频率的系数 的缩短样值字长有类似的效果,这就导致了噪声的提升。用较大的步长来量化,相应噪声增加较多。较小的量化 过,在PCM中,因字长的缩短而使噪声在所有频率上步长意味着只需用较少的比特位来区分该步长,由此就 都得到相同的提升。既然DCT是将信号分解在不同的频得到了压缩 率上,当然它也能控制噪声的频谱。实际的作法是,通在解码器中,在低位比特处添加零以使已加权的系数恢 过加权处理,能够有效地使低频系数的精度要优于高频复到其正确数值。然而这些系数应乘以加权因子的倒数。 系数的精度。 很明显,高频处的乘积因子较大,因此量化噪声也较大。 图25所示为一加权处理过程,DCT系数除以一个因子,在去加权处理后,系数将具有其原始的DC输出值和再 该因子是两维频率的函数,即因子的取值决定于频率的量化的误差较高频处的再量化误差也大于低频处的再量 高低。DCT的低频系数除以小因子,高频系数除以大因化误差 子。相除后的结果再去掉尾数,取其最接近的整数。这除了舍位法之外,也可对已加权系数采用非线性再量化 种舍位( truncation)过程是再量化的一种形式。如果不加处理,使量化步长的大小随系数的大小而增加。采用这 权,这种再量化处理将均匀地增加量化步长:;如果施以种技术可以得到更高的压缩因子,不过失真度也会相应 加权,将按照除数因子非均匀地增加量化步长 增加 十分明显,数据的压缩程度,或者说数据输出比特率,决 定于再量化的处理过程。不同的比特率需要不同的加权 表。在MPEG中,有可能使用各种不同的加权表,应将所 使用的加权表传送至解码器,以保证解码的正确性。 10www.tektronix.com/video_audio
MPEG 基础和协议分析指南 初级读本 在大量的实际节目素材中,有许多 DCT 系数均为零或接 近零值,因此,这些系数可不必传送。基于这一事实,在 进行压缩的情况下也不会造成实际图象质量的损伤。如 果需要更高的压缩因子,还可以减少非零系数的字长。不 过,字长的缩短会降低这些系数的精度,从而带来处理 过程中的损耗。如果仔细观察的话,也许能够看出损耗 对图象质量所产生的影响。 2.3 加权 图2-4表明,人眼对图象噪声的感受是空间频率的函数而 并非与频率无关。人们也许能够忍受较高空间频率处的 噪声。还有,图象中的精密细节会有效地掩蔽视频噪声, 但在大片图象区的噪声就十分明显了。读者可能知道,在 传统的噪声测量中要按频率进行加权处理,其目的就是 使噪声的测量结果更接近于人眼的主观感受。 变换编码中的压缩降低了DCT 系数的精度,它与PCM中 的缩短样值字长有类似的效果,这就导致了噪声的提升。 不过,在PCM 中,因字长的缩短而使噪声在所有频率上 都得到相同的提升。既然 DCT 是将信号分解在不同的频 率上,当然它也能控制噪声的频谱。实际的作法是,通 过加权处理,能够有效地使低频系数的精度要优于高频 系数的精度。 图 2-5 所示为一加权处理过程,DCT 系数除以一个因子, 该因子是两维频率的函数,即因子的取值决定于频率的 高低。DCT 的低频系数除以小因子,高频系数除以大因 子。相除后的结果再去掉尾数,取其最接近的整数。这 种舍位(truncation)过程是再量化的一种形式。如果不加 权,这种再量化处理将均匀地增加量化步长;如果施以 加权,将按照除数因子非均匀地增加量化步长。 图 2-4 这样,代表较低空间频率的 DCT 系数用相对较小的步长 来量化,噪声只有少量增加;代表较高空间频率的系数 用较大的步长来量化,相应噪声增加较多。较小的量化 步长意味着只需用较少的比特位来区分该步长,由此就 得到了压缩。 在解码器中,在低位比特处添加零以使已加权的系数恢 复到其正确数值。然而这些系数应乘以加权因子的倒数。 很明显,高频处的乘积因子较大,因此量化噪声也较大。 在去加权处理后,系数将具有其原始的 DCT 输出值和再 量化的误差, 较高频处的再量化误差也大于低频处的再量 化误差。 除了舍位法之外,也可对已加权系数采用非线性再量化 处理,使量化步长的大小随系数的大小而增加。采用这 种技术可以得到更高的压缩因子,不过失真度也会相应 增加。 十分明显,数据的压缩程度,或者说数据输出比特率,决 定于再量化的处理过程。不同的比特率需要不同的加权 表。在MPEG中,有可能使用各种不同的加权表,应将所 使用的加权表传送至解码器,以保证解码的正确性。 10 www.tektronix.com/video_audio 人眼对 噪声的 敏感度 空间频率