KC第2章多媒体数据压缩国际标准 ◆2.1多媒体数据压缩编码的重要性和分类 ◆2.2常见数据压缩方法分类与基本原理 ◆2.3音频压缩标准 ▣2.3.1话音编码基础 ←话音信号的冗余 ▣2.3.2三种话音编码器 ▣2.3.3 PEG Audio ▣2.3.4移动通信网中的音频编码 ◆2.4静态图像压缩编码的国际标准 ◆2.5视频压缩的国际标准 ◆2.6可伸缩性编码和分布式编码 ynh.cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 第2章 多媒体数据压缩国际标准 2.1 多媒体数据压缩编码的重要性和分类 2.2 常见数据压缩方法分类与基本原理 2.3 音频压缩标准 2.3.1 话音编码基础 2.3.2 三种话音编码器 2.3.3 MPEG Audio 2.3.4 移动通信网中的音频编码 2.4 静态图像压缩编码的国际标准 2.5 视频压缩的国际标准 2.6 可伸缩性编码和分布式编码 11 话音信号的冗余
KC音频信号的冗余 ◆时域信息的冗余度 口幅度的非均匀分布、样本间的相关、周期之间的相关、 基音之间的相关、静音系数、长时自相关函数 ◆频域信息的冗余度 口非均匀的长时功率谱密度 口语音特有的短时功率谱密度 ◆人的听觉感知机理 ▣在“MPEG Audio”小节展开 12 ynh.cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 音频信号的冗余 时域信息的冗余度 幅度的非均匀分布、样本间的相关 、周期之间的相关、 基音之间的相关 、静音系数 、长时自相关函数 频域信息的冗余度 非均匀的长时功率谱密度 语音特有的短时功率谱密度 人的听觉感知机理 在“MPEG Audio”小节展开 12
KC(1)幅度的非均匀分布 ◆统计表明,语音中的小幅度样本比大幅度样本出现 的概率要高。 ◆由于通话中会有间隙,出现了大量的低电平样本。 ◆实际讲话信号功率电平也趋向于出现在编码范围的 较低电平端 88x 86x 长时话音的振幅分布 1 ycAu;wustc.edu.cn
{ynh,cxh}@ustc.edu.cn (1)幅度的非均匀分布 统计表明,语音中的小幅度样本比大幅度样本出现 的概率要高。 由于通话中会有间隙,出现了大量的低电平样本。 实际讲话信号功率电平也趋向于出现在编码范围的 较低电平端。 13
KC(2)样本间的相关 ◆对语音波形的分析表明,取样数据的最大相关性 存在于邻近样本之间 ◆当取样频率为8kHz时,相邻取样值间的相关系数 大于0.85;甚至在相距10个样本之间,还可有0.3左 右的数量级。如果取样速率提高,样本间的相关性 将更强 。 smpl 20000 5000 000 20000 30000 14 ynh.cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn (2)样本间的相关 对语音波形的分析表明,取样数据的最大相关性 存在于邻近样本之间。 当取样频率为8kHz时,相邻取样值间的相关系数 大于0.85;甚至在相距10个样本之间,还可有0.3左 右的数量级。如果取样速率提高,样本间的相关性 将更强。 14
MC (3)周期之间的相关 ◆】 当声音中只存在少数几个频率时,就会像某些振 荡波形一样,在周期与周期之间,存在着一定的相 关性。 ◆利用语音周期之间信息冗余度的编码器,比仅仅 只利用邻近样本间的相关性的编码器效果要好,但 要复杂得多。 60.9 1000 1620 530 <Z4J-F3ow 80.125 2043.2 3996.2 fHz 不光话音,很多音源发 20a00mT50短1000M1250每1300a170证200:2250加 FREQUENCY 出的声音具有上述特性
{ynh,cxh}@ustc.edu.cn (3)周期之间的相关 当声音中只存在少数几个频率时,就会像某些振 荡波形一样,在周期与周期之间,存在着一定的相 关性。 利用语音周期之间信息冗余度的编码器,比仅仅 只利用邻近样本间的相关性的编码器效果要好,但 要复杂得多。 15 不光话音,很多音源发 出的声音具有上述特性