语音(音)编码简介 西安电子科技大学多媒体研究所 http://www.mti.xidian.edu.cn
XIDIAN 西安电子科技大学多媒体研究所 http://www.mti.xidian.edu.cn 语音(声音)编码简介
诺术所研第热点 ☆话音压缩编码( Speech Coding) 基于内容的音频检索技术 Content based Audio Retrieval ☆话音识别( Speech Recognition) ☆文本话音转换( Text To Speech)
话音技术的研究热点 ❖话音压缩编码(Speech Coding) ❖基于内容的音频检索技术(Contentbased Audio Retrieval ) ❖话音识别(Speech Recognition) ❖文本话音转换(Text To Speech)
衡量话音编码器的因素 ◇音频质量 令数据率 令编/解码延时 算法复杂度 价格因素
衡量话音编码器的因素 ❖音频质量 ❖数据率 ❖编/解码延时 ❖算法复杂度 ❖价格因素
话音编择码器的分类(1) 波形编译码器( waveform coder):不利用 生成话音的信号的任何知识,将话音视为一种普 通的声音,直接对波形信号进行采样和量化。例 如PCM、DPCM、 ADPCM等 令音源编译码器( Source coder):也叫参数编 译码器、声码器( vocoder)。它从话音波形信 号中提取生成话音的参数,使用这些参数通过话 音生成模型重构出话音。 令混合编译码器( Hybrid code):综合使用上 述两种技术。使用的激励信号波形尽可能接近于 原始话音信号的浪形。例如cELP
话音编译码器的分类(1) ❖ 波形编译码器(waveform coder):不利用 生成话音的信号的任何知识,将话音视为一种普 通的声音,直接对波形信号进行采样和量化。例 如PCM、DPCM、ADPCM等。 ❖ 音源编译码器(Source coder):也叫参数编 译码器、声码器(vocoder)。它从话音波形信 号中提取生成话音的参数,使用这些参数通过话 音生成模型重构出话音。 ❖ 混合编译码器(Hybrid coder):综合使用上 述两种技术。使用的激励信号波形尽可能接近于 原始话音信号的波形。例如CELP
话音编译码器的分类(2) 令基于音频数据的统计特性(波形编码) 令基于音频声学参数的编码(线性预测编码) 令基于人的听觉特性编码(掩蔽效应) ◆MPEG中高频编码 ◆ Dolby ac3
❖基于音频数据的统计特性(波形编码) ❖基于音频声学参数的编码(线性预测编码) ❖基于人的听觉特性编码(掩蔽效应) ◆MPEG中高频编码 ◆Dolby AC3 话音编译码器的分类(2)