内容简介 STC 1956 2 语音识别 2.1 语音识别基本原理 2.2 语音识别系统结构 2.3 语音识别典型算法 2.4 说话人识别 电子科技大学信息与通信工程学院 山 2019/10/19
电子科技大学 宽带通信网络实验室 信息与通信工程学院 11 2019/10/19 内容简介 2 语音识别 2.1 语音识别基本原理 2.2 语音识别系统结构 2.3 语音识别典型算法 2.4 说话人识别
语音识别技术 1956 ·语音识别(speech recognition)技术,其目标 是以计算机自动将人类的语音内容转换为相应的 文字。 。 说话人识别及说话人确认技术更关注识别或确认 发出语音的说话人而非其中所包含的词汇内容。 0 语音识别技术的应用包括语音拨号、语音导航、 室内设备控制、语音文档检索、简单的听写数据 录入等。 电子科技大学信息与通信工程学院 12 2019/10/19
电子科技大学 宽带通信网络实验室 信息与通信工程学院 12 2019/10/19 语音识别技术 • 语音识别(speech recognition)技术,其目标 是以计算机自动将人类的语音内容转换为相应的 文字。 • 说话人识别及说话人确认技术更关注识别或确认 发出语音的说话人而非其中所包含的词汇内容。 • 语音识别技术的应用包括语音拨号、语音导航、 室内设备控制、语音文档检索、简单的听写数据 录入等
2.1语音识别基本原理 STC 1956 一个语音识别系统主要包括训练和识别两个阶段。 训练和识别都要先对输入语音进行预处理,然后再 进行特征提取。 输入语音 识别时 识别结果 预处理 特征提取 模式匹配 调练时 模型库 电子科技大学信息与通信工程学院 13 2019/10/19
电子科技大学 宽带通信网络实验室 信息与通信工程学院 13 2019/10/19 2.1语音识别基本原理 一个语音识别系统主要包括训练和识别两个阶段。 训练和识别都要先对输入语音进行预处理,然后再 进行特征提取
2.2语音识别系统架构 956 当前,主流的大词汇量语音识别系统多采用统计模式识别技术。 其系统由以下几个基本模块所构成: 信号处理及特征提取模块:该模块的主要任务是从输入信号中 提取特征,供声学模型处理。 声学模型:典型系统多采用基于一阶隐马尔科夫模型进行建模 发音词典:发音词典包含系统所能处理的词汇集及其发音。 语言模型:语言模型对系统所针对的语言进行建模。当前各种 系统普遍采用的还是基于统计的N元文法及其变体。 解码器:解码器是语音识别系统的核心之一,其任务是对输入 的信号根据声学、语言模型及词典,寻找能够以最大概率输出 该信号的词串。 电子科技大学信息与通信工程学院 14 2019/10/19
电子科技大学 宽带通信网络实验室 信息与通信工程学院 14 2019/10/19 2.2语音识别系统架构 当前,主流的大词汇量语音识别系统多采用统计模式识别技术。 其系统由以下几个基本模块所构成: 信号处理及特征提取模块:该模块的主要任务是从输入信号中 提取特征,供声学模型处理。 声学模型:典型系统多采用基于一阶隐马尔科夫模型进行建模。 发音词典:发音词典包含系统所能处理的词汇集及其发音。 语言模型:语言模型对系统所针对的语言进行建模。当前各种 系统普遍采用的还是基于统计的N元文法及其变体。 解码器:解码器是语音识别系统的核心之一,其任务是对输入 的信号根据声学、语言模型及词典,寻找能够以最大概率输出 该信号的词串
声学特征 1956 声学特征的提取与选择是语音识别的一个重要环节。这是一个 信息大幅度压缩和信号解卷的过程,目的是使模式划分器能更 好地划分。由于语音信号的时变特性,特征提取通常是在帧上 进行短时分析。 常用的一些声学特征有: a.线性预测系数(Linear Predictive Coefficient,LPC) b. 尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCCs) c. 感知线性预测(Perceptual Linear Predictive,PLP) 电子科技大学信息与通信工程学院 2019/10/19
电子科技大学 宽带通信网络实验室 信息与通信工程学院 15 2019/10/19 声学特征 声学特征的提取与选择是语音识别的一个重要环节。这是一个 信息大幅度压缩和信号解卷的过程,目的是使模式划分器能更 好地划分。由于语音信号的时变特性,特征提取通常是在帧上 进行短时分析。 常用的一些声学特征有: a. 线性预测系数(Linear Predictive Coefficient,LPC) b. 尔频率倒谱系数(Mel-Frequency Cepstral Coefficients, MFCCs) c. 感知线性预测(Perceptual Linear Predictive,PLP)