KC(4)基音之间的相关 4000 ◆第一类称为浊音 3000 (voiced sound),一种 2000 准周期脉冲激励所发出的 1000 音。浊音表现在音节上有 高度的周期性,其值在2 20ms之间,这个周期性称 1000 200 为长期周期性。 2000 400 3000 600 ◆第二类称为清音 4000 800 10 (unvoiced sound),由 15 20 25 30 0 10 15 20 的 30 时间(ms) 时间(s) 不稳定气流激励所产生的, 这种气流是在声门处打开 状态下强制空气在声道里 80 高速收缩产生的。 70 40 ◆第三类称为爆破音 (plosive sound),它是在 50 (gp)asa 40 00 声道关闭之后产生的压缩 空气然后打开声道所发出 30 0 的音。 20 10 10 0 05001000150020002500300035004000 5001000150020002500300035004000 频) 频z) 16 ynh.cxh @ustc.edu.cn
{ynh,cxh}@ustc.edu.cn (4)基音之间的相关 第一类称为浊音 (voiced sound),一种 准周期脉冲激励所发出的 音。浊音表现在音节上有 高度的周期性,其值在2- 20ms之间,这个周期性称 为长期周期性。 第二类称为清音 (unvoiced sound),由 不稳定气流激励所产生的, 这种气流是在声门处打开 状态下强制空气在声道里 高速收缩产生的。 第三类称为爆破音 (plosive sound),它是在 声道关闭之后产生的压缩 空气然后打开声道所发出 的音。 16
K心基音之间的相关举例 元音:周期性 摩擦音:非周期性 “has” “vatch'" 0.1 0.05 - 0 0. -0.05 1.38 1.4 1.42 1.88 1.9 .92 0.2 0.1 0.2 1.4 1.6 1.8 22 2.4 2.6 time/s has a watch as a dime 0.1 0.02 0¥ wnwAii 0 -0.02 -0.1 1.52 1.54 1.56 1.58 2.42 2.44 2.46 2.48 滑音:平滑过渡 17 爆破音:过渡 @ustc.edu.cn “vatch' “dime
{ynh,cxh}@ustc.edu.cn 基音之间的相关举例 17
KC(5)静止系数 ◆ 两个人之间打电话,平均每人的讲话时间为通话 总时间的一半,另一半时间听对方讲。听的时候 般不讲话,而即使是在讲话的时候,也会出现字、 词、句之间的停顿。 ◆通过分析表明,话音间隙使得全双工话路的典型 效率约为通话时间的40%(或静正系数为0.6)。 然活育间隔本身就是。种云余,芳能正确检测出 该静止段,便可“插空”传输更多的信息 纳 0.5 1.0 男声“Every salt breeze comes from the sea” 2.0 ynh.cxh@ustc.edu.cn
{ynh,cxh}@ustc.edu.cn (5)静止系数 两个人之间打电话,平均每人的讲话时间为通话 总时间的一半,另一半时间听对方讲。听的时候一 般不讲话,而即使是在讲话的时候,也会出现字、 词、句之间的停顿。 通过分析表明,话音间隙使得全双工话路的典型 效率约为通话时间的40%(或静止系数为0.6)。显 然,话音间隔本身就是一种冗余,若能正确检测出 该静止段,便可“插空”传输更多的信息。 18 男声“Every salt breeze comes from the sea
KC(6)长时自相关函数 ◆上述样本、周期间的一些相关性,都是在20ms时间 的间隔内进行统计的所谓短时自相关。如果在较长的 时间间隔(比如几十秒)进行统计,便得到长时自相 关函数。 ◆长时统计表明,8kHz的取样语音的相邻样本间,平 均相关系数高达0.9。 SRD---short Range dependent LRD---long Range dependent 19 ynh.cxh@ustc.edu.cn
{ynh,cxh}@ustc.edu.cn (6)长时自相关函数 上述样本、周期间的一些相关性,都是在20ms时间 的间隔内进行统计的所谓短时自相关。如果在较长的 时间间隔(比如几十秒)进行统计,便得到长时自相 关函数。 长时统计表明,8kHz的取样语音的相邻样本间,平 均相关系数高达0.9。 SRD---short Range dependent LRD---long Range dependent 19
MC频域信息的冗余度:长时功率谱特性 ◆非均匀的长时功率谱密度 ▣在相当长的时间间隔内进行统计平均, 得到长时功率 谱密度函数,其功率谱皇现强的非平坦性 口从统计的观点看,这意味着没有充分利用给定的频段, 或者说有着固有的冗余度。 口特别地,功率谱的高频能量较低,这恰好对应于时域上 相邻样本间的相关性。 Frequency Analysis ☒ Linear View Hod团2a图 dB 0--108 dB 5000 I0000 15000 20000H2 =81.545HzE2-18),R=80.87Hz Area (Right on top] Advanced ynh.cxh@ustc.edu.cn
{ynh,cxh}@ustc.edu.cn 频域信息的冗余度:长时功率谱特性 非均匀的长时功率谱密度 在相当长的时间间隔内进行统计平均,可得到长时功率 谱密度函数,其功率谱呈现强的非平坦性。 从统计的观点看,这意味着没有充分利用给定的频段, 或者说有着固有的冗余度。 特别地,功率谱的高频能量较低,这恰好对应于时域上 相邻样本间的相关性。 20