[例2.1]假设Vmoe=1,采样精度为1位表示Vsnal=21.它的信噪比SNR=6dB。【例2.2]假设Vm=1.采样精度为16位表示Vsal=26,它的信噪比SNR=96dB2.2.6声音质量与数据率根据声音的频带,通常把声音的质量分成5个等级,由低到高分别是电话(1elephone)、调辐(amptitudemodulation,AM)广播、调频(freguencymodulation,FM)、光盘(conpactdisc.CD)和数字录音带(digitalaudiotape.DAT)的声音。在这5个等级中,使用的采样频率、样本精度、通道数和数据率列于表2-1。表2-1声音质量和数据率质卧采样频率:kHz样本精度·b/s单道声立体声数据率(未压缩)/kb/颗率范用/Hz8电话:864.0单道声200~3400AM11.0258单道卢88.250~7000FM1622.050立体内705.620~15000()44.116立体市1411,220~20000DAT4816立体声1536.020~20000说明:*电话使用律编码.动态范围为13位、而不是8位(详见第3章)。2.3声音文件的存储格式如同存储文本文件一样,存储声音数据也需要有存储格式。在因特网上和各种机器工:运行的声音文件格式很多,但目前比较流行的有以.wav(waveform),au(audio),.aiff(audio)interchangeablefileformat)和.snd(sound)为扩展名的文件格式。wav格式主要用在PC机上.,au主要用在Unix工作站上.aiff和snd主要用在苹果机和美国视算科技有限公司(SiliconGraphics,Inc.,SGI)的L作站上。用.wav为扩展名的文件格式称为波形文件格式(wavefileformat),它在多媒体编程接口和数据规范1.0(MultimediaProgrammingInterfaceandDataSpecifications1,0)文档中有详细的描述。该文档是由II3M和微软公司F1991年8月联合开发的,它是一种为交换多媒体资源而开发的资源交换文件格式(resourceinterchangefileformat,RIFF)。波形文件格式支持存储各种采样频率和样本精度的声音数据,并支持声音数据的压缩,波形文件由许多不同类型的文件构造块组成,其中最主要的两个文件构造块是formatchunk(格式块)和soundgTOUpID-"RIFF'riff Type-'WAVE"datarhunk(声音数据块)。格式块包含有描述波形的重Form at Chunk要参数,例如采样频率和样本精度等,声音数据块则包含ck 11='fmt'有实际的波形声音数据。RIFF中的其他文件块是可选择的。它的简化结构如图2-3所示。Sound Datd ChunkcklD)-'data如果读者需要非常深入和详细的文件格式的资料,请参看参考文献[2]。此外,为便于读者辨认文件的属性,表2-2列出了部分声音文件的后缀。图2-3WAVE文件结构. 11SA
T1轰2-2常见的声音文件扩展名说明文件的扩展名Sun和NeXT公司的声音文件存储格式(8位μ律编码或者16位线性编码)auApple计算机上的声音文件存储格式aif(Audio Interchange声(SB)卡带的MIDI文件存储格式cmf(Creative Music Format)!!MIDI文件存储格式mct1mff(MIDI Files Format)MIDI文件存储格式1/2Windows的MIDI文件存储格式mid(MIDI)1MPEG Layer I,mp2MPEG Layer mp31MIDI文件存储格式mod(Module)RealNetworks公司的流放式声音文件格式rm(RealMedia)RealNetworks公司的流放式声音文件格式ra(RealAudio)11rolAdlib南音卡文件存储格式1snd(sound)Apple计算机上的声音文件存储格式?MIDI文件存储格式sey)MIDI文件存储格式sng1声霸卡存储的声音文件存储格式voc(Creative Voice)+.Windows采用的波形声音文件存储格式wav(Waveform)*?CakewalkPro软件采用的MIDI文件存储格式wrk说明:*支持PCM,ADPCM.μ率和A率波形(详见第3章)。7-12.4声音工具声音工具(audio tools)用来录放、编辑和分析声音文件。声音工具使用得相当普遍,但它们的功能相差很大。下面列出了比较常见的几种工具。1.Windows 95/98本身带的“Sound Recorder"1当你在英文版Windows95/98的界面上单击:-Start-Programs-Accessories-+Multimedia/Entertainment-单击SoundRecorder之rh后就调出如图2-4所示的窗口。使用它可录音,作简单的声音编辑(如插入、谢除等)。图国区Adios.waySound RecorderEile Edr Effecle Help.LengthePostiont0.63s0c0.63ec:11Windows的录音器图2-4.12
2.买声音卡时带的工具如果你的计算机安装有声音卡,一般来说都附带有声音工具。例如,声霸(SoundBlaster)卡带有几种声音工具,通常要由用户自已安装。其中,功能比较强的是WaveStudio.它的用户界面如图2-5所尔,区RCreativeWaveStudio-[Goodmtng.way]PEleEdtYiowSpeodl Audio Dplione WndowHeb区D国eOt7923KBueNLM图25CreativeWaveStndtoVersion4.uu的用户界面3,网络上下载的工具因特网上有许多站点提供试用的或者是免费的声音工具。图26所示的就是从[371下载供试用的CoolEdit工具,它很受声音研究T作者的欢迎。类似的.具还有goldwave公司的卢音工具,参见[5]。coolau.l-CoolEd周口区hsEdtVieToanofoimGenelateAnsyeeDptiontH国国B2050/16bt/SterelOOT51193SamplesEn0Record0图2-6CoolEdit96的用户界值13
2.5声音质量的度量声音质量的评价是一个很困难的问题,目前还在继续研究的课题。前面介绍了用声音信号的带宽来衡量声音的质量,等级由高到低依次是DAT.CD.FM,AM和数字电话。此外.声音质量的度量还有两种基本的方法:一种是客观质量度量,另一种是主观质量度量。评价语音质量时,有时同时采取两种方法评估,有时以主观质量度量为主。卢音客观质量的度量主要用信噪比(SNR),详细计算可参看参考文献[1~2]。与用SNR客观质量度量相比较,可以说人的感觉(如听觉、视觉等)更具有决定意义,感觉上的、主观上的测试应该成为评价声音质量和图像质量不可缺少的部分。而有的学者则认为,在语音和图像信号编码中使用主观质量度量比使用客观质量度量更加恰当,更有意义,可-·般来说,可靠的主观度量值也是比较难获得的,所获得的值也是·个相对值,主观度量声音质量的方法类似于电视节目中的歌手比赛,由评委对每个歌手的表现进行评分,然后求出平均值。对声音质量的度量也可以使用类似的方法,召集若·干实验者,由他们对声音质量的好坏进行评分,求出平均值作为对声音质量的评价。这种方法称为主观平均判分法(meanopinion score,MOS).所得的分数称为MOS。现在.对声音主观质量度量比较通用的标准是5分制,各档次的评分标准见表2·3。表2·3声音质量评分标准分数质量级别失真级别5优无察觉欧4(刚)察觉但不讨厌中3(察觉)有点讨厌2券讨厌但不反感t劣极讨厌(令人反惠)2.6电子乐器数字接口(MIDI)系统2.6.1MIDI简介电子乐器数字接口(musicalinstrumentdigitalinterface,MIDI)是用于在音乐合成器(musicsynthesizers)、乐器(musicalinstruments)和计算机之间交换音乐信息的一种标准协议。从20世纪80年代初期开始,MIDI已经逐步被音乐家和作曲家广泛接受和使用。MIIDI是乐器和计算机使用的标准语言,是一套指令(即命令)的约定,它指示乐器(即MIDI设备)要做什么,怎么做,如演奏音符、加大章量、生成音响效果等。MIDI不是声音信号,在MIDI电缆上传送的不是声音,而是发给MIDI设备或其他装置让它产生声音或执行某个动作的指令。MIDI标准之所以受到欢迎,主要是它有下列儿个优点:生成的文件比较小.因为MIDI文件存储的是命令,而不是声音波形;容易编辑,因为编辑命令比编辑声音波形要容易得多;:14
可以作背景音乐,因为MIDI音乐可以和其他的媒体,如数字电视、图形、动画、话音等一起播放·这样可以加强演示效果。产生MIDI乐育的方法很多、现在用得较多的方法有两种:一种是频率调制(frequencytnodulation,FM)合成法,另一种是乐音样本合成法,也称为波形表(wavetable)合成法。这两种方法目前主要用来生成音乐。在介绍MIDI之前先简单介绍FM合成法,然后介绍乐样本合成法,再介绍MIDI系统。2.6.2频率调制(FM)合成声音音乐合成器的先驱RobertMoog采用模拟电子器件生成了复杂的乐音。20世纪80年代初·美国斯坦福大学的一名叫John(howning的研究生发明了一种产生乐音的新方法,这种方法称为数字式频率调制合成法(digitalfrequencymodulationsynthesis),简称为FM合成器。他把几种乐音的波形用数字来表达.并且用数字计算机而不是用模拟电子器件把它们组合起来,通过数模转换器(digitaltoanalogconvertor,DAC)来生成乐音。斯坦福大学得到发明专利,并且把专利权授给Yamaha公司,该公司把这种技术做在集成电路芯片里,成了世界市场上的热门产品。FM合成法的发明使合成音乐工业发生了次革命。FM合成器生成乐音的基本原理如图2-7所示。它由5个基本模块组成:数字载波器、调制器、声音包络发生器、数字运算器和数模转换器。数字载波器用了3个参数:音(pitch)、音量(volume)和各种波形(wave);调制器用了6个参数:颗率(frequency)、调制深度(depth)波形的类型(type),反馈量(feedhack)、题音(vibrato)和音效(effect):乐器声亲除广有它自己的波形参数外,还有它自已的比较典型的声音包络线,声音包络发生器用来调制声音的电平,这个过程也称为幅度调制(amplitudemodulation),并且作为数字式音量控制旋钮,它的4个参数写成ADSR,这条包络线也称为音量升降维持静音包络线(atiack,decay.sustain,release,ADSR)一额率调制数子深度玻形类型一反馈音谢数音音型音效波形模拟声音组合数字裁波和训制竭波形参数进行数丰运算信号输出Attack:音量据升速度Decay:音降低速度Sustain:乐畜维持强度Release:声音回零速度声音色络发生器图2-7FM声音合成器的工作原理在乐音合成器中,数字载波波形和调制波形有很多种.不同型号的FM合成器所选用的波形也不同。图2-8是YamahaOPL-Ⅲ数字式FM合成器采用的波形。·15: