5.1 音频基础知识

声音是人们获取信息的重要来源,在教学信息的传播过程中,语言声音占有极其重要的地位。人们利用声音的记录、修饰、放大、存储等技术,使得声音在教育、教学,尤其是在语言、音乐的学习中发挥着重大的作用,也使教育信息的传播打破了时空的界限。

5.1.1 声波

声波是在介质中传播的声振动。声音是人耳听到的声波,是由声源振动、声波在介质中的传播和听觉感受三个环节形成的。

1.声音

声音分为乐音和噪音两大类。乐音是由规则震动产生的,只包含有限的某些特定频率,具有确定的波形;而噪音是由不规则震动产生的,它包含一定范围内的各种频率的声振动,没有确定的波形。乐音又分为纯音和复音两种,纯音是单个简谐震动所发出的声音,复音是由多个简谐震动复合而成的声音,一个复音可分解为若干个纯音,其中频率最低的往往也是最强的音称为基音,其他的称为泛音,泛音的频率是基音的整数倍。

乐音三要素包括音量、音调和音色。

(1)声音的音量

声音音量的客观评价通常以声压级(Lp)或声强级(LI)来标志。声压级指的是有效声压和基准声压比值的常用对数的20倍,单位为分贝(dB),用Lp表示。

Lp=20×lg(Pe/Pr)

其中,Pe是基准声压,通常取Pe=10-5Pa,是人耳能听到的最小声音的声压值。

声强级是指声强与基准声强比值的常用对数的10倍,单位也是分贝(dB),用LI表示。

LI=10×lg(Ie/Ir)

其中,LI是基准声强,取LI=10-12W/m2,是人耳能听到的最小声音的声强值。

由于人的生理特点,人对声音大小的主观评价与客观评价并不完全一致,除了有声音的压强或能量起主要决定作用外,还与声音的频率和波形有关。

人对声音的主观评价通常以响度级为准,响度级指的是将待定声音与1kHz的纯音进行比较,当两者听起来一样响时,该1kHz声音的声压级数值就是该声音的响度级数值,单位是“方”(phon)。

(2)声音的高低——音调

音调的高低主要取决于基音的频率,而比较两个声音音调高低又取决于两个频率的比值,若两者频率相差一倍即相差一个倍频程,在音乐中称相差一个“八度”音程。一个“八度”音程内有12隔音,每相邻两音音程差为半度,另外两个频率相等的音,若声压级不同,听起来音高也略有不同。在不同频段,人耳对音调辨别的能力也有所不同。人耳对中频的辨别能力最强。1kHz左右的声音,琴师可分辨1Hz的差别,一般人也能分辨出3Hz左右的差别,而相对于低频段和高频段来说,人的分辨能力就要差一些。

(3)声音在人耳中的主观感受——音色

音色是由声音中包含泛音的多少及其强弱即频谱结构决定的,另外音色还与声音的音量、音调、建立过程、持续时间、衰减过程有一定的关系。钢琴的频谱如图5-1-1所示。

图5-1-1 钢琴的频谱

2.人的听觉特性

人耳听觉感受的动态范围很宽,能感受到的最小声压级位为0dB,能耐受的最大声压级可达130dB,两者声压相差1亿倍;一般人耳能听到的纯低音最低可达20Hz,最高可为20kHz。声音要达到一定的声压级才能被听到,最小可听声压级称为绝对阈限,是听觉绝对感受性的表征量。正常人的听觉范围,如图5-1-2所示。

图5-1-2 正常人的听觉范围

语言主要在中频中强范围内,这一范围也正是人耳听觉最灵敏的部分。

5.1.2 音频设备

音频设备主要是指对音频输入输出设备的总称,其包括的产品类型也很多,一般可以分为以下几种:传声器、扬声器、功放机、音箱、数字调音台、声卡、合成器、耳机等。下面简单介绍几种常见的音频设备。

1.传声器

传声器,是一种声电转换的换能器,通过声波作用到电声元件上产生电压,再转为电能,常用于各种扩音设备中。传声器由最初通过电阻转换声电发展为电感、电容式转换,大量新的传声器技术逐渐发展起来,这其中包括铝带、动圈等传声器,以及当前广泛使用的电容传声器和驻极体传声器。

传声器的分类方式比较多,通常是按它的转换原理进行分类,一般把话筒分为动圈式传声器和电容式传声器。

①动圈式传声器:由磁场中运动的导体产生电信号的传声器。是由振膜带动线圈振动,从而使在磁场中的线圈感应出电压,如图5-1-3所示。

图5-1-3 动圈式传声器

②电容式传声器:这类传声器的振膜就是电容器的一个电极,当振膜振动,振膜和固定的后极板间的距离跟着变化,就产生了可变电容量,这个可变电容量和传声器本身所带的前置放大器一起产生了信号电压,如图5-1-4所示。

图5-1-4 电容式传声器

电容式传声器中带有前置放大器,当然就得有一个电源,由于体积关系,这个电源一般是放在话筒之外的。除了供给电容器振膜的极化电压外,也为前置放大器的电子管或晶体管供给必要的电压。我们称它为幻象电源。

由于有了这个前置放大器,所以电容式传声器相对要灵敏一些。电容式传声器在使用时不可缺少的一些附属设备有:防震架(一般会随话筒赠送)、防风罩、防喷罩、优质的话筒架。如果要进行超近距离的录音工作,一个防喷罩也是不可少的。

2.扬声器

扬声器又称为“喇叭”。是一种十分常用的电声换能器件,在出声的电子电路中都能见到它。扬声器的种类繁多,而且价格相差很大。

扬声器的种类很多,按其换能原理可分为电动式(即动圈式)、静电式(即电容式)、电磁式(即舌簧式)、压电式(即晶体式)等几种,后两种多用于农村有线广播网中;按频率范围可分为低频扬声器、中频扬声器、高频扬声器,这些常在音箱中作为组合扬声器使用。动圈式扬声器如图5-1-5所示。

图5-1-5 动圈式扬声器

在选用扬声器时,要根据使用的场所和对声音的要求,结合各种扬声器的特点来选择。例如,室外以语音为主的广播,可选用电动式号筒扬声器,如要求音质较高,则应选用电动式扬声器箱或音柱:室内广播,一般可选用单只电动纸盆扬声器做成的小音箱:而以欣赏音乐为主或用于高质量的会场扩音,则应选用由高、低音扬声器组合的扬声器箱。

3.功率放大器

功率放大器(英文名称:power amplifier),简称“功放”,是指在给定失真率的条件下,能产生最大功率输出以驱动某一负载(如扬声器)的放大器。功率放大器在整个音响系统中起到了“组织、协调”的枢纽作用,在某种程度上主宰着整个系统能否提供良好的音质输出。

功率放大器的工作原理是利用三极管的电流控制作用或场效应管的电压控制作用将电源的功率转换为按照输入信号变化的电流,如图5-1-6所示。因为声音是不同振幅和不同频率的波,即交流信号电流、三极管的集电极电流永远是基极电流的β倍,β是三极管的交流放大倍数,应用这一点,若将小信号注入基极,则集电极流过的电流会等于基极电流的β倍,然后将这个信号用隔直电容隔离出来,就得到了电流(或电压)是原先的β倍的放大信号,这种现象称为三极管的放大作用。经过不断的电流放大,就完成了功率放大。

图5-1-6 功率放大器

功率放大器通常由3个部分组成:前置放大器、驱动放大器和末级功率放大器。前置放大器起匹配作用,其输入阻抗高(不小于10kΩ),可以将前面的信号大部分吸收过去,输出阻抗低(100Ω以下),可以将信号大部分传送出去。同时,它本身又是一种电流放大器,将输入的电压信号转化成电流信号,并给予适当的放大。驱动放大器起桥梁作用,它将前置放大器送来的电流信号作进一步放大,将其放大成中等功率的信号,驱动末级功率放大器正常工作。如果没有驱动放大器,末级功率放大器不可能送出大功率的声音信号。末级功率放大器起关键作用。它将驱动放大器送来的电流信号形成大功率信号,带动扬声器发声,它的技术指标决定了整个功率放大器的技术指标。

4.声卡

声卡是多媒体技术中最基本的组成部分,是实现声波/数字信号相互转换的一种硬件。声卡的基本功能是把来自话筒、磁带、光盘的原始声音信号加以转换,输出到耳机、扬声器、扩音机、录音机等声响设备,或通过音乐设备数字接口(MIDI)使乐器发出美妙的声音,如图5-1-7所示。

图5-1-7 声卡

声卡从话筒中获取声音模拟信号,通过模数转换器(ADC),将声波振幅信号采样转换成一串数字信号,存储到计算机中。重放时,将这些数字信号输送到数模转换器(DAC)中,以同样的采样速度还原为模拟波形,放大后发送到扬声器中发声,这一技术称为脉冲编码调制技术(PCM)。

声卡的主要作用包括以下几个方面。

①通过声卡及相应的驱动程序的控制,采集来自话筒、收录机等音源的信号,压缩后被存放在计算机系统的内存或硬盘中。

②将光盘压缩的数字化声音文件还原成高质量的声音信号,放大后通过扬声器放出。

③数字化的声音文件加工,以达到某一特定的音频效果。

④调节音量,对各种音源进行组合,实现混响器的功能。

⑤合成技术,通过声卡朗读文本信息。如读英语单词和句子,奏音乐等。

⑥音频识别功能,让操作者用口令指挥计算机工作。

⑦电子乐器功能。在驱动程序的作用下,声卡可以将MIDI格式存放的文件输出到相应的电子乐器中,发出相应的声音,使电子乐器受声卡的指挥。

5.1.3 音频格式

音频格式是指利用不同的音频压缩方式制作的音乐格式,不同的音频格式有不同的特点,可以满足不同的要求。创作者可根据自己对乐曲的要求选择不同的音频压缩方式。

音频格式分为有损压缩和无损压缩两种格式。有损压缩,顾名思义就是降低音频采样频率与比特率,输出的音频文件会比源文件小。目前流行的有损压缩格式主要有MP3、WMA、OGG、AAC、VQF、ASF等。而无损压缩是指能够在100%保存源文件的所有数据的前提下,将音频文件压缩得更小,而将压缩后的音频文件还原后,能够实现与源文件相同的大小、相同的码率。常见的无损压缩格式目前有APE、FLAC、TTA、TAK等。下面介绍几种最为常见的音频格式。

1.CD格式

CD格式是当今音质最好的音频格式。在大多数播放软件的“打开文件类型”中,都可以看到*.cda格式,这就是CD音轨了。标准CD格式是44.1K的采样频率,速率88K/秒,16位量化位数,因为CD音轨可以说是近似无损的,因此它的声音基本上是最忠于原声的一种格式。CD光盘可以在CD唱机中播放,也能用电脑里的各种播放软件来重放。一个CD音频文件是一个*.cda文件,这只是一个索引信息,并不是真正的包含声音信息,所以不论CD音乐的长短,在电脑上看到的*.cda文件都是44字节长。需要注意的是,不能直接复制CD格式的*.cda文件到硬盘上播放,需要使用像EAC这样的抓音轨软件把CD格式的文件转换成W**,这个转换过程中,如果光盘驱动器质量过关而且EAC的参数设置得当的话,可以说是基本上无损抓音轨。

2.MP3格式

所谓MP3也就是指MPEG标准中的音频部分,也就是MPEG音频层。根据压缩质量和编码处理的不同分为3层,分别对应*.mp1/*.mp2/*.mp3这3种声音文件。MPEG音频文件的压缩是一种有损压缩,MPEG-3音频编码具有10∶1~12∶1的高压缩率,同时基本保持低音频部分不失真,但是牺牲了声音文件中12KHz到16KHz高音频这部分的质量来换取文件的尺寸,相同长度的音乐文件,用*.mp3格式来储存,一般只有*.wav文件的1/10,而原来的音质又很好地得到了保持。正是由于其文件尺寸小、音质好,所以在它问世之初还没有别的音频格式可以与之匹敌,因而为*.mp3格式音频文件的发展提供了良好的条件。直到现在,这种格式还是作为主流的音频格式在使用。

3.WMA格式

WMA就是Windows Media Audio编码后的文件格式,由微软开发,WMA针对的不是单机市场,而是网络。竞争对手就是网络媒体市场中著名的Real Networks。微软声称,在只有64kbps的码率情况下,WMA可以达到接近CD的音质。和以往的编码不同,WMA支持防复制功能,它支持通过Windows Media Rights Manager 加入保护,可以限制播放时间和播放次数甚至播放的机器等。WMA还支持流技术,即一边读一边播放,因此WMA可以很轻松地实现在线广播。

4.W**格式

W**是微软公司开发的一种声音文件格式,它符合PIFFResource Interchange File Format 文件规范,用于保存Windows平台的音频信息资源,被Windows平台及其应用程序所支持。W**格式支持MSADPCM、CCITT A LAW等多种压缩算法,支持多种音频位数、采样频率和声道,标准格式的W**文件和CD格式一样,也是44.1K的采样频率,速率88K/秒,16位量化位数,因此,W**格式的声音文件质量和CD相差无几,也是目前PC机上广为流行的声音文件格式,几乎所有的音频编辑软件都支持W**格式。

5.AAC格式

AAC(高级音频编码技术,Advanced Audio Coding)是杜比实验室为音乐社区提供的技术,是基于MPEG-2的音频编码技术。目前苹果的硬盘式MP3(IPod)、Nokia手机、SonyMP3等大多数播放器都支持这一格式。2000年,MPEG-4标准出台,AAC重新整合了其特性,故现又称为MPEG-4 AAC,即M4A。AAC所采用的运算法则与MP3的运算法则有所不同,AAC通过结合其他功能来提高编码效率。AAC的音频算法在压缩能力上远远超过了以前的一些压缩算法(如MP3等)。它还同时支持多达48个音轨、15个低频音轨、更多采样频率和比特率、多种语言的兼容能力和更高的解码效率。总之,AAC可以在比MP3文件大小缩小30%的前提下提供更好的音质。

6.APE格式

APE是目前流行的数字音乐文件格式之一。与MP3这类有损压缩方式不同,APE是一种无损压缩音频技术,也就是说当你将从音频CD上读取的音频数据文件压缩成APE格式后,你还可以再将APE格式的文件还原,而还原后的音频文件与压缩前一模一样,没有任何损失。APE的文件大小大概为CD的一半,随着宽带的普及,APE格式受到了许多音乐爱好者的喜爱,特别是对于希望通过网络传输音频CD的朋友来说,APE可以帮助他们节约大量的资源。

7.MIDI格式

MIDI(Musical Instrument Digital Interface)格式被经常玩音乐的人使用,MIDI允许数字合成器和其他设备交换数据。MID文件格式由MIDI继承而来。MID文件并不是一段录制好的声音,而是记录声音的信息,然后再告诉声卡如何再现音乐的一组指令。这样,一个MIDI文件每存1分钟的音乐只用大约5~10KB。MID文件主要用于存储原始乐器作品,流行歌曲的业余表演,游戏音轨以及电子贺卡等。*.mid文件重放的效果完全依赖于声卡的档次,这种格式的最大用处是在电脑作曲领域。*.mid文件还可以用作曲软件写出,也可以通过声卡的MIDI口把外接音序器演奏的乐曲输入电脑里,制成*.mid文件。

5.1.4 常用音频采集的方法

在多媒体CAI课件中合理地加入一些声音,可以更好地表达教学内容,有利于使学习者大脑保持兴奋状态,使视觉思维得以维持。音频素材可以从多种渠道获得,如直接录制、互联网下载等。

1.直接录制音频资源

在制作音频素材的时候,有时会需要录制一些原始的音频素材,这样就需要播音人员利用麦克风进行录制,如果希望在录制过程中获得比较好的录音效果,就需要在录音棚里进行录制。

组建一间教学用的录音棚需要监听设备和功放、调音台和录音话筒、MIDI输入设备、计算机等设备。如果经济条件允许的话,还可以增加采样机、多功能的子卡、转换卡、音乐工作站(看起来就像一台高档的合成器)、编曲机、MIDI接口、效果器、话筒防风罩、前置放大器等设备。当然各设备之间的连接线和传唤头也是不能忽略的一个重要环节,这将直接影响音频资源的制作效果,一个基本的录音棚组成,如图5-1-8所示。

图5-1-8 录音棚

目前常用的数字录音技术是通过计算机中的数字音频接口,将(话筒或其他)音频信号输入到计算机,录制成波形文件进行存储,再通过多轨录音软件根据需要进行编辑(包括复制、剪切、粘贴),组合成完整文件,再输出录制成CD或其他音频格式。

数字录音有采样、量化和编码三个步骤。

(1)采样

数码音频系统是通过将声波波形转换成一连串的二进制数据来再现原始模拟声音的,实现这个步骤使用的设备是模/数转换器(A/D),它以每秒上万次的速率对声波进行采样,音频采样可以分为采样的位数和采样的频率,其中采样位数可以理解为采集卡处理声音的解析度。数字录音中的采样频率(一秒钟内对声音信号的采样次数),是衡量其质量的一个重要指标。采样频率越高,解析度就越高,录制和回放的还原声音就越真实自然。

(2)量化

模拟信号采样后需解决采样点信号幅度的读出问题。把连续变化的信号振幅按一定的级差精度读出采样点信号振幅的数据称为“量化”。量化值通常用二进制表示。表达量化值的二进制位数称为采样数据的比特数,也就是采样精度。采样数据的比特数越多,声音的质量越高,所需的存储空间就越多;反之则声音的质量越低,所需的存储空间也越少。

(3)编码

数字化音频在存储和传输的过程中必须进行压缩,根据所需质量的要求,需要选择相应的编码方式进行编码。

2.直接转录已有的音频资源

通过录音室可以获得原始的音频素材,但这种方法工作量大,更多时候我们倾向于转录一些现有的音频资源。这只需要一些录放音的设备就可以进行录制,该方法的操作比较简单,不需要太多的专业知识就可以完成,传统的录音设备有录音磁带机、MD机等。我们不提倡使用麦克风直接在音响面前录制,因为这种方式转录的音频信息的信号质量不能满足教学的需要。

3.通过计算机获取音频资源

计算机的普及使音频的处理更加方便和快捷,运用计算机编辑音频信息,首先要把音频资源采集到计算机中,这时可以通过一块音频采集卡直接把外部的音频资源导入到计算机中,也可以把一些已有资源通过光盘之类的媒体直接拷贝到计算机中,或者直接通过计算机进行录制。

通过音频采集卡把音频信息采集到计算机中,需要根据原始资源的类型确定相应的采集方法。

(1)录音磁带的采集

如果需要把磁带机上面的资源采集到计算机中,就需要把磁带机和计算机的线路连接口(LINE OUT和LINE IN)连接在一起,需要注意的是,很多普通的磁带机并没有提供线路输出口(LINE OUT)。

(2)CD素材的采集

多媒体计算机一般都有一个光盘读取设备CD-ROM,我们可以直接通过CD-ROM读取CD光盘中的音频信息,不再需要通过音频采集卡进行CD资源的采集。

CD是一种音频质量相对较高的音频信息,要将CD中的信息采集到计算机中,有不同的方法,这就需要根据所获得的音频质量来确定。

当对音频资源质量要求较高时,可以直接把CD中的音频文件转存为.wav的格式,可这样做的代价是极大地浪费了存储空间,因为一张80分钟左右的CD碟片需要800MB的存储空间。如今我们还可以通过无损压缩的方式进行处理,经处理的音频信息理论上和原始音频信息是完全一致的,处理出来的文件格式一般有*.ape、*.flac等。制作*.ape文件最常用的工具是Exact Audio Copy和Money's Audio。

在教学中使用的音频,目前大量使用的是mp3音频格式,它是一种有损压缩的格式,是通过把音频信息中人耳不易识别的高频和低频删除来完成对音频数据的压缩处理的,处理完成后可以把一张500MB的CD压缩为35~45MB左右,大大节省了存储空间,并为其网络传输提供了便利条件。生成*.mp3文件的方式非常多,可以通过 Power MP3 WMA Converter工具进行转换,该工具的界面如图5-1-9所示。

图5-1-9 Power MP3 WMA Converter软件的界面

Power MP3 WMA Converter可以简单地在各种音频格式之间进行转换。

总之,各种文件格式之间的转换其实并不难,只需掌握文件格式转换的基本思想便可通过相应的软件进行转换。

4.通过互联网获取音频资源

可以从互联网上下载大量的免费音频教学素材。