音频编码和解码原理

作者：时间：2012-11-07 来源：网络

加入技术交流群
- 扫码加入
  和技术大咖面对面交流
  海量资料库查询

每张CD光盘重放双声道立体声信号可达74分钟。VCD视盘机要同时重放声音和图像，图像信号数据需要压缩，其伴音信号数据也要压缩，否则伴音信号难于存储到VCD光盘中。

一、伴音压缩编码原理
伴音信号的结构较图像信号简单一些。伴音信号的压缩方法与图像信号压缩技术有相似性，也要从伴音信号中剔除冗余信息。人耳朵对音频信号的听觉灵敏度有其其规律性，对于不同频段或不同声压级的伴音有其特殊的敏感特性。在伴音数据压缩过程中，主要应用了听觉阈值及掩蔽效应等听觉心理特性。

1、阈值和掩蔽效应
(1) 阈值特性
人耳朵对不同频率的声音具有不同的听觉灵敏度，对低频段(例如100Hz以下)和超高频段(例如16KHZ以上)的听觉灵敏度较低，而在1K－5KHZ的中音频段时，听觉灵敏度明显提高。通常，将这种现象称为人耳的阈值特性。若将这种听觉特性用曲线表示出来，就称为人耳的阈值特性曲线，阈值特性曲线反映该特性的数值界限。将曲线界限以下的声音舍弃掉，对人耳的实际听音效果没有影响，这些声音属于冗余信息。
在伴音压缩编码过程中，应当将阈值曲线以上的可听频段的声音信号保留住，它是可听频段的主要成分，而那些听觉不灵敏的频段信号不易被察觉。应当保留强大的信号，忽略舍弃弱小的信号。经过这样处理的声音，人耳在听觉上几乎察觉不到其失真。在实际伴音压缩编码过程中，也要对不同频段的声音数据进行量化处理。可对人耳不敏感频段采用较粗的量化步长进行量化，可舍弃一些次要信息；而对人耳敏感频段则采用较细小的量化步长，使用较多的码位来传送。
(2)掩蔽效应
掩蔽效应是人耳的另一个重要生理特征。如果在一段较窄的频段上存在两种声音信号，当一个强度大于另一个时，则人耳的听觉阈值将提高，人耳朵可以听到大音量的声音信号，而其附近频率小音量的声音信号却听不到，好像是小音量信号被大音量信号掩蔽掉了。由于其它声音信号存在而听不到本声音存在的现象，称为掩蔽效应。
根据人耳的掩蔽特性，可将大音量附近的小音量信号舍弃掉，对实际听音效果不会发生影响。既使保留这些小音量信号，人耳也听不到它们的存在，它属于伴音信号中的冗余信息。舍弃掉这些信号，可以进一步压缩伴音数据总量。
经仔细观察，掩蔽效应分为两大类，一类是同时掩蔽效应，另一类是短时掩蔽效应。其中，同时掩蔽效应是指同时存在一个弱信号和一个强信号，两者频率接近，强信号将提高弱信号的听阈值，将弱信号的听阈值提高到一定程度时，可使人耳听不到弱信号。例如，同时出现A、B两声，若A声的听觉阈值为50dB，由于存在另一个不同频率的B声，将使A声的阈值提高到64～68dB，例如取68dB，那么数值(68～50)dB=18dB，该值称为掩蔽量。将强大的B声称为掩蔽声，而较弱的A声称为被掩蔽声。上述掩蔽现象说明，若仅有A声时，其声压级50dB以上的声音可以传送出去，而50dB以下的声音将听不到；若同时出现B声，B声具有同时掩蔽效应，使得A声在声压级68dB以下的声音也听不到了，即50～68dB之间的A声人耳也听不到了，这些声音不必传送，即使传送也听不到，只须传送声压级68dB以上的声音。总之，为了提高一个声音的阈值，可以同时设置另一个声音，使用这种办法可以压缩掉一部分声音数据。在周围十分安静的环境下，人耳可以听到声压级很低的各种频率声音，但对低频声和高频声的掩蔽阈值较高，即听觉不灵敏。经研究还发现，掩蔽声越强，掩蔽作用越强；当掩蔽声与被掩蔽声的频率相差越小，掩蔽效果越明显，两者频率相等时，掩蔽效果最佳；低频声(设为B)可有效地掩蔽高频声(设为A)，而高频声(设为B)几乎不能掩蔽低频声(设为A)。因而输入信号时，在受掩蔽的频带内加入更大的噪声时，人耳也感觉不到与原始信号有所区别。上述的同时掩蔽效应，又称为频域掩蔽效应，它主要反映在频域方面对掩蔽作用的影响。在声音压缩编码中，更多地使用单频声音的掩蔽效应。
如果A声和B声不同时出现，也可发生掩蔽作用，称它为短时掩蔽效应。短时掩蔽又可分为两种类型，作用仍可持续一段时间，即后向掩蔽和前向掩蔽。后向掩蔽是指掩蔽声B消失后，其掩蔽作用仍可持续一段时间，一般可达0.5～2秒。掩蔽机理是人耳的存储效应所致。而前向掩蔽是指被掩蔽声A出现一段时间后出现掩蔽声B，只要A、B声音隔不太大(一般在0.05～0.2秒以内)，B也可对A起掩蔽作用。掩蔽机理是A声尚未被人耳感知接受时，强大的B声已来临所致。在实践中，后向掩蔽有较高的应用价值。短时掩蔽效应具有很强的时域结构特性，故又称为时域掩蔽效应。在声音压缩编码中，应兼顾好人耳的频域和时域两种掩蔽效应。

2、子带编码原理
(1)子带编码和解码过程
所谓子带编码技术，是将原始信号由时间域转变为频率域，然后将其分割为若干个子频带，并对其分别进行数字编码的技术。它是利用带通滤波器(BPF)组把原始信号分割为若干(例如m个)子频带(简称子带)。

音频编码和解码原理

在接收端实现发送端的逆过程。输入子带编码数据流，将各子带信号分别送到相应的数字解码电路(共m个)进行数字解调，经过诸路低通滤波器(m路)，并重新解调，可把各子带频域恢复为当初原始信号的分布状态。最后，将各路子带输出信号送到同步相加器，经过相加恢复为原始信号，该恢复的信号与原始信号十分相似。
(2)子带编码的应用
子带编码技术具有突出的优点。首先，声音频谱各频率分量的幅度值各不相同，若对不同子带分配以合适的比例系数，可以更合理地分别控制各子带的量化电平数目和相应的重建误差，使码率更精确地与各子带的信号源特性相匹配。通常，在低频基音附近，采用较大的比特数目来表示取样值，而在高频段则可

新闻中心

音频编码和解码原理

评论

相关推荐

技术专区