基于小波变换的噪声抑制

2017-03-15 23:07郑丹
关键词:语音识别小波变换

郑丹

摘 要:近年来,小波理论发展迅速,实际应用也非常广泛,运用小波去噪的方法对噪声进行抑制,以提高说话人系统在噪声坏境下的顽健性,使说话人识别系统的成果走出实验室,得到实际应用,本文简单说明基于小波变换的噪声抑制的思想和方法,以提高语音识别系统实用性能,这也是未来说话人识别系统研究的重要方向之一。

关键词:小波变换;语音识别;信噪分离

中图分类号: O422.8 文献标识码: A 文章编号: 1673-1069(2017)06-164-2

引言

寻找并利用有效的去噪方法是提高系统实用性能的关键技术,但在一般的实验室,其特定的系统却几乎不曾把噪声考虑到整个实验当中。可在现实生活中,噪声却是处处存在。再说,在实验室进行研究的过程中,说话人系统的集合一般都在可控范围内,而且都是比较小的。反之,在现实生活中,说话人的集合却被要求尽可能地放大。由此看来,系统的执行效率和识别率会随着说话人集合的扩大而下降,而且下降的速度与说话人集合的大小形成正比。综上所述,研究小波去噪以提高语音识别系统在变化环境下的系统性能具有重要意义。

1 小波去燥的理论基础

噪声和信号在其各自的频带(即尺度)上的小波谱均有着不一样的表现。根据这个特点,便可根据各频带上的小波谱的分量,确定哪些小波谱是由噪声产生,哪些噪声小波谱在整个频带上起着主导作用。同时,综合上述的判别方法,去掉这部分小波谱,就能把原信号的小波谱保留下来。我们可以把这个过程称作小波谱的重构或者还原,也是小波去燥的理论基础。与此同时,参照小波变换重构的算法,便可还原出原信号。可见,如何有效将噪声产生的小波谱分量过滤掉是小波去燥的关键所在。

一般来说,传统的线性滤波方法难以兼顾在保护信号局部特征的同时,也能有效抑制噪声。为此,可利用小波变换时频局部化和选择灵活化的两大特点,制作出解决传统的线性滤波方法的局限性的有效工具。而利用阈值的小波域语音增强算法便是其中一个较具潜力的算法。由此可知,小波去噪便是简单地利用小波系数的阈值,并在此基础上加以延伸的。举个例子,若是把噪声的小波系数和其他目标信号均框定在小波阈值的范围内,则难以分辨出清音段中的语音和噪音。若是使用相同的阈值处理所有的噪声,在这种特定的环境下,则会把附加的噪声也一并压缩了。同时,也使得像清音一类的语音被压缩了。在此过程中过滤掉的语音在感知上和质量上都会大打折扣。从上述可知,有效结合小波变换和其他信号处理方法,是提高系统鲁棒性的有效途径。

2 不同信噪比下语音加噪

取40dB、30dB、25dB、15dB、10dB五种信噪比下对原始语音进行加噪。

2.1 验证性程序

load ('路径')

s=awgn(s,SNR);

2.2 仿真分析

以信噪比SNR为25dB时为例,进行仿真,绘制信号波形图见图1。

3 不同小波对语音去噪

分别采用小波db1、db7、sym2、db5对加噪语音进行去噪。

说话人集合由20个说话人组成,其中包括男10人,女10人,语音在安静的室内环境下,用Matlab程序录制,每个说话人包含2个四字成语,总共八个字,语音长度3.6s,每人录制相同八字词语两遍,分别存放在文件夹train和文件夹test中,用于训练和识别。然后在不同信噪比下对原始語音进行加噪处理,再对加噪语音采用不同的小波去噪处理,产生一系列的语音。

训练与测试的验证性程序为:

traindir=('路径');

testdir=('路径');

n=20;

code=train(traindir,n);

test(testdir,n,code)

①训练语音:原始语音train,测试语音:原始语音test,程序运行结果为20人的训练与测试语音均匹配,表明原始语音的误识别率为0%。

②训练语音:原始语音train,测试语音:不同信噪比下(信噪比分别为40dB、30dB、25dB、15dB、10dB)加噪语音test。

例如:当加噪语音信噪比为40dB时,程序运行结果为20人的训练与测试语音中,5人匹配,15人不匹配,可得误识别率为75%。

用同样的方法可仿真出其他几种信噪比(30dB、25dB、15dB、10dB)下的识别结果,得到误识别率都为95%。

结果分析:当语音未增强时,误识别率较高。语音增强后,随着信噪比减少,误识别率上升,但当信噪比为30dB、25dB、15dB及10dB时,它们的识别率没有较大区别,误识别率都很高。这说明在低信噪比下,系统误识别率很高,噪声对系统的识别率影响很大。

③训练语音:去噪语音train,测试语音:不同小波(db1、db7、sym2、db5)去噪后的(信噪比分别为40dB、30dB、25dB、15dB、10dB)去噪语音test。

例如:当用小波db1对信噪比为40dB的加噪语音去噪时,程序运行结果为20人的训练与测试语音均匹配,可得误识别率为0%。

用同样的方法可仿真出其它几种小波去噪后的识别结果,列出表格见表1。

结果分析:用小波去噪的语音,当加噪去噪时取用较高的信噪比,识别率较好,随着信噪比的降低,误识别率在升高。语音增强后的测试结果比干净语音的测试结果差。各种小波去噪的效果不是很好,相比较而言,采用小波db1去噪效果稍微更好,但效果也不是很显著。

实验结果分析:在理想的纯净语音环境下对话语进行识别(特征参数为MFCC),其识别率可高达100%,当训练语音为原始语音,测试语音为加噪语音时,测试结果误识别率较高。当训练语音与测试语音都为去噪语音时,当信噪比为40dB时,误识别率较低,随着信噪比的减少,误识别率明显升高。由此看来,我们提出的小波去噪的方法对提高识别率并没有起到较大的作用。不过,现实生活中噪声无处不在,但却能通过上述方法有效去噪。可见,其实用价值不容忽视。

实验结论显示,与此前传统的去噪方法相比,就如何有效增强语音,小波变换有着以下的优势:①将小波变换应用于低信噪比的去噪,其效果较能得到体现。同时,去噪后,不但能够提高语音的识别率,也为实际的应用带来了更大的便利。②对于消除时变信号和突变信号的噪声,小波变换便是最理想的方法之一。同时,与传统的去噪方法相较之下,这种去噪方法的实用性较高,是传统的去噪方法所不能相提并论的。

4 总结

综合上述的论述,小波变换作为滤波一种新方法,能将语音信号中非平稳的信号得以有效过滤。同时,随着对小波去燥的不断深入实践探究,对其理论的完善和实际的应用也有着很大的帮助。最后,结合实践探究得出的结论,便可将小波去燥广泛应用到生活当中。

参 考 文 献

[1] 胡航.语音信号处理[M].哈尔滨工业大学出版社,2002年5月第二版.

猜你喜欢
语音识别小波变换
基于双树四元数小波变换的图像降噪增强
通话中的语音识别技术
基于LD3320的非特定人识别声控灯系统设计