语音分割与语音质量客观评估工具(MOS_PESQ)是一款用于评估语音通信中音质的专业软件,通过算法分析生成清晰度和可懂度评分,是电信及音频处理领域的重要测试手段。
该项目是一个工具,用于获取语音的MOS(PESQ)评分。PESQ测量方法如下:
使用PESQ客观度量的方法是这样的:[pesq_mos]=pesq(cleanfile.wav,enhanced.wav),其中cleanfile.wav包含原始清晰的语音文件,而enhanced.wav则包含经过处理后的音频文件。
示例:
在MATLAB中运行提供的示例文件中的PESQ度量方法,请输入以下命令:
>> pesq(sp09.wav, enhanced_logmmse.wav)
ans = 2.2557
源代码的实现可以从相关书籍附带的CD-ROM获取。该书为:Loizou, P. (2007) Speech enhancement: Theory and Practice, CRC Press。
复合度量:
使用方法如下:[Csig,Cbak,Covl]=composite(cleanfile.wav,enhanced.wav),其中,Csig是预测语音失真的评分;Cbak 是背景噪声的预测评级; Covl则是整体质量的预期评价。可以运行ZIP文件中包含的例子,在MATLAB里输入以下命令:
>> [c,b,o] = composite(sp09.wav, enhanced_logmmse.wav)
LLR= 0.681368 SNRseg= 3.991727 WSS=49.671978 PESQ=2.255732
c = 3.3050 b = 2.6160 o = 2.7133
其中,sp09.wav是原始文件,而enhanced_logmmse.wav则是经过处理的音频。整体质量预测评分为2.7133;背景噪声为2.61;语音失真则为3.305。
操作步骤:
>> ./matlab-PESQ/readme.txt
注意事项:每次执行tongji.m计算PESQ_MOS得分并通过excel/txt输出至指定路径时,请记得修改Excel中输出列的位置,例如cellnames2=[B, num2str(k+1), : B, num2str(k+1)], 指定写入B列。下次执行则改为C列,并以此类推;其中ref_8k.wav为8KHz采样测试序列, ref.wav为16KHz的参考文件,而ref_3s.wav只是为了方便测试,在ref.wav语音前加了3秒静音。