
语音分割工具结合mos_pesq和pesq进行语音质量的客观评分。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该项目提供了一种工具,能够计算语音的MOS(PESQ)评分。PESQ评估指标的具体用法如下:[pesq_mos] = pesq(cleanfile.wav,enhanced.wav),其中cleanfile.wav包含原始语音文件,enhanced.wav包含增强后的语音文件。例如,为了使用提供的示例文件运行PESQ评估指标,在MATLAB中输入:>> pesq(sp09.wav,enhanced_logmmse.wav) ans = 2.2557 源代码的PESQ实现可从随书籍提供的光盘获取。Loizou, P. (2007) Speech enhancement: Theory and Practice, CRC Press。
复合评估指标的使用方法如下:[Csig,Cbak,Covl]=composite(cleanfile.wav,enhanced.wav),其中Csig是语音失真预估评分,Cbak是背景失真预估评分,Covl是整体质量预估评分。您可以运行随zip文件提供的示例文件。在MATLAB中输入:>> [c,b,o]=composite(sp09.wav,enhanced_logmmse.wav) LLR=0.681368 SNRseg=3.991727 WSS=49.671978 PESQ=2.255732 其中sp09.wav为原始语音文件,enhanced_logmmse.wav为增强后的语音文件。整体质量的预估评分是2.7133,背景的预估评分是2.61,信号失真的预估评分是3.3050。
操作步骤如下:
1. 将所录制的序列加载到当前工作目录中;也可以根据自己的工作路径自行加载;
2. 在read.m文件中修改参考序列,默认情况下参考序列为ref.wav(16KHz采样);
3. 使用wavdivide.m对所录制的多组序列文件进行拆分(支持多种采样频率),并按顺序保存在当前路径;
4. 运行tongji.m计算PESQ_MOS得分并通过Excel/txt输出至指定路径。请注意,对于步骤4,每次执行时记得修改Excel中的输出列位置,例如cellnames2=[B,num2str(k+1),:B,num2str(k+1)],指定写入B列;下次执行改为C列,以此类推。其中ref_8k.wav为8KHz采样测试序列,ref.wav为16KHz采样测试序列,ref_3s.wav只是为了方便测试在ref.wav语音前加3秒静音。如有任何疑问,请发送邮件至kinglongbest@163.com或245051943@qq.com。
全部评论 (0)


