
语音增强技术的发展历程与操作系统概念(中文第七版 翻译版)。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
1.1 语音增强技术的发展历程 语音增强技术的探索始于 1964 年贝尔实验室,Schroeder率先运用模拟方法实现共振峰谱减法。这项早期工作并未得到广泛认可,主要原因是其并未在学术期刊或会议上发表,而是仅作为一项专利技术存在。1979 年,Boll 在数字领域重新实现了谱减法,旨在抑制噪声 [6]。该算法通过分析无声段中估计出的噪声功率谱,并从带噪语音频谱中减去这些估计的噪声谱,从而获得对纯净语音的近似。此后,谱减法迅速成为实际应用系统中最为常用的方法之一,并陆续涌现出众多改进和更复杂的算法。例如,Berouti 为了提升谱减法的性能,在传统算法的基础上引入了调节噪声功率谱系数和增强语音功率谱最小值限制 [7]。然而,谱减法的一个显著问题是它容易产生音乐噪声,而直到那时仍未找到有效的解决方案。与此同时,Lim 和 Oppenheim 在 1978 年提出了维纳滤波器降噪方法 [8]。维纳滤波利用最小均方误差准则来估计平稳条件下的时域波形。其优势在于滤波后的残留噪声与白噪声相似,而非像传统方法那样产生节奏起伏的音乐噪声。维纳滤波采用频域方法进行处理,通过对平稳随机过程的谱分解来解决最优滤波问题。它代表了平稳随机过程中的最优滤波理论;但由于其局限性在于只能处理平稳随机过程,因此在处理非平稳随机过程中的语音信号时存在一定的缺陷。1987 年,卡尔曼滤波由 Paliwal 引入到语音增强领域 [9]。卡尔曼滤波方法采用时域上的状态空间模型,从而克服了维纳滤波理论的限制,并解决了非平稳条件下最小均方误差意义下的最优估计问题。此外, 作为本文研究重点的信号子空间分解降噪方法起源于 Denrinos 在文献 [10] 中提出的利用奇异值分解 (Singular value decomposition, SVD) 进行子空间划分的方法。随后, Ephraim 和 Van Trees 在 1995 年 [11] 对该方法进行了完善, 该算法利用语音信号协方差矩阵的特征值分解 (Eigen Value Decomposition, EVD) 将带噪语音的向量空间分解为两个相互正交的子空间, 即“信号子空间”和“噪声子空间”。之后, 同一作者又提出了许多基于此算法的其他方法。信号子空间法几乎不会引入音乐噪声;尽管该方法在控制信号失真程度和残余噪声之间存在折衷取舍的情况, 但我们可以有效地控制两者之间的平衡.
全部评论 (0)


