
卷积神经网络(CNN)在语音识别领域展现出广泛的应用前景。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
当前语音识别技术正经历快速发展,其中深度神经网络(DNN)、循环神经网络(RNN)/长短期记忆网络(LSTM)以及卷积神经网络(CNN)是几种较为主流的研究方向。2012年,微软的邓力和俞栋先生们将前馈神经网络(FFDNN,FeedForwardDeepNeuralNetwork)引入到声学模型构建中,通过将FFDNN的输出层概率用于取代之前GMM-HMM系统中GMM计算得到的输出概率,从而推动了DNN-HMM混合系统的兴起。长短期记忆网络(LSTM,LongShortTermMemory)目前在语音识别应用中得到广泛采用,其核心优势在于能够有效地建模语音中的长期依赖关系,进而显著提升识别的准确率。此外,双向LSTM网络能够进一步优化性能表现,但与此同时也面临着训练复杂度较高以及解码时延较长的挑战,尤其是在实时应用场景下更为突出。
全部评论 (0)
还没有任何评论哟~


