
实时语音控制的虚拟说话人.pdf
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文介绍了实时语音控制技术在创建互动性更强、更自然的虚拟说话人的应用,探讨了该领域的最新进展和挑战。
本段落提出了一种实时语音驱动的虚拟说话人面部动画方案。通过输入语音信号来同步生成对应的面部动画。这种技术在可视电话、虚拟会议以及音视频聊天等领域具有广泛的应用前景。由于音素是语言中的最小发音单元,因此构建了音素识别器以实现实时音素识别,从而提高了语音与口型的同步效果,并改进了相应的输出算法。考虑到协同发音的影响,使用动态视素生成算法将识别出的音素转化为面部动画参数序列。最后利用这些参数驱动符合Mpeg-4标准的3D头部模型,实现面部动画的实时生成。主观Mos评测结果显示:本段落提出的方案在同步性和逼真度上的评分分别为3.42和3.50。
全部评论 (0)
还没有任何评论哟~


