
Lipreading in the Wild Experiments: 在LRW数据集上利用深度学习的唇读研究
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究聚焦于在LRW数据集上运用深度学习技术进行唇语识别实验,旨在提升唇读模型在复杂环境中的准确性和鲁棒性。
在疯狂的实验中唇读该存储库包含了我在Keras中使用深度学习进行唇读的尝试。我训练并测试了这个模型,并且将LRW数据集中的视频转换为代码所需的格式,具体包括:
- 与单词有关的帧;
- 这些帧的嘴巴区域。
音频目录中的README文件提供了相关说明。“shape_predictor_68_face_landmarks.dat” 文件需要放置在形状预测器和头姿势计算所需的位置。此存储库包含以下内容:
- 形状预测器:用于处理LRW数据集视频,以及获取面部特征点;
- 图像检索:将唇读视为图像检索系统相关的代码和文件;
- 头部姿态:用于计算LRW数据集中所有帧的头部姿势(使用process-lrw提取),并且提供了详细说明。
全部评论 (0)
还没有任何评论哟~


