
Speech2Face: CVPR 2019论文实现- Speech2Face
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
《Speech2Face》是CVPR 2019的一篇论文,提出了一种通过语音信息预测人脸特征的方法。该模型能够从单一语音片段中推断出说话者的年龄、性别和种族等面部属性。
该项目实现了一个框架,该框架将语音转换为面部特征,如CVPR 2019论文《MIT CSAIL小组的面部表情》所述。
有关结果的详细报告可以在相关文档中找到。它是印度孟买印度技术学院(IIT)2019年秋季CS 753-自动语音识别课程的一个最终项目。
用法
项目的文件夹结构
该项目采用了高效的结构来安排数据库(音频和视频)以及代码,以避免任何重复。
.
├── base.py
├── LICENSE
├── logs
│ └── ......
├── model.py
├── models
│ └── final.h5
├── preprocess
│ ├── avspeech_test.csv
│ ├── avspeech_train.csv
│ ├── clean_directory.sh
│ ├── data
│ │ ├── a
全部评论 (0)
还没有任何评论哟~


