Advertisement

OULU-VS唇语数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
OULU-VS唇语数据集是一个专为研究唇读技术设计的数据库,包含大量视频样本,展示了各种光照、遮挡和噪声条件下的唇部动作,旨在促进跨环境唇语识别算法的发展。 这个用途还蛮广的。上传的是百度网盘链接。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • OULU-VS
    优质
    OULU-VS唇语数据集是一个专为研究唇读技术设计的数据库,包含大量视频样本,展示了各种光照、遮挡和噪声条件下的唇部动作,旨在促进跨环境唇语识别算法的发展。 这个用途还蛮广的。上传的是百度网盘链接。
  • LRW识别申请表格
    优质
    本页面提供LRW唇语识别数据集的申请入口。该数据集旨在促进唇读技术的研究与发展,助力学术界和工业界的创新实践。 请填写申请表并通过官方邮箱(如学校邮箱)发送至BBC邮箱(rob.cooper@bbc.co.uk),以获取LRW唇语识别数据集。
  • LRS2识别申请表格
    优质
    LRS2唇语识别数据集申请表格用于科研人员获取大规模标准化唇语视频数据集,以促进唇读技术的研究与应用。 请填写申请表并通过官方邮箱(例如学校邮箱)发送至rob.cooper@bbc.co.uk以获取LRS2唇语识别数据集。
  • OULU-NPU人脸活体检测
    优质
    OULU-NPU人脸活体检测数据集是一个专为评估防伪算法效能设计的数据库,包含多种攻击类型的真实世界样本,促进生物识别安全研究。 目前质量最好的平面呈现攻击检测数据集现已上传至百度网盘。
  • LipReading,解读.zip
    优质
    LipReading是一款创新的应用程序,专门设计用于帮助用户提高他们的唇语识别技能。通过一系列互动练习和教程,软件能够增强听力受损人士以及需要在嘈杂环境中交流的人士的理解能力。 LipReading项目的目标是利用视觉嘴唇追踪和机器学习技术从视频输入中提取文本段落字。该项目是由本大学的软件工程师Sagi伯恩斯坦、Dor Leitman 和 Dagan共同完成的最终项目。
  • _手_字手
    优质
    这是一个专门收集和整理的手语数字表达的数据集合,旨在为研究者、开发者以及聋人社区提供一个标准化的资源库,促进手语识别技术的发展与应用。 手语数字数据集用于训练分类SVM模型。
  • 猫狗大战:Dogs vs. Cats Kaggle
    优质
    猫狗大战数据集是Kaggle平台上一个广受欢迎的机器学习竞赛数据集,包含12,500张猫咪和狗狗的照片,用于训练图像分类模型。 该资源是Dogs vs. Cats Kaggle猫狗大战数据集,快来下载并实践吧!
  • 用于高质量2D人脸RGB活体检测的人脸识别OULU-NPU)
    优质
    简介:OULU-NPU是一个专为2D人脸RGB图像设计的高质量人脸识别数据集,特别适用于活体检测研究。 Oulu-NPU人脸活体检测原始数据集包含4950个真实和攻击视频样本。这些视频使用六种不同型号的移动设备前置摄像头录制:Samsung Galaxy S6 edge、HTC Desire EYE、MEIZU X5、ASUS Zenfone Selfie、Sony XPERIA C5 Ultra Dual 和 OPPO N3。 数据集分为三个不同的光照条件和背景场景(Session 1, Session 2 and Session 3)。其中,攻击类型包括打印和视频重放。这些类型的攻击通过两台打印机(Printer 1 和 Printer 2)和两个显示设备 (Display 1 and Display 2) 创建。 本数据集主要基于原始视频抓取的帧图像制作而成,每个视频从中抽取了20到50张不等的照片。该数据集主要用于开发基于深度学习的人脸活体检测算法,并希望对需要此资源的研究人员有所帮助。
  • 印度手 -
    优质
    印度手语数据集是一套专为印度手语设计的数据集合,包含大量手势图像和视频资料,旨在促进印度手语的研究与应用。 这是一个印度手语数据集:Indian Sign Language Dataset_datasets.txt 和 Indian Sign Language Dataset_datasets.zip。
  • Lipreading in the Wild Experiments: 在LRW上利用深度学习的读研究
    优质
    本研究聚焦于在LRW数据集上运用深度学习技术进行唇语识别实验,旨在提升唇读模型在复杂环境中的准确性和鲁棒性。 在疯狂的实验中唇读该存储库包含了我在Keras中使用深度学习进行唇读的尝试。我训练并测试了这个模型,并且将LRW数据集中的视频转换为代码所需的格式,具体包括: - 与单词有关的帧; - 这些帧的嘴巴区域。 音频目录中的README文件提供了相关说明。“shape_predictor_68_face_landmarks.dat” 文件需要放置在形状预测器和头姿势计算所需的位置。此存储库包含以下内容: - 形状预测器:用于处理LRW数据集视频,以及获取面部特征点; - 图像检索:将唇读视为图像检索系统相关的代码和文件; - 头部姿态:用于计算LRW数据集中所有帧的头部姿势(使用process-lrw提取),并且提供了详细说明。