
Multi30k数据集的源代码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
为了充分准备Multi30k数据存储库,除了提供原始数据文件,我们还提供了subword-nmt作为GIT子模块,包含Moses预处理脚本的最新版本(截至2017年12月),旨在尽可能地消除用户在处理过程中的差异。为了确保能够完整地获取所有相关资源,建议您使用--recursive标志进行存储库的克隆操作:`git clone --recursive https://github.com/multi30k/dataset.git multi30k-dataset`。视觉特征可以通过预先提取的视觉功能以及Flickr30k原始图像获得,这些图像可从test_2017_flickr和test_2018_flickr下载。任务1中的原始文件以及对应的标记文件是由预处理脚本生成的。此外,您可以使用Multi30K 2018测试仪在正在进行的竞赛中使用2018年测试集对模型进行评估。统计数据train (en) 29
全部评论 (0)
还没有任何评论哟~


