
TED平行语料库数据集
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
TED平行语料库数据集是由来自世界各地TED演讲的双语或多语文本和音频组成的大规模语言资源数据库。
TED平行语料库是一个包含多语言并行语料库和单语语料库的资源集合。该语料库从109种世界语言中提取数据,并且包括超过1.2亿个句子对,这些句子已经过对齐处理。所有的预处理工作都是自动完成的。
全部评论 (0)
还没有任何评论哟~


简介:
TED平行语料库数据集是由来自世界各地TED演讲的双语或多语文本和音频组成的大规模语言资源数据库。
TED平行语料库是一个包含多语言并行语料库和单语语料库的资源集合。该语料库从109种世界语言中提取数据,并且包括超过1.2亿个句子对,这些句子已经过对齐处理。所有的预处理工作都是自动完成的。


