Advertisement

中英文对照语料库

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本资源为高质量中英文平行文本数据库,涵盖新闻、文学、法律等多个领域,旨在促进双语翻译研究与机器学习应用。 鉴于大家的要求,我们发布了百兆以上的中英双语文本供参考。大家可以尝试使用这些资料。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 优质
    本资源为高质量中英文平行文本数据库,涵盖新闻、文学、法律等多个领域,旨在促进双语翻译研究与机器学习应用。 鉴于大家的要求,我们发布了百兆以上的中英双语文本供参考。大家可以尝试使用这些资料。
  • .zip
    优质
    本资源为《中英文对照语料库.zip》,内含丰富多样的中文与英文平行文本数据,适用于翻译研究、双语对比及语言学习等场景。 用于机器翻译和问答系统的中英文平行语料库是模型预处理的重要资源。
  • NiuTrans
    优质
    NiuTrans 中英文对照语料库是由北京大学机器感知与智能教育部重点实验室开发维护的一个大规模双语文本数据集,旨在支持中英翻译模型的研究和训练。 中英文对照语料库可用于训练翻译系统。
  • 优质
    本资源提供丰富的中英文平行文本数据,涵盖各类主题和文体,适用于翻译研究、机器学习等多领域。 一个包含一万句对齐的中英文平行语料库,适用于机器翻译、问答系统等模型的预处理数据。
  • 小规模
    优质
    本资源为中英文对照的小规模语料库,旨在帮助语言学习者和研究者进行双语对比分析及翻译练习。包含精选文章、对话等文本材料,适用于教学与科研用途。 这个数据集包含两万多条平行语料,非常适合用于学习seq2seq或transformer模型的练习。该数据集中还包含了统计好的词典,可以使用Python中的pickle.load进行查看。
  • NiuTrans 10 万句
    优质
    《NiuTrans中英对照语料库10万句》收录了大量实用、准确的中英文对照句子,是学习语言和训练机器翻译模型的理想资源。 NiuTrans的开源中英平行语料库可用于训练机器翻译模型。
  • (含八万句子
    优质
    本资料集提供一个包含八万句对的中英对照语料库,适用于翻译研究与语言学习者。每条记录均精心校对,确保准确无误。 共包含8400多对中英句子,已进行预处理工作,中文部分使用jieba进行了分词处理,并且标点符号已经过校正。这些数据保存在en-zh.csv文件中,字段间以制表符\t作为分隔符(而非默认的逗号)。虽然语料库包括大量长句,但裁剪后仍有5万对句子足够使用。原始数据集中包含一个名为en-zh_News.tmx的部分存在一些问题的数据段落,在生成en-zh.csv文件时已将其过滤掉。此外还附赠了预处理该语料的程序(propressor.py)以及适用于PyTorch框架中的相关实现代码(LangData.py)。如果有任何可以改进的地方,欢迎提出建议。
  • UG材 .xlsx
    优质
    《UG材料库中英文对照.xlsx》是一份详细列出各类制造材料属性及其英汉名称对照的手册,便于工程设计和制造人员跨语言沟通与操作。 整理了UG有限元材料库中的中英文名称对照及部分材料牌号,方便大家在分析过程中快速找到合适的材料。
  • NiuTrans 含10万句子
    优质
    NiuTrans中英文对照语料库包含超过十万条句对,旨在为机器翻译系统和语言模型提供训练数据,促进双语文本分析与研究。 NiuTrans的开源中英平行语料库可用于训练机器翻译模型。
  • NiuTrans 含10万句子
    优质
    NiuTrans中英对照语料库包含10万句对平行文本,适用于机器翻译系统训练与评估,促进语言技术研究与发展。 NiuTrans的开源中英平行语料库可用于训练机器翻译模型。