
LCQMC数据集的压缩包。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
LCQMC是由哈尔滨工业大学在自然语言处理领域的国际顶级会议COLING2018上所构建的一个问题语义匹配数据集。该数据集旨在评估两个问题是否具有相同的语义含义。其构建流程首先从百度问答中选取大量、高频度的相关问题,涵盖不同的领域,随后利用Wasserstein distance进行初步的筛选和区分。最后,为了确保准确性,数据集进行了人工的标注工作。总而言之,LCQMC包含260068个标注好的问题对,并被划分为三个部分:238766个用于训练、8802个用于验证,以及12500个用于测试。
全部评论 (0)
还没有任何评论哟~


