
DuIE2.0数据集中的关系抽取
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
简介:DuIE2.0数据集致力于提供大规模中文文本中实体关系的标注信息,促进复杂关系抽取的研究与发展。
关系抽取任务采用DuIE2.0数据集,该数据集包含超过43万三元组、21万条中文句子及定义的48种预设的关系类型。具体而言:
- **关系模式**:包括48个预设的关系类别,其中43个为简单O值类型,5个是复杂O值类型。
- **训练集**:包含约17万个句子及其对应的SPO(主体、谓语和宾语),用于模型的训练。
- **验证集**:包含2万条句子及对应关系,同样包括了SPO信息,主要用于参数调试与竞赛模型训练过程中的性能调整。
- **测试集**:由大约2万句组成,并未提供其中对应的SPO数据。此部分的数据被用于最终系统的评估效果。
为了防止针对测试数据的过度优化或调试,在测试集中会加入额外的混淆数据以增加挑战性。
全部评论 (0)
还没有任何评论哟~


