
基于Duee数据集的句子级事件抽取
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究聚焦于利用Duee数据集进行句子级别的事件抽取任务,采用先进的自然语言处理技术,以提高事件识别与分类的准确率。
句子级事件抽取任务使用DuEE1.0数据集进行处理。该数据集包含65个预先定义的事件类型约束以及大约17,000条中文语句。
具体来说,DuEE1.0数据集包括以下五个部分:
- **事件类型约束**:共有65种不同的事件类型,并且每一种类型对应有121个论元角色类别。
- **训练集**:包含约12,000条句子。每个句子都标注了对应的事件类型、论元及其在句中的具体角色,用于竞赛模型的训练过程。
- **验证集**:大约包括1500条语句,同样标记有每句话中涉及的事件类型、论元以及其角色信息,用来进行竞赛模型训练及参数调试工作。
- **测试集**:包含约3,500个句子。这些句子没有提供相应的事件类型和论元及其角色标注信息,用于最终系统效果评估。
为了防止针对测试数据集的过度调整,在该数据集中还会额外加入一些混淆性数据以增加模型泛化能力的要求。
全部评论 (0)
还没有任何评论哟~


