
中文实体关系抽取,利用pytorch和bilstm+attention模型。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
ChineseNRE项目采用Python 2.7和PyTorch 0.4.0进行中文实体关系抽取。对于不熟悉实体关系抽取技术的读者,建议先进行学习。此外,我们诚挚地请求大家给予star支持。目前可用的中文实体关系数据十分稀缺,其中data所包含的人物关系数据集共有11种及以上的关联关系,并且数据质量存在一定的不足,但由于难以寻觅到其他资源,该数据集已成为现阶段的唯一选择。 (更新) ybNero 同学慷慨地分享了一份数据集,详细信息请查阅项目issues页面。梅葆玥先生和梅兰芳先生的家庭生活颇具挑战性,梅葆玥的家庭合影于1961年得以记录,梅兰芳先生不幸病逝后,其姐弟俩葆玥和葆玖继承了父亲的遗志,肩负起梅剧团的重任。数据呈现为:实体1 实体2 关系 句子格式。尽管项目名称为中文实体关系抽取,但为了扩充数据集,也纳入了一部分英文数据集SemEval2010_task8,并进行了初步的数据处理工作;该数据集是免费且公开可用的资源,而其他类似的数据集则通常需要付费购买。训练模型采用了LSTM与注意力机制相结合的网络结构,特征提取则利用了词向量以及位置向量。在正式训练之前,需要先运行dat命令。
全部评论 (0)
还没有任何评论哟~


