
中文命名实体识别(涵盖HMM、CRF、BiLSTM等多元模型):named_entity_recognition
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目专注于中文文本中的命名实体识别技术研究与应用,采用包括隐马尔可夫模型(HMM)、条件随机场(CRF)及双向长短期记忆网络(BiLSTM)在内的多种先进算法模型。旨在提高对人名、地名和组织机构等特定信息的精准提取能力。
本项目尝试使用了多种不同的模型(包括HMM、CRF、Bi-LSTM 和 Bi-LSTM + CRF)来解决中文命名实体识别问题,数据集采用的是ACL 2018 收集的简历数据。数据格式如下:每一行由一个字及其对应的标注组成,使用的标注体系是BIOES,并且句子之间用空行分隔。
美 B-LOC国 E-LOC的 O华 B-PER莱 I-PER士 E-PER我 O跟 O他 O谈 O笑 O风 O生
数据集存放于项目目录下的ResumeNER文件夹内。以下是不同模型及其Ensemble(组合)预测结果的最佳准确率:
| 模型 | 召回率 | 准确率 | F1分数 |
|----------|---------|---------|----------|
| HMM | 91.22% | 91.49% | 91.30% |
| BiLSTM + CRF | 95.43% | 95.43% | 95.42% |
| 合奏 | - | 95.37% | 95.32% |
| 召回率模型1| - | 95.72% | 95.70% |
| Ensemble (组合) | - | 95.69% | 95.64% |
最后一列Ensemble代表将这四个模型的预测结果结合后的效果。
全部评论 (0)
还没有任何评论哟~


