
Min_NLP_Practice:基于CNN、双向LSTM及CRF模型并结合字符嵌入的中英文CWS POS NER实体识别...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Min_NLP_Practice项目采用CNN、双向LSTM和CRF模型,融合字符嵌入技术,实现高效准确的中文分词(CWS)、词性标注(POS)及命名实体识别(NER),同时适用于英文处理。
CwsPosNerEntityRecognition 是一个用于中文和英文分词、词性标注及实体识别的工具,采用CNN双向LSTM与CRF模型,并包含字符嵌入功能。该工具基于字向量的CNN池化双向BiLSTM与CRF模型网络,能够一体化完成中英文分词、词性标注以及实体识别任务。它包括原始文本数据、数据转换脚本、训练脚本和预训练模型,适用于序列标注研究。
用户需要实现的功能是将输入的数据转化为适合序列模型的形式。该工具在中文分词上的准确率约为93%,词性标注的准确率为约90%,实体识别(基于样本)的准确性为85%左右。需要注意的是,在使用上述模型进行分词、词性标注和实体识别时,其实质上是一个标记问题。
如果您是第一次使用此类工具,请确保在相关代码中加上self.c并根据需要调整其他设置。
全部评论 (0)
还没有任何评论哟~


