
Vietnamese NER with BERT_VN_NER: A PyTorch Solution Using Googles AI Model
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目使用PyTorch框架和Google的BERT模型开发了一种针对越南语命名实体识别(NER)的解决方案,名为BERT_VN_NER。
使用BERT的越南语命名实体识别(bert-vn-ner)是由Trong-Dat Ngo编写的代码。该系统采用Pytorch实现的BERT模型来为越南语执行命名实体识别任务,并且在单词表示中加入了特征信息。安装要求包括Python 3.6及以上版本和Torch1.4+以上版本,依赖项可以通过pip命令进行安装:`pip3 install -r requirements.txt`。
数据集格式遵循CoNLL-2003标准,每一行包含四个字段(单词、词性标签、短语结构树标签以及命名实体),这些字段由制表符分隔。每个句子之后会有一个空行来区分不同的句子段落。需要注意的是,在进行分词处理时不需要匹配BERT的预训练模型(以`bert-base-multilingual-cased`表示)。有关更详细的信息,请参考“数据”目录中的样本段落件。
下面给出一个越南语例句的数据集示例:
单词\t 词性标签 \t 短语结构树标签 \t 命名实体
全部评论 (0)
还没有任何评论哟~


