Advertisement

对于中文命名实体识别(NER)任务,程序员们常用keras-bert-ner等工具,并结合BiLSTM-CRF/BiGRU-CRF/IDCNN-CRF等模型进行实践。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该项目提供五个程序员使用的刷题网站解决方案,专注于凯拉斯-伯特-纳中文命名实体识别 (NER) 任务。该方案采用 BiLSTM-CRF、BiGRU-CRF 和 IDCNN-CRF 模型,并结合预训练语言模型,如 BERT、RoBERTa 和 ALBERT,以实现最佳效果。 更新日志显示,2020年2月27日对代码进行了重构,并清理了多余的文件。 目前,bert4keras 版本为 0.2.5,已成为该项目的核心组成部分。 2019年11月14日,bert4keras 被打包成一个可独立使用的包,因为其变化相对较小。 此外,albert 模型目前仅支持谷歌版本。 2019年11月04日修复了在计算句子准确率和进行预测时产生错误结果的问题。 2019年11月01日,为了更好地处理掩码标签,将keras-contribcrf_accuracy/crf_loss替换为自定义的crf_accuracy/crf_loss模块。未来的发展方向包括迁移到 TensorFlow 2.0 以及添加其他 BERT 模型,例如 Distill_Bert 和 Tiny_Bert。 项目依赖于烧瓶 (version 1.1.1)、keras (version 2.3.1) 和 numpy (version 1.18.1),同时使用了 loguru (version 0.4.1) 进行日志记录。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 必去的5个刷题网站-Keras-BERT-NERBiLSTM-CRF/BiGRU-CRF/IDCNN-CRF...
    优质
    该文章介绍了五个适合程序员练习算法和数据结构的刷题网站,并针对自然语言处理领域的中文命名实体识别,探讨了Keras框架下几种模型(如BiLSTM-CRF、BiGRU-CRF及IDCNN-CRF)的应用。 以下是关于5个程序员刷题网站以及凯拉斯-伯特-纳中文命名实体识别(NER)任务的更新日志。该任务采用BiLSTM-CRF、BiGRU-CRF和IDCNN-CRF模型,并结合BERT、RoBERTa或ALBERT等预训练语言模型,通过Keras框架实现。 2020年2月27日:重构代码文件keras_bert_ner并删除了不必要的文件。bert4keras版本更新至0.2.5,成为项目的主要部分。 2019年11月14日:将bert4keras作为一个独立的包使用,并且没有做出重大改动;谷歌版ALBERT模型现已支持。 2019年11月4日:解决了计算句子准确率和预测结果时出现的问题,修复了掩码标签处理中的crf_accuracy/crf_loss函数替换问题。 未来的工作将包括迁移到TensorFlow 2.0,并计划添加更多的BERT变体如Distill_Bert、Tiny_Bert等。 依赖项: - 烧瓶(Bottle):1.1.1 - Keras: 2.3.1 - NumPy: 1.18.1 - Loguru :0.4.1
  • BiLSTM-CRF-NER-PyTorch: 本仓库提供针BiLSTM-CRF的PyTorch现。
    优质
    本仓库提供了基于PyTorch框架的BiLSTM-CRF模型,专门用于执行命名实体识别任务,助力自然语言处理领域的发展。 使用BiLSTM-CRF模型的命名实体识别任务的PyTorch解决方案。此存储库包含了一个用于命名实体识别任务的BiLSTM-CRF模型的PyTorch实现。项目的代码结构如下: ``` ├── pyner| │ └── callback| │ | └── lrscheduler.py │ | └── trainingmonitor.py │ ... └── config └── basic_config.py # 用于存储模型参数的配置文件 └── dataset ```
  • Zh-NER-TF:基BiLSTM-CRF的简易(TensorFlow)
    优质
    简介:Zh-NER-TF是一款采用BiLSTM-CRF架构实现的简便中文命名实体识别工具包,专为TensorFlow框架设计。该模型能够有效捕捉文本特征,适用于各种NER任务。 用于中文命名实体识别的简单BiLSTM-CRF模型包含构建基于字符的序列标签模型的代码,该模型旨在识别三种类型的命名实体:PERSON、LOCATION 和 ORGANIZATION。此代码可在 Python 3 和 TensorFlow 1.2 上运行。 该模型类似于论文 [1] 和 [2] 中提供的结构。对于一个中文句子来说,每个字符都有或将会有一个标记属于集合 {O, B-PER, I-PER, B-LOC, I-LOC, B-ORG, I-ORG}。第一层是查找层,旨在将每个字符表示转换为模型所需的格式。
  • BERT+BiLSTM+CRF
    优质
    本研究提出了一种结合BERT、BiLSTM和CRF模型的中文命名实体识别方法,有效提升了NER任务中的精度与召回率。 基于BERT+BiLSTM+CRF的中文命名实体识别(使用PyTorch实现)的基本环境为:Python 3.8、PyTorch 1.7.1 + cu110 和 pytorch-crf 0.7.2。
  • BERT-BiLSTM-CRF-NER代码包.zip
    优质
    本代码包提供了一个基于BERT-BiLSTM-CRF架构的命名实体识别模型。包含预训练模型和源码,适用于中文NER任务。 BERT是一个预训练的语言模型,在多个任务上都取得了优异的成绩。本次实验的任务是序列标注问题,即基于BERT预训练模型在中文命名实体识别(NER)任务中进行微调。微调指的是在迁移学习过程中,利用预先训练好的特征抽取网络,并将其应用于下游任务。具体来说,固定其特征抽取层的参数,在原有的网络上增加少量神经元以完成最后的分类任务,并且只更新这些新增加的分类参数。
  • BERT+BiLSTM+CRF.zip
    优质
    本项目提供了一种基于BERT、BiLSTM和CRF技术结合的命名实体识别解决方案。利用预训练语言模型BERT提取文本特征,并通过双向长短期记忆网络(BiLSTM)进一步捕捉上下文信息,最后使用条件随机场(CRF)进行序列标注,有效提高了实体识别精度与效率。 基于Bert+BiLSTM+CRF的命名实体识别方法在自然语言处理领域得到了广泛应用。这种结合了预训练模型BERT、双向长短期记忆网络BiLSTM以及条件随机场CRF的技术框架,能够有效提升文本中命名实体(如人名、地名和组织机构名称等)的识别精度与效率。
  • BERT+BiLSTM+CRF.zip
    优质
    本资源提供了一个结合了BERT、BiLSTM和CRF技术的先进命名实体识别模型。通过深度学习方法提高对文本中特定实体(如人名、地名等)的准确识别能力,适用于自然语言处理中的多种场景应用。 基于Bert+BiLSTM+CRF的命名实体识别.zip包含了结合了BERT、双向长短期记忆网络(BiLSTM)和条件随机场(CRF)技术的模型,用于提高命名实体识别任务中的性能。该文件中详细介绍了如何利用这些先进的深度学习方法来改进自然语言处理领域内的特定问题解决能力。
  • BERT+BiLSTM+CRFNER战详解
    优质
    本文详细解析了如何运用BERT、BiLSTM和CRF模型进行命名实体识别(NER)的技术实践,适合自然语言处理技术爱好者学习参考。 BERT+BiLSTM+CRF在命名实体识别(NER)中的简单实战演示。
  • PyTorch的BERT-BiLSTM-CRF
    优质
    本研究利用PyTorch框架开发了一种结合BERT、BiLSTM和CRF模型的系统,专门针对中文文本进行高效的命名实体识别,提升了实体边界检测与分类精度。 依赖:python==3.6(可选)、pytorch==1.6.0(可选)、pytorch-crf==0.7.2、transformers==4.5.0、numpy==1.22.4、packaging==21.3 温馨提示:新增了转换为onnx并进行推理的功能,具体内容在convert_onnx下,使用命令python convert_onnx.py执行。仅支持对单条数据的推理。在CPU环境下,原本的推理时间为0.714256477355957秒,转换后为0.4593505859375秒。需要安装onnxruntime和onnx库。 注意:原本的pytorch-crf不能转换为onnx,在这里使用了替代方案。目前只测试了bert_crf模型,其他模型可根据需求自行调整。 问题汇总: ValueError: setting an array element with a sequence. The requested array has an inhomogeneous shape after 1 dimensions. 解决方法:pip install numpy==1.22.4 packaging.ver
  • LSTM+CRFBiLSTM+CRF和LSTM CRF PyTorch代码
    优质
    本项目提供基于LSTM-CRF、BiLSTM-CRF模型的命名实体识别(NER)PyTorch实现,适合自然语言处理任务中的实体抽取。 需要提供可以直接运行的使用pytorch实现的LSTM+CRF、BiLSTM+CRF以及LSTM CRF进行命名实体识别的代码和数据。