Advertisement

NLP中文命名实体识别的案例集(rar格式)。

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该经典论文“深度学习用于命名实体识别综述”的实验实施细节,包括了所参考的原始论文本身,以及用于训练和测试的相应数据集,以及所采用的模型。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • NLP.rar
    优质
    本资源为一个实用的NLP项目案例,专注于使用机器学习技术进行中文文本中的命名实体识别。包含详细代码和注释,适合自然语言处理领域的初学者研究与实践。 经典论文《A Survey on Deep Learning for Named Entity Recognition》的实验实现包括了详细的文献综述、所使用的训练和测试数据集以及模型的具体细节。该研究深入探讨了深度学习技术在命名实体识别任务中的应用,为相关领域的研究人员提供了宝贵的参考信息。
  • 数据.rar
    优质
    本资源包含一个用于训练和测试命名实体识别模型的数据集,适用于自然语言处理任务,帮助提高对人名、地名及组织机构等实体的识别精度。 该数据集用于训练命名实体识别模型的数据集,包含六种标签:人名、地名、时间、组织机构名、公司名及产品名,并遵循BIO编码规则。此数据集中包括三个文件——训练集、测试集与验证集。以下为样例内容: 以 O 及 O 康 B-COMPANY_NAME 宽 I-COMPANY_NAME 为代表 的 国 外 专 利 产 品 低 毒 杀 虫 剂 吡 B-PRODUCT_NAME 虫 I-PRODUCT_NAME 茚 I-PRODUCT_NAME 和 O 生 物 农 药 阿 B-PRODUCT_NAME 维 I-PRODU
  • NLP序列标注工具YEDDA
    优质
    YEDDA是一款专为中文自然语言处理设计的高效命名实体识别序列标注工具。它能够精准地从文本中提取出人名、组织机构和地理位置等关键信息,广泛应用于机器翻译、智能问答等领域。 中文NLP序列标注工具使用CRF进行命名实体识别(NER),可以自动标注数据集以生成语料库,并支持BIO或BMES两种标注体系。
  • NER数据
    优质
    中文NER(Named Entity Recognition)数据集是一套专门用于识别中文文本中人名、地名和组织机构等命名实体的语料库,旨在促进自然语言处理技术的发展。 中文命名实体识别数据集非常实用。它涵盖了组织、机构和个人三个方面的实体。
  • Weibo数据
    优质
    本数据集为中文微博文本设计,旨在进行命名实体识别研究,涵盖人名、地名与组织名等类别,促进自然语言处理技术的发展。 自然语言处理的子任务命名实体识别在中文数据集方面非常全面。
  • NLP战:电子病历项目源码
    优质
    本项目专注于开发和实现中文电子病历中的命名实体识别技术,通过分析医学文本提取关键信息,提升医疗数据分析效率。项目源码公开,适合自然语言处理爱好者研究学习。 本项目是在一个开源中文电子病历数据集上进行的命名实体识别(NER)任务的源码实现,涵盖了数据预处理、BERT-BiLSTM模型构建以及训练与测评的完整流程。本人撰写了一篇博客详细介绍了该项目的内容,并且源代码中注释详尽,易于理解。
  • zh-nlp-demo: 本上NLP应用示,包括本分类、情感分析和
    优质
    zh-nlp-demo是一款展示中文自然语言处理技术的应用程序,涵盖文本分类、情感分析及命名实体识别等多个方面,助力用户深入理解与操作中文文本数据。 本项目是自然语言处理(NLP)在中文文本上的简单应用示例,包括文本分类、情感分析及命名实体识别等功能。其中的文本分类数据集采用了头条网站标题及其对应文章类别的信息。构建的是BiLSTM+Attention模型结构,并具体如下: 定义了一个创建分类模型的函数`create_classify_model`,该函数接受以下参数:输入的最大长度(max_len)、词汇表大小(vocab_size)、嵌入维度(embedding_size)、隐藏层单元数(hidden_size)和注意力机制的尺寸(attention_size),以及类别数量(class_nums)。在创建模型时首先定义了一个输入层(inputs),接着通过Embedding层将文本转换为数值表示,函数代码如下: ```python def create_classify_model(max_len, vocab_size, embedding_size, hidden_size, attention_size, class_nums): # 定义输入层 inputs = Input(shape=(max_len,), dtype=int32) # Embedding层 x = Embedding(vocab_size, embedding_size)(inputs) ```
  • WeiboNER:微博_NER_
    优质
    WeiboNER是一款专门针对新浪微博文本设计的命名实体识别系统,用于准确地从微博内容中抽取人名、组织名和地名等信息,助力自然语言处理任务。 中文NER常用的数据集包括在社交媒体微博上收集到的大量数据。
  • MSRA(NER)数据
    优质
    MSRA NER是微软亚洲研究院开发的一个汉语命名实体识别数据集,包含大量标注的人名、地名和组织机构名称,广泛应用于自然语言处理研究。 我们收藏的二十余册出版物来自晋察冀抗日根据地(1937年—1945年)。
  • 数据-5万余条标注信息-.rar
    优质
    本资源为中文命名实体识别的数据集,包含超过5万条详细标注的信息,适用于自然语言处理领域的研究与开发。 自然语言处理数据集包含5万多条中文命名实体识别的标注数据。