中文Weibo命名实体识别数据集

5星

浏览量: 0

大小:None

文件类型：None

简介：
本数据集为中文微博文本设计，旨在进行命名实体识别研究，涵盖人名、地名与组织名等类别，促进自然语言处理技术的发展。自然语言处理的子任务命名实体识别在中文数据集方面非常全面。

全部评论 (0)

还没有任何评论哟~

客服

中文Weibo命名实体识别数据集

优质

本数据集为中文微博文本设计，旨在进行命名实体识别研究，涵盖人名、地名与组织名等类别，促进自然语言处理技术的发展。自然语言处理的子任务命名实体识别在中文数据集方面非常全面。

中文NER命名实体识别数据集

优质

中文NER（Named Entity Recognition）数据集是一套专门用于识别中文文本中人名、地名和组织机构等命名实体的语料库，旨在促进自然语言处理技术的发展。中文命名实体识别数据集非常实用。它涵盖了组织、机构和个人三个方面的实体。

命名实体识别的数据集.rar

优质

本资源包含一个用于训练和测试命名实体识别模型的数据集，适用于自然语言处理任务，帮助提高对人名、地名及组织机构等实体的识别精度。该数据集用于训练命名实体识别模型的数据集，包含六种标签：人名、地名、时间、组织机构名、公司名及产品名，并遵循BIO编码规则。此数据集中包括三个文件——训练集、测试集与验证集。以下为样例内容：以 O 及 O 康 B-COMPANY_NAME 宽 I-COMPANY_NAME 为代表的国外专利产品低毒杀虫剂吡 B-PRODUCT_NAME 虫 I-PRODUCT_NAME 茚 I-PRODUCT_NAME 和 O 生物农药阿 B-PRODUCT_NAME 维 I-PRODU

MSRA（NER）命名实体识别数据集

优质

MSRA NER是微软亚洲研究院开发的一个汉语命名实体识别数据集，包含大量标注的人名、地名和组织机构名称，广泛应用于自然语言处理研究。我们收藏的二十余册出版物来自晋察冀抗日根据地（1937年—1945年）。

中文实体名称识别数据集

优质

本数据集专注于提供大规模、高质量的中文文本语料，旨在促进对中文实体名称（如人名、地名等）的自动识别研究与应用开发。 BIO标签集用于标记文本中的命名实体。其中，“B-PER”表示人名的首字，“I-PER”表示人名字中间非首字；“B-LOC”代表地名的起始字符，而“I-LOC”则标识该地名中除开头外的部分文字。“B-ORG”的使用场景是组织机构名称中的第一个汉字，“I-ORG”用于标记这些实体名称内的后续部分。此外，“O”标签表示对应的文字不属于任何命名实体的一部分。

命名实体识别训练数据集.7z

优质

命名实体识别训练数据集.7z包含用于训练和测试命名实体识别系统的标注文本数据。这些数据有助于提高对人名、地名等实体的自动识别精度。 NER（命名实体识别）涉及数据集的读取与解析工具，并提供详细的数据解释文档以及数据下载链接。

中文命名实体识别数据集（MSRA+人民日报+Boson）

优质

本数据集整合了MSRA、人民日报及Boson三个来源的中文文本，涵盖大量人名、地名、组织名等实体标签，适用于训练高质量的中文命名实体识别模型。适合作为命名实体识别的补充语料包括微软亚洲研究院MSRA：46365条语料、人民日报：23061条语料以及Boson: 2000条语料，这些数据都已经标注过，非常实用，适合新手作为模型练习使用。

基于Bert+BiLSTM+CRF的实体命名识别数据集

优质

本数据集采用BERT、BiLSTM和CRF模型结合的方法进行训练，旨在提高实体命名识别任务中的准确性和效率。对于这篇文章的数据集，大家可以自行下载使用。

CONLL数据集的命名实体识别-附件资源

优质

本资源提供CONLL数据集相关的命名实体识别材料，包括训练文本、测试集及标签规范等，适用于自然语言处理研究与实践。命名实体识别conll数据集提供了相关的附件资源。

中文命名实体识别数据集-5万余条标注信息-.rar

优质

本资源为中文命名实体识别的数据集，包含超过5万条详细标注的信息，适用于自然语言处理领域的研究与开发。自然语言处理数据集包含5万多条中文命名实体识别的标注数据。

是否确定退出登录?

中文Weibo命名实体识别数据集

全部评论 (0)