Advertisement

26.9万条企业名称缩写,适用于分词或实体统一处理

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本数据库包含26.9万条企业名称缩写记录,旨在帮助企业进行高效准确的文本分词及实体识别工作,促进数据处理与分析效率。 26.9万条公司名字简称,可用于分词或实体归一处理。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 26.9
    优质
    本数据库包含26.9万条企业名称缩写记录,旨在帮助企业进行高效准确的文本分词及实体识别工作,促进数据处理与分析效率。 26.9万条公司名字简称,可用于分词或实体归一处理。
  • Company-Names-Corpus:公司与机构语料库。包含公司简、品牌中文和机构识别等应场景。
    优质
    Company-Names-Corpus是一个全面收录了各种类型的企业名称及相关简称的中文语料库,特别适合用于提升文本处理技术中的分词与命名实体识别精度。 公司名语料库(Company-Names-Corpus)是业余项目“萌名NameMoe”——一个基于语料库技术的取名工具的副产品。萌名手机网页测试版已上线,欢迎体验并提供反馈意见。此版本不定期更新,并承诺只删词不加词。 该语料库可用于中文分词和机构名称识别。以下是具体信息: - 公司名语料库(Company-Names-Corpus)包含480万条数据,来源于多个词典汇总。 - 机构名语料库(Organization-Names-Corpus)有110万条记录,同样来自多来源汇总。 - 公司简称、品牌词等(Company-Shorter-Form)则包括28万项。 以上所有语料均已清洗过,但仍可能存在一些错误案例。文件以压缩包形式提供是因为未压缩的原始数据大小约为200M,而经过压缩后只有约30M左右,便于传输和使用。
  • 包含四十的汉语库,中文
    优质
    这是一款拥有四十万词条的强大汉语词库,专为提高中文文本的分词准确性而设计。无论是语言学家还是软件开发者,都能从中受益,提升其相关研究与应用效果。 文本段落件包含四十万条独特的汉语词汇,已经确认无误。每行一个词,并且没有重复的词汇,适用于中文分词任务。
  • EndNote中期刊的参考文献
    优质
    本文将介绍如何在EndNote中正确输入和管理期刊名称及其缩写,并解决相关参考文献格式问题。 可以将参考文献中的期刊名称及其缩写制作成endnote可导入的.txt格式文件,方便撰写论文时使用。这些缩写遵循了两个不同的标准,在导入后均能清晰显示。
  • 中文汇表(,含53143,全面!)
    优质
    这本中文词汇表包含53143个词条,专为分词设计,内容详尽丰富,是学习和使用中文的理想工具。 中文词表包含53143个词条,适用于分词任务。
  • 中文库,包含20(际为196千)
    优质
    本词库收录超过19万个词条,旨在提供全面、准确的中文词汇支持,适用于自然语言处理和信息检索等应用场景。 我整理了一个包含20万词汇(其中196,000个词)的中文分词词库,可以用于进行文本或文章的拆词工作。
  • 30的中文
    优质
    《30万词条的中文分词词典》是一部全面覆盖现代汉语词汇的大型工具书,包含丰富且实用的词语条目,为语言学习者和研究者提供精准的语言分析与支持。 这是一个30万字的中文分词词典的一部分,来源于网站码农场提供的资料。需要注意的是,该词典并非最新版本,仅供参考使用。
  • 中文库含30
    优质
    本项目包含超过30万个词条的中文分词词库,旨在提升文本处理与自然语言理解系统的准确性和效率。 格式: 序号 单词 词频 词性 请参考相关标准:http://ictclas.org/ictclas_docs_003.html 和 http://hi.baidu.com/drkevinzhang/blog/category/ictclas 去掉链接后的内容如下: 格式: 序号 字 词频 词性 请参考相关标准。
  • 个性化昵+50+网数据
    优质
    网名灵感库,汇聚50万个性网名,助你轻松找到独一无二的专属昵称,展现自我独特魅力。 可以下载使用超过50万条网络名称的数据。这些数据具有固定格式,可以直接导入数据库进行迁移。如有需要,也可以对格式进行调整以适应不同需求。
  • 电商搜索专库涵盖高频汇及余品牌
    优质
    本词库专为电商搜索优化设计,收录大量热门词条与超过万种品牌的官方命名,助力精准匹配用户需求。 我们提供了一份包含四十万条商品品牌及分类词库的资源,可以直接用于电商搜索。