Advertisement

利用Python开发的中文公司名称分词工具,涵盖地名、品牌名、行业词及公司名后缀识别功能

  • 5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
这是一款专为中文设计的公司名称分词工具,基于Python语言开发,具备高效准确的地名、品牌名、行业术语和公司常用后缀等多维度词汇识别能力。 运行评估脚本evaluate_file.py后,采用预测结果与GroundTruth完全一致的保守方法进行评估,得到以下结果: - 准确率:97.0% - 召回率:96.7%

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Python
    优质
    这是一款专为中文设计的公司名称分词工具,基于Python语言开发,具备高效准确的地名、品牌名、行业术语和公司常用后缀等多维度词汇识别能力。 运行评估脚本evaluate_file.py后,采用预测结果与GroundTruth完全一致的保守方法进行评估,得到以下结果: - 准确率:97.0% - 召回率:96.7%
  • Company-Names-Corpus:与机构语料库。包含、缩写、,适和机构实体等应场景。
    优质
    Company-Names-Corpus是一个全面收录了各种类型的企业名称及相关简称的中文语料库,特别适合用于提升文本处理技术中的分词与命名实体识别精度。 公司名语料库(Company-Names-Corpus)是业余项目“萌名NameMoe”——一个基于语料库技术的取名工具的副产品。萌名手机网页测试版已上线,欢迎体验并提供反馈意见。此版本不定期更新,并承诺只删词不加词。 该语料库可用于中文分词和机构名称识别。以下是具体信息: - 公司名语料库(Company-Names-Corpus)包含480万条数据,来源于多个词典汇总。 - 机构名语料库(Organization-Names-Corpus)有110万条记录,同样来自多来源汇总。 - 公司简称、品牌词等(Company-Shorter-Form)则包括28万项。 以上所有语料均已清洗过,但仍可能存在一些错误案例。文件以压缩包形式提供是因为未压缩的原始数据大小约为200M,而经过压缩后只有约30M左右,便于传输和使用。
  • 提取:此代码于从址字符串提取JIEBA列表实现精准提取...
    优质
    这是一款专为识别和抽取地址字符串中的中文公司名称而设计的工具,采用Jieba分词技术结合自定义的功能词列表,确保了高精度和高效性。适用于各类需要自动处理企业信息的应用场景。 公司名称提取代码旨在从地址字符串中提取中文公司名称。通过使用JIEBA和功能词列表,该代码能够识别出地址字符串中的确切公司名称。需要注意的是,此代码只能解析中文数据挖掘的内容。
  • 汇库大全,非常全面
    优质
    这本《公司名称词汇库大全》提供了丰富的命名建议和灵感来源,旨在帮助创业者轻松找到独具特色的公司名字。涵盖多个行业领域,内容详尽、实用性强。 公司名称词库大全提供了非常全面的资料。
  • 电商搜索专高频万余
    优质
    本词库专为电商搜索优化设计,收录大量热门词条与超过万种品牌的官方命名,助力精准匹配用户需求。 我们提供了一份包含四十万条商品品牌及分类词库的资源,可以直接用于电商搜索。
  • 5万个国内
    优质
    本书收录了超过五万个国内公司的名称,涵盖各个行业和规模,为创业者、市场分析师及企业研究者提供了丰富的参考资源。 需要5万个国内公司的名称样本,用于后台模拟批量生成公司名称的测试。
  • 500强首席执
    优质
    本列表收录了全球各大500强企业以及众多知名公司现任首席执行官的信息。每一位CEO都是其行业的领军人物,带领着各自的团队在全球市场上竞争和发展。 TOP500的首席执行官名单以及著名公司的首席执行官名单也被列出。该列表还包括与首席执行官(CEO)相对应的主要高管职位,例如常务董事(MD),并列出了所有兼任的职务。此外,提供了两个CSV文件,需要注意这些文件的格式。
  • 优质
    《中国地方名称词库》是一部全面收录中国各地行政区划、自然地理和人文地名信息的专业工具书,为研究与查询提供便利。 一个全面的全国地名词库对分词有很大帮助,尤其是在提取文章中的地名方面非常有用。
  • 各大磁共振序列对照表 MRI缩略
    优质
    本文提供了主要磁共振设备制造商常用序列名称的对照表,帮助读者理解不同品牌MRI术语之间的对应关系,便于跨平台操作和交流。 各大磁共振公司的序列名词对比表MRI Acronyms包括西门子(Siemens)、通用电气(GE)、飞利浦(Philips)、日立(Hitachi)和东芝(Toshiba)。
  • 金豆豆生成破解版
    优质
    金豆豆公司名称生成器破解版是一款被修改以去除限制、免费提供给用户的软件。它帮助用户快速生成具有创意和吸引力的公司名字,适合创业者和中小企业使用。请注意,使用破解软件可能涉及版权问题,请谨慎选择合法授权版本。 公司起名:解压即用