Advertisement

Chinese-Names-Corpus:中文人名语料库及生成工具。涵盖姓氏、名字、称呼,包括日本人名和英译人名。...

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
Chinese-Names-Corpus是一个全面的中文人名资源库与生成器,包含丰富的中国姓氏、名字以及不同语言环境下的人名表达方式,如日语姓名及其英语翻译版本。 中文人名语料库(Chinese-Names-Corpus)业余项目“萌名NameMoe”是一个基于语料库技术的取名工具的副产品。其手机网页测试版不定期更新,只删词不加词,并可用于中文分词和人名识别。 该语料库包含两个主要部分:中文常见人名字典数据量为120万条记录,来源于亿级的人名数据库;而古代人名词典则有25万条目。两者都经过了初步的数据清洗工作,但可能仍存在少量错误案例。 此外还新增了一个基于该语料库生成新名称的功能模块,并且提供了一份包含大约一千个中文姓氏的字典文件,这些数据同样是从大型的人名数据库中提取出来的并已进行过清理处理。另一份关于称呼关系的数据集则包含了约五干条记录,主要用于表示人与人间的关系。 请勿将本库打包上传到其他网站以赚取积分,并且如果已经存在此类情况,请配合删除相关文件或数据。感谢您的理解和支持!

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Chinese-Names-Corpus。...
    优质
    Chinese-Names-Corpus是一个全面的中文人名资源库与生成器,包含丰富的中国姓氏、名字以及不同语言环境下的人名表达方式,如日语姓名及其英语翻译版本。 中文人名语料库(Chinese-Names-Corpus)业余项目“萌名NameMoe”是一个基于语料库技术的取名工具的副产品。其手机网页测试版不定期更新,只删词不加词,并可用于中文分词和人名识别。 该语料库包含两个主要部分:中文常见人名字典数据量为120万条记录,来源于亿级的人名数据库;而古代人名词典则有25万条目。两者都经过了初步的数据清洗工作,但可能仍存在少量错误案例。 此外还新增了一个基于该语料库生成新名称的功能模块,并且提供了一份包含大约一千个中文姓氏的字典文件,这些数据同样是从大型的人名数据库中提取出来的并已进行过清理处理。另一份关于称呼关系的数据集则包含了约五干条记录,主要用于表示人与人间的关系。 请勿将本库打包上传到其他网站以赚取积分,并且如果已经存在此类情况,请配合删除相关文件或数据。感谢您的理解和支持!
  • 数据:虚拟集合
    优质
    《姓名与人名数据库:虚拟姓名集合》是一部全面收录各种虚构人物名字的参考书,为小说创作、角色扮演游戏及各类创意项目提供无限灵感来源。 虚拟姓名用于测试数据时更美观,共有152239条中英文姓名,分为记事本段落件与SQL文件,选择其一使用即可。
  • 大全,170万以上常用
    优质
    《中国人名大全》收录超过一百七十万个中国常用姓名,是了解和选择中文名字的理想工具书。 中国姓名大全收录了170多万个常用的中国人名。
  • Company-Names-Corpus:公司与机构含公司简、缩写、品牌词企业,适用于分词机构实体识别等应用场景。
    优质
    Company-Names-Corpus是一个全面收录了各种类型的企业名称及相关简称的中文语料库,特别适合用于提升文本处理技术中的分词与命名实体识别精度。 公司名语料库(Company-Names-Corpus)是业余项目“萌名NameMoe”——一个基于语料库技术的取名工具的副产品。萌名手机网页测试版已上线,欢迎体验并提供反馈意见。此版本不定期更新,并承诺只删词不加词。 该语料库可用于中文分词和机构名称识别。以下是具体信息: - 公司名语料库(Company-Names-Corpus)包含480万条数据,来源于多个词典汇总。 - 机构名语料库(Organization-Names-Corpus)有110万条记录,同样来自多来源汇总。 - 公司简称、品牌词等(Company-Shorter-Form)则包括28万项。 以上所有语料均已清洗过,但仍可能存在一些错误案例。文件以压缩包形式提供是因为未压缩的原始数据大小约为200M,而经过压缩后只有约30M左右,便于传输和使用。
  • 用户
    优质
    英语用户名称生成器是一款便捷的应用程序或网站工具,专门帮助用户创建具有创意和个性化的英文用户名。它能够结合流行趋势和个人喜好,提供无限组合的选择,让你在众多平台中脱颖而出。 随机生成的大量英文字符通常用于注册账号或邮箱地址。
  • 器:支持13种不同言的创造
    优质
    这是一款功能强大的名字生成器,能够提供包括中文、英文等在内的十三种语言名字创意方案,帮助用户轻松找到满意的名字选择。 名称生成器支持13种不同的语言。 可用的语言包括:阿拉伯语、中文、荷兰语、英语、法语、德语、印地语、意大利语、日语、韩语、葡萄牙语、俄语和西班牙语。 用法: // 初始化生成器,选择特定语言 NameGenerator nameGenerator = new NameGenerator(NameGenerator.ENGLISH); // 获取随机名字 String randomname = nameGenerator.nextName(); // 获取女孩的名字 String girlname = nameGenerator.nextName(Names.FEMALE); // 获取男孩的名字 String boyname = n
  • 随机
    优质
    《中文姓名随机生成》是一款专为用户快速获取具有中国传统特色的名字而设计的应用程序。通过融合丰富的汉字与独特的命名规则,该工具能够创造无数个新颖且富有文化内涵的中文名字,无论是用于个人使用、小说角色设定还是企业品牌命名,都能提供无限灵感和选择。 该资源适用于VFP软件程序,在百家姓和常用字的基础上自动生成名字,可用于创建数据表时生成一系列的名字。
  • 器:随机创建
    优质
    中文名生成器是一款能够帮助用户快速生成具有中国特色的名字的随机名字创建工具,适用于各种场景。 中文名随机生成器 ## API 随机([familyName]) ### 在 Node.js 中使用 安装 npm 包:`npm install chinese-name` 用法: ```javascript var ChineseName = require(chinese-name); console.log(ChineseName.random()); ``` ### 在浏览器中使用 包括 index.js 文件,例如: 用法: ```javascript var name = ChineseName.random(); alert(name); ```
  • 优质
    姓名生成器是一款便捷的小工具应用,能够快速随机生成各种风格的中文名字,适用于起名、游戏角色命名等多种场景。 姓名批量生成工具可以用于生成四个字以内的名字。
  • 批量转换
    优质
    本工具是一款高效的中英文姓名互转软件,能够快速准确地将中文姓名转换为拼音或英文形式,并支持多种转换规则和格式输出。 1. 将需要转换的中文名字拷贝到文本段落件(如从Excel表格的一列复制粘贴),每个名字占一行。 2. 姓名之间不允许有空格,但允许姓名前后出现空格。 3. 目标输出文件可以指定名称,如果不指定,则会自动生成一个与源文件同名的“源文件名_en.txt”格式的目标文件,并保存在相同目录下。 4. 如果目标文件已存在,其原有内容会被覆盖。 5. 选择英文名字格式进行转换后确定操作。 6. 目标输出文件生成每个名字占一行,顺序保持与输入时一致。 7. 内置3500常用汉字的翻译功能,对于这些字之外的文字会以三个问号???表示,并给出一个常见发音作为多音字处理。