
Chinese-Names-Corpus:中文人名语料库及生成工具。涵盖姓氏、名字、称呼,包括日本人名和英译人名。...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
Chinese-Names-Corpus是一个全面的中文人名资源库与生成器,包含丰富的中国姓氏、名字以及不同语言环境下的人名表达方式,如日语姓名及其英语翻译版本。
中文人名语料库(Chinese-Names-Corpus)业余项目“萌名NameMoe”是一个基于语料库技术的取名工具的副产品。其手机网页测试版不定期更新,只删词不加词,并可用于中文分词和人名识别。
该语料库包含两个主要部分:中文常见人名字典数据量为120万条记录,来源于亿级的人名数据库;而古代人名词典则有25万条目。两者都经过了初步的数据清洗工作,但可能仍存在少量错误案例。
此外还新增了一个基于该语料库生成新名称的功能模块,并且提供了一份包含大约一千个中文姓氏的字典文件,这些数据同样是从大型的人名数据库中提取出来的并已进行过清理处理。另一份关于称呼关系的数据集则包含了约五干条记录,主要用于表示人与人间的关系。
请勿将本库打包上传到其他网站以赚取积分,并且如果已经存在此类情况,请配合删除相关文件或数据。感谢您的理解和支持!
全部评论 (0)
还没有任何评论哟~


