
中文分词所使用的词典文件
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目包含多种中文分词任务中常用的词典资源,旨在为自然语言处理提供基础支持,提升文本处理精度。
我用几天时间从各大知名分词软件中提取了中文词组,并对这些词组进行了整理和排序,保存为三个txt文件:精简版(74248个词组)、常用版(118021个词组)以及全部版本(222685个词组)。此外还有一个包含常用标点符号的文件。
全部评论 (0)
还没有任何评论哟~


简介:
本项目包含多种中文分词任务中常用的词典资源,旨在为自然语言处理提供基础支持,提升文本处理精度。
我用几天时间从各大知名分词软件中提取了中文词组,并对这些词组进行了整理和排序,保存为三个txt文件:精简版(74248个词组)、常用版(118021个词组)以及全部版本(222685个词组)。此外还有一个包含常用标点符号的文件。


