
词库汇总已完成。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
该数据集的中文分词词库被组织成两个主要目录结构:首先,存在“中文分词词库汇总”目录,其中包含了十个独立的词汇表。每个文件名的命名方式清晰地表明了所包含词汇的数量,单位为“万”,例如“150.txt”表示该词库包含15万个词汇。其次,设置了“主流分词工具的词库”目录,其中收集了word、jieba、mmseg以及IK分词工具所使用的最新版本词库。值得注意的是,在分词过程中,仅仅依靠拥有更多词汇的词库并不一定能保证最佳效果。
全部评论 (0)
还没有任何评论哟~


