
中文文本分词的常见停用词表
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目提供一份针对中文文本分词任务设计的常用停用词列表,旨在帮助自然语言处理和信息检索等领域的研究者提高文本预处理效率。
在使用jieba进行分词处理时,通常需要加载停用词表来优化结果。常见的几种停用词表包括:中文通用停用词表(cn_stopwords.txt)、哈工大版本的停用词表(hit_stopwords.txt)、百度提供的停用词表(baidu_stopwords.txt)以及四川大学机器智能实验室发布的停用词库(scu_stopwords.txt)。
全部评论 (0)
还没有任何评论哟~


