
中文哈工大、百度和川大的合并停用词表
5星
- 浏览量: 0
- 大小:None
- 文件类型:TXT
简介:
该文档提供了中文哈工大、百度及川大三所高校开发的停用词表资源。这些停用词表适用于自然语言处理任务,旨在帮助提升文本分析效率与准确性。
停用词表由中文停用词表(cn_stopwords.txt)、哈工大停用词表(hit_stopwords.txt)、百度停用词表(baidu_stopwords.txt)以及四川大学机器智能实验室的停用词库合并而成,包含2690个停用词。编码格式为utf-8,可以直接在Python中读取使用。
全部评论 (0)
还没有任何评论哟~


