
停用词(stopwords)可用于词云图、情感分析、文本挖掘和主题提取等功能。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
停用词是指在信息检索与自然语言处理中会被忽略的一类高频出现但缺乏实质意义的词汇。它们广泛应用于生成词云图,进行情感分析,执行文本数据挖掘以及提炼文章的主题等场景。
共有四种常用的停用词库:1. 中文停用词表(cn_stopwords.txt);2. 哈工大停用词表(hit_stopwords.txt);3. 百度停用词表(baidu_stopwords.txt);4. 四川大学机器智能实验室的停用词库(scu_stopwords.txt)。这些词库可用于生成词云图、进行情感分析、文本挖掘和提取文本主题等研究。
全部评论 (0)
还没有任何评论哟~


