
利用中文分词和去停用词技术,可用于科研项目,并采用Python代码实现。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
请将包含需要进行分词处理和停用词去除的文件至allData文件夹内的originalData文件夹中,随后按照顺序执行1.cutWord.py和2.removeStopWord.py这两个Python脚本。执行完毕后,allData文件夹下会生成一个名为afterRemoveStopWordData的文件夹,其中存放的就是经过分词处理并已去除停用词的文件。
全部评论 (0)
还没有任何评论哟~


