
基于关键词抽取技术的高效文本分类系统
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究提出了一种利用关键词抽取技术实现高效文本分类的方法,能够显著提高大规模文档处理的速度与准确性。
关键词提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键步骤。该系统从语言的词性角度出发,对传统的最大匹配分词法进行了改进,并提出了一种基于动词、虚词和停用词三个较小词汇库的快速分词方法(FS)。同时利用TFIDF算法筛选出关键词,以实现将Web文档进行快速有效的分类。实验结果表明,在不影响分类准确率的情况下,该方法能够显著提高分类速度。关键词包括:计算机应用;中文信息处理;关键词提取;Web文档分类。
全部评论 (0)
还没有任何评论哟~


