
2007年对几种常见文本分类算法的性能进行了比较和分析。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
经过对几种常见文本分类算法的特征进行了深入分析,并结合中文文本数据集和英文文本数据集,我们对这些算法的性能进行了全面而系统的评估。实验数据揭示了以下关键发现:在处理英文文本数据时,支持向量机展现出最佳的性能表现,但同时伴随着最大的时间开销;相比之下,贝叶斯算法则以其较快的速度脱颖而出。然而,当应用于中文文本数据时,由于中文分词所带来的挑战性,各算法的性能普遍低于在同等规模英文数据集上所达到的水平。值得注意的是,所有所考察的算法的性能均随着训练数据集规模的增加而呈现出逐步提升的趋势。
全部评论 (0)
还没有任何评论哟~


