
关于三种中文分词方法在Python中的性能比较及评分分析【100011006】
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本文通过实验对比了三种中文分词算法在Python环境下的性能,并对其进行评分分析。报告编号:100011006。
本学期,在自然语言处理课程的学习过程中,我们探讨了多种中文分词算法,并在本次大作业中选择了其中的三种:正向最大匹配、逆向最大匹配以及双向最大匹配;基于统计的Uni-Gram模型;隐马尔可夫(HMM)统计模型。首先我们会根据课堂所学内容编写这三类模型的代码,然后使用PKU词典提供的训练集和测试集数据来评估这些算法在召回率、F1分数及准确度这三个方面的性能表现,并将结果进行比较后输出,最终挑选出最佳的表现作为实验结论。
全部评论 (0)
还没有任何评论哟~


