
NLP-Course: CSC NLP课程任务
5星
- 浏览量: 0
- 大小:None
- 文件类型:ZIP
简介:
NLP-Course: CSC NLP课程任务 是一门专注于自然语言处理技术与应用的核心课程,旨在通过一系列精心设计的任务和项目,帮助学生深入理解并掌握文本数据处理的关键技能。
单元测试(解析器成功“获取”的文本示例):
语料库结果:F1 = 0.985,精度 = 0.988,召回率 = 0.982,准确度 = 0.985,tp = 8205955,fp = 96511,fn = 145627
hw01_data 结果:F1 = 0.980,精度 = 0.975,召回率 = 0.986,准确度 = 0.980,tp = 85468,fp = 2172,fn = 1170
由于错误的框架,在大数据上有很多问题。我禁用了引号识别功能,因为这会导致很多问题。目前尚不清楚缩写后的大写字母应该如何处理。
在我的集合(共包含40个文档)中,卡方检验只给出了3个属性,这还不够充分。尝试对所有属性进行分类在SMO算法中的准确率仅为20%左右。我没有参考他人的工作,而是开始改进功能。
全部评论 (0)
还没有任何评论哟~


