
大数据课程期末考核资料(含源码、PPT及实验文档).zip
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本资料包为大数据课程期末考核资源,内含课程所需的源代码、讲解用PPT以及实践操作文档,助力学生全面掌握大数据技术知识。
大数据Hadoop期末答辩的代码涉及基于贝叶斯的情感分析项目。该项目包含十个文件:Hadoop配置文档、总结文档、源代码、答辩PPT以及运行结果等。
具体要求如下:
编写Java程序,使其能够实现将“学号_上传文件.txt”数据集上传至HDFS,并在此基础上训练情感分类器的目的。在训练过程中应过滤掉包含非中文字符或完全由非中文字符组成的词语。保存模型参数到名为“学号_模型.txt”的文件中。
基于得到的模型参数(即Nc和Ncw,其中c表示情感标签类别,c∈{好评, 差评};w属于词典集合V,“学号_上传文件.data”数据集中的中文词汇),对测试集“test.txt”进行情感分类。将预测结果输出至名为“学号_预测结果.txt”的文本段落件中。“学号_预测结果.txt”每行包含一个条目的序号及该条目在“test.txt”中对应的预测的情感标签。
全部评论 (0)
还没有任何评论哟~


