本资源包含使用Python通过情感词典和机器学习技术对新闻及微博评论进行情感分析的全套资料,包括源代码、详尽文档、数据集以及细致的代码注释。
<项目介绍>Python基于情感词典和机器学习对新闻和微博评论的情感分析源码+项目说明+数据集+代码注释.zip该资源内包含的是个人的毕业设计项目的完整源码,所有代码均已测试成功后上传,答辩评审平均分达到94.5分。此资源适合计算机相关专业(如人工智能、通信工程、自动化、软件工程等)的学生和老师或企业员工下载使用,既可作为学习材料也可为实际项目提供参考。如果基础较好,还可以在此基础上进行修改以实现更多功能。
计算社会学:基于NLP技术的新冠疫情下的社会心态研究此版本是公开发布的源码而非开发环境中的版本。
## 文件结构
```
│ LICENSE
│ README.md
├─Analyze # 分析数据的过程中所使用的所有代码
├─Data # 原始数据以及处理过后的所有数据
├─Report # 报告相关源文件及最终报告成品
└─Spyder # 爬虫代码
```
该目录结构经过事后整理,并非工作时的实际状态,因此在运行前需要对路径进行适当修改。原始报告中的敏感信息已删除。
### Data 目录下文件结构
`Data` 文件夹包含6个子文件夹(stage0 - stage6),每个阶段的内部文件如下:
```
│ COVkeywords-Stage-.json # 人工筛选后的疫情相关关键词
│ COVkeywords-Stage.json # 未经筛选的疫情关键词
│ keywords-Stage.json # 荔枝新闻中获取到的原始结果
│ ratioByDate.png # 当前阶段内每日疫情相关重点微博占比图
│ SaveTest.png # 疫情相关度分布拟合结果图1
│ SaveTest_Fit.png # 疫情相关度分布拟合结果图2
│ stageCOVWeibo.json # 该阶段内按时间排序的疫情相关重点微博
│ stageCOVWeiboByImportance.json # 按照疫情相关性进行排序的重点微博
| SaveTest-热度.png # 各项指标在当前阶段内的占比情况
│ stageInfo.json # 当前阶段的基本信息
│ weiboPolar.png # 疫情重点评论的情感极性图
│ weiboEmotion.png # 当前阶段疫情相关微博情感倾向图
├─YYYY-MM-DD-
└─其他日期文件夹
```
以上为项目的结构和内容概述,适合用于学习或项目参考。