在疫情期间，利用情感词典和机器学习对新闻及微博评论进行情感分析。

5星

浏览量: 0

大小:None

文件类型：None

简介：
# 疫情背景下，利用情感词典和机器学习技术对新闻和微博评论进行情感分析研究# Data Science Basics in SWI, NJU, 2020-Fall> ## 计算社会学：基于自然语言处理技术的新冠疫情下的社会心态研究，由Cong Jin, YDJSIR, Sugar Xu于2020年SWI, NJU数据科学基础课程项目中完成。此版本为公开开源版本，而非开发环境使用的版本。## 文件结构： ```bash │ LICENSE │ README.md ├─Analyze # 包含用于数据分析的所有代码 ├─Data # 存储原始数据以及经过处理后的所有数据 ├─Report # 报告的相关源文件以及最终报告成品 └─Spyder # 爬虫代码 ``` 文件结构经过后续整理，与工作时目录状态有所不同，因此代码中涉及的路径需要进行适当调整后才能成功运行。原始报告中的数据在评分后已移除相关关键词。> ### `Data`目录下文件结构的详细描述：>> 该目录下共包含六个文件夹，分别命名为`stage0`至`stage6`>> ##### stage内文件目录结构：>> ```bash > │ COVkeywords-Stage-.json # 人工筛选后的疫情相关关键词 > │ COVkeywords-Stage.json # 未经筛选的疫情相关关键词 > │ keywords-Stage.json # 从荔枝新闻中提取的原始结果 > │ ratioByDate.png # 该阶段内每日疫情相关重点微博占比图表 > │ SaveTest.png # 疫情相关度分布拟合结果图1 > │ SaveTest_Fit.png # 疫情相关度分布拟合结果图2 > │ stageCOVWeibo.json # 该阶段内疫情相关重点微博（按时间先后排序） > │ stageCOVWeiboByImportance.json # 该阶段内疫情相关重点微博（按疫情相关度排序） > | SaveTest-热度.png # 各项热度指标占比图表 > │ stageInfo.json # 该阶段的基础信息 > │ weiboPolar.png # 疫情相关重点微博情感极性图表 > | weiboEmotion.png # 当前阶段的疫情相关微博情感倾向图表 ``` >> ##### 每个日期内的文件目录结构：>> ```bash YYYY-MM-DD > | jstvRAW.csv # 从荔枝新闻检索到的原始数据，包含疫情相关关键词信息。 | keywords.json # 荔枝新闻正文提取出来的关键词及其乘以100以后的TextRank权值。这是一个文本分析的结果。 | wordcloud.html # 由荔枝新闻生成的词云图。 | blog-Scored.json # 每条微博都有一个评估过的、反映其与新冠病毒相关的程度的数值。 | blog-COV.json # 筛选后的新冠病毒相关的微博内容。 | blogInfo.json # 当日博客的相关基础信息。 | weiboEmotion.png # 基于心态词典的当日疫情相关微博重点评论情感分析生成的雷达图。 └─weiboEmotion.csv # 基于心态词典的当日疫情相关微博重点评论情感分析的原始数据文件。 > ```

全部评论 (0)

还没有任何评论哟~

是否确定退出登录?

在疫情期间，利用情感词典和机器学习对新闻及微博评论进行情感分析。

全部评论 (0)