
从东方财富网旗下股吧抓取指定股票当日用户评论并存入MySQL数据库后...
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本项目旨在开发一个系统,用于自动从东方财富网特定股票板块抓取实时用户评论,并将这些数据整理后存储至MySQL数据库中,便于后续分析和研究。
项目主要使用第三方库snownlp、tushare、pandas、numpy和matplotlib来实现从东方财富网旗下的股吧论坛爬取数据,并进行量化分析以评估情绪指数与股票价格涨幅的相关性。
功能概述:
1. 通过传入某只股票代码(例如“zssh000001”代表上证指数),函数`data(share_code)`将计算并返回该股票当天的情绪指数。
2. 情绪指数的生成基于对股吧论坛中用户评论的情感分析,随后数据被存储在云端数据库内以便进一步分析和可视化操作。
执行流程:
- 输入目标股票代码
- 清除前一天的数据以确保准确性
- 爬取东方财富网当天关于该股票的所有股民评论,并进行必要的清洗与过滤处理后存入MySQL数据库中。
- 利用金融情感计算模型对这些文本数据进行分析,量化出积极和消极情绪因子(分别记为pos和neg)。
- 计算市场总体的情绪得分(score),公式设计旨在捕捉市场的整体倾向性以及评论数量的影响。
具体算法实现:
采用snownlp库来进行中文自然语言处理任务。根据给定的规则判定评论的情感方向,并通过特定方式计算出积极或消极情绪因子值,最终结合当日总评论数来得出一个综合反映市场情绪波动程度和方向的情绪指数。
项目特别关注于如何利用现有资源(如开源工具)快速而准确地量化金融市场中的非结构化数据——即用户生成的内容。这种分析为投资者提供了一种新颖的方式去理解市场动态,并可能帮助发现价格变动背后的驱动因素之一:公众情感变化对股票的影响。
全部评论 (0)
还没有任何评论哟~


