
自动Sarcasm检测:基于Ghosh的Twitter数据集与Khodak的Reddit注释数据集的讽刺识别
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究利用Ghosh的Twitter及Khodak的Reddit数据集,开发了一种自动检测讽刺言论的模型,旨在提高社交媒体上讽刺语言的识别精度。
自动刮伤检测Twitter数据集(Ghosh)和Reddit注释数据集(Khodak)中的讽刺检测项目旨在对Twitter数据和Reddit评论进行讽刺分类。该项目使用了两个数据集:Twitter数据集(Ghosh) 和 Reddit评论数据集(Khodak)。资料夹结构如下:
- Twitter_dataset_Ghosh
- i) 代码:包含3个notebook文件 (.ipynb)
- ii) 资源:包含所有原始数据、预处理后的数据以及中间状态的输出
- Reddit_dataset_Khodak
- i) 代码:包含3个notebook文件 (.ipynb)
- ii) 资源:包含所有原始数据、预处理后的数据以及中间状态的输出
项目运行所需依赖项包括:
- 情感力量工具
- 凯拉斯 (Keras)
- 张量流 (TensorFlow)
- 瘫痪科学 (SciPy)
- Gensim
- 斯克莱恩海生(Scikit-learn)
- Matplotlib
- 大熊猫 (Pandas)
Ghosh数据集的处理流程:
原始Twitter数据使用twitter_pre进行了预处理。
全部评论 (0)
还没有任何评论哟~


