Advertisement

中文谣言新闻数据集

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:RAR


简介:
《中文谣言新闻数据集》是一项针对中文环境下的谣言信息进行收集、分类和标注的工作成果,旨在提供给研究者用于开发识别谣言的技术模型。 该数据来源于新浪微博的不实信息举报平台,并涵盖了从2009年9月4日至2017年6月12日期间共31,669条谣言。 具体字段解释如下: - rumorCode:每一条谣言的独特编码,可以通过此编码直接访问到相关的举报页面。 - title:被举报的谣言标题内容。 - informerName:发起举报者的微博用户名。 - rumormongerName:发布该谣言的微博用户名。 - rumorText:具体的谣言内容描述。 - visitTimes:该条谣言在平台上的浏览次数统计。 - result:关于此谣言的审核结果信息。 - publishTime:举报者提交举报的时间点。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 优质
    《中文谣言新闻数据集》是一项针对中文环境下的谣言信息进行收集、分类和标注的工作成果,旨在提供给研究者用于开发识别谣言的技术模型。 该数据来源于新浪微博的不实信息举报平台,并涵盖了从2009年9月4日至2017年6月12日期间共31,669条谣言。 具体字段解释如下: - rumorCode:每一条谣言的独特编码,可以通过此编码直接访问到相关的举报页面。 - title:被举报的谣言标题内容。 - informerName:发起举报者的微博用户名。 - rumormongerName:发布该谣言的微博用户名。 - rumorText:具体的谣言内容描述。 - visitTimes:该条谣言在平台上的浏览次数统计。 - result:关于此谣言的审核结果信息。 - publishTime:举报者提交举报的时间点。
  • Weibo23检测.zip
    优质
    本数据集包含大量来自中国社交媒体平台微博上的真实信息与谣言文本,旨在为研究者提供一个用于训练和评估机器学习模型在识别网络谣言能力的数据资源。 谣言检测数据集Weibo23包含了一系列用于识别微博平台上虚假信息的数据。该数据集旨在帮助研究人员开发更有效的算法和技术来对抗网络上的谣言传播。
  • 分类与处理系统:News-classification
    优质
    新闻分类与谣言处理系统: News-classification是一款先进的在线平台,运用AI技术对新闻进行智能分类,并有效识别和管理网络谣言,保障信息的真实性和准确性。 新闻分类系统(Python):使用爬虫(bs + rq)、数据处理(jieba分词)以及SVM分类器进行新闻分类。 谣言识别系统(Python):通过爬虫(bs + rq)、数据处理(jieba分词),结合贝叶斯分类器来识别谣言。详细内容可以参考我的博客。
  • 本分类的
    优质
    该数据集包含了大量经过人工标注的中文新闻文本样本,适用于训练和评估新闻文本分类模型的性能。 资源为新闻类的中文文本分类数据集,能够满足机器学习和文字分析方面的需求。
  • 利用Python爬取和分析关于型冠状病毒的“
    优质
    本项目旨在运用Python技术采集并分析有关新冠病毒的虚假信息,通过数据处理与可视化揭露谣言特征及传播规律。 一、爬取数据话不多说了,直接上代码(copy即可使用) ```python import requests import pandas as pd class SpiderRumor(object): def __init__(self): self.url = https://vp.fact.qq.com/loadmore?artnum=0&page=%s self.header = { User-Agent: Mozilla/5.0 (iPhone; CPU iPhone OS 11_0 like Mac OS X) AppleWebKit/604.1.38 (KHTML, like } ```
  • RCV1-2
    优质
    RCV1-2是广泛使用的英文新闻文本数据集,包含来自各大媒体的海量文章,适用于主题分类、文档聚类等任务的研究与开发。 RCV1-2 是一个路透社英文新闻文本及对应新闻类别数据集,可用于进行文本分类和其他自然语言处理任务。
  • RCV1-2
    优质
    RCV1-2是一款包含大量英文新闻文章的数据集,广泛应用于文本分类和信息检索的研究与实践。 RCV1-2 是路透社英文新闻文本及其对应新闻类别的数据集,适用于进行文本分类和其他自然语言处理任务。
  • 本分类
    优质
    这是一个包含各类新闻文章的数据集合,用于训练和测试机器学习模型进行自动化的新闻分类。该数据集包含了丰富的标签类别以及大量的文档内容。 该新闻数据集与一篇关于使用Python进行新闻文本分类的项目相对应,该项目代码详尽,读者可自行实现。
  • 20news
    优质
    20news新闻数据集包含来自20个不同主题类别的文档,是文本分类任务中的常用测试平台,广泛应用于自然语言处理研究领域。 20news是一个英文新闻数据集,包含20个类别共20000篇新闻文档,可用于进行文档分类和自然语言处理等任务。
  • NLPCC2016-
    优质
    本数据集为NLPCC2016会议提供的新闻文本集合,旨在支持自然语言处理任务的研究与开发。包含多种类型的中文新闻文章,适用于训练和评估相关算法模型。 NLPCC2016 数据集与流行的新闻数据集不同,它包含更多来自新浪微博的非正式文本。该数据集包括文件 NLPCC2016 新闻数据集_datasets.txt 和 NLPCC2016 新闻数据集_datasets.zip。