
包含500万条微博语料库,并以CSV格式呈现。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
字段:weiboId, 表明微博的唯一标识符,用于区分不同的微博内容。attitudes_count, 指示微博获得的点赞数量,反映了用户对该微博的认可程度。bmiddle_pic, 记录微博中使用的中间尺寸图片链接,用于展示视觉内容。comments_count, 统计微博收到的评论数量,体现了用户的互动活跃度。created_at, 存储微博发布的时间戳,表明了微博的发布时间。favorited, 表示是否被用户收藏,表明了用户对该微博的重视程度。geo, 包含微博发布地理位置的信息,用于分析用户行为和地域分布。id, 是微博在数据库中的唯一标识符,用于内部管理和查询。idstr, 提供一个字符串形式的唯一标识符,包含更多信息以备查阅。in_reply_to_screen_name, 如果该微博是回复的,则记录回复用户的屏幕名。in_reply_to_status_id, 如果该微博是回复的,则记录被回复微博的状态ID。in_reply_to_user_id, 如果该微博是回复的,则记录回复用户的ID。mid, 是内部使用的消息ID,用于追踪和管理消息流。mlevel, 表示消息级别或优先级,可能影响消息的处理方式。text, 存储微博的内容文本信息,是构成微博核心信息的关键部分。source, 记录获取该数据源的信息类型或渠道,例如“Weibo”或“API”。
全部评论 (0)
还没有任何评论哟~


