
2023年全国大学生数据统计与分析竞赛(第二届)赛题及数据集.rar
5星
- 浏览量: 0
- 大小:None
- 文件类型:RAR
简介:
本资源为2023年第二届全国大学生数据统计与分析竞赛官方赛题及数据集,包含多个数据分析任务及其配套数据文件。
### 赛氪——2023年第二届全国大学生数据统计与分析竞赛
本次比赛设有A、B两道赛题。
#### 题目A:世界人口的预测与分析
**背景信息**
当前全球人口数量是二十世纪中期的三倍多。1950 年,全球人口约为 25 亿,到 2022 年 11月中旬已达到80亿,自2010年以来增加了10亿,而从1998年起则增长了20亿。预计未来30年内世界人口将增加近20亿,并在2050年达到约97亿,在本世纪中叶可能会接近104亿的峰值。印度是最近成为全球人口最多的国家,过去三十年间生育率较高、婴儿死亡率下降且年轻化特征明显。数据显示,印度的人口年龄中位数为 28 岁,三分之二的居民在35岁以下。尽管与中国的总人口相当,但其国土面积仅为中国三分之一左右,这使得消除贫困和饥饿以及建立完善的医疗及教育体系面临更大挑战。
附件提供了1950年至2021年全世界各国家的人口数据(populations.csv),包括不同年龄段的人口分布情况,请使用这些资料完成以下任务:
**赛题任务**
- **问题一:** 绘制全球从 1950 年至 2021 年总人口随时间变化的趋势折线图,分析整体趋势。统计所有国家在2011年至2021年间的人口增长率和增长人数,并列出人口增长率最高的前十个及最低的后十个国家名单以及相应的人口增减最多的前十名。
- **问题二:** 绘制不同国家于 2021 年总人口数量柱状图,给出排名靠前的十个最高总数和最末尾的十个最少总数国家名单。
- **问题三:** 挑选三个代表性较强的国家,绘制这三个国家各年龄段的人口分布直方图,并对比分析年龄结构特点。结合国情探讨影响不同年龄段人口比例的因素。
- **问题四:** 建立一个预测模型来估计到 2100 年底中国、印度和全球的总人口数,并对这些趋势进行深入解读。
#### 题目B:电影评分的大数据分析
大数据在商业运营中扮演着重要角色,同样地,在分析观众给电影打分时可为影视行业提供有价值的见解。随着电子媒介与数字技术的发展,网络影评成为了一种典型的数据化现象,例如评分、星级评价以及排名等信息。
这些数据因其便捷性和高效性成为了大多数观众评判一部影片的主要依据,并且也是衡量其市场表现的重要指标之一。相比文字和视频内容而言,通过大数据收集并统计观众的反馈意见能够更直观地反映他们的审美偏好及情感倾向。各大电影网站会利用评分、观影行为等信息来推断用户的喜好与需求,从而提供个性化的推荐服务。
然而需要注意的是,尽管影评数据可以为决策者提供参考依据以避免劣质影片的影响并发现优质作品,但它们并不能完全替代专业评价标准的权威性或公正性。因此,在利用这些评分时需谨慎对待,并将其作为辅助工具而非绝对评判准则使用。
附件包括了豆瓣排名前250名电影的数据(电影评分.csv)以及10605部影片的相关票房信息(电影票房.csv)。请根据提供的资料完成以下任务:
**赛题任务**
- **问题一:** 分析最受欢迎的电影类型,并找出在前250名中出现频率最高的导演和国家。
- **问题二:** 确定排名靠前的250部影片的主要上映年份,同时探讨评分与评论人数、国家、导演及类型之间的关联性。
- **问题三:** 收集相关数据以分析票房较高的电影主要属于哪些类型,并制作这些高票房作品的相关统计图表(如上映时间、总票房金额等)。
- **问题四:** 为2024年春节档计划推出新片的导演提供一份基于数据分析视角制定的战略建议,例如考虑影片的主题类型、题材选择、发行日期和票价策略等方面。
全部评论 (0)


