
中国研究生数学建模竞赛获奖数据分析与可视化实例(使用R语言)
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本作品运用R语言对中国研究生数学建模竞赛历年获奖数据进行深度分析和可视化展示,旨在揭示竞赛趋势及特点。
收集了2004年(第一届)至今的中国研究生数学建模竞赛获奖数据,并使用R语言进行了数据处理和可视化的工作。这项工作的起因是作者及其队友在2015、2016、2017年的比赛中获得奖项后,对连续得奖的人数以及他们所在的省份和学校产生了好奇。因此,在2017年底开始收集这些数据并编写代码。
当时正值毕业之际,面临选择编程语言的问题时选择了R语言来完成这项工作,但当时的版本非常初级。在2018年9月台风“山竹”袭击广州深圳期间,作者决定重写这部分代码,并将其发布到GitHub上。由于新冠肺炎疫情,在无法去办公室的日子里阅读了Hadley大神的《Advanced R》一书并结合自己2019年的学习经验重新审视了自己的编程水平,从而再次修改了这个项目,并计划以后每年都会进行一次修订以见证自己的成长和进步。
关于项目的几个说明:中国研究生数学建模竞赛(原名全国研究生数学建模竞赛),自2004年开始举办,每年九月举行比赛并在十一月至十二月公布获奖结果。官方公布的获奖名单包括一等奖、二等奖、三等奖以及成功参与奖,未被认定为作弊的参赛队伍通常都能获得成功参与奖;因此这里将所有提交并完成的比赛视为有效参赛。部分年份中没有提供题型信息,则默认该年度的所有题目均为N类。
对于“连续得奖”的概念,在不同版本中的算法可能有所差异,但基本原则是:由于数据限制,仅考虑同名且同一学校在连续几年内获得奖项的情况为真正的“连续获奖”。例如,“山大张三”如果2005年获奖后转学到中大的情况将不予计算。此外,不区分名字相同但实际上不同的人在同一所学校的情况;因此,“山大张三于2005年得奖而另一个也叫‘张三’的该校学生在次年获得奖项”,会被视为连续两次得奖。
如果“张三”分别在2005、2007和2008年获奖,则会将其看作是两个独立的连续获奖事件,即第一次为1连,第二次为另一次单独的2连。
全部评论 (0)


