
爬虫结合机器学习的聚类分析
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
本研究探讨了运用爬虫技术收集数据,并通过机器学习算法进行聚类分析的方法。利用自动化工具获取大量信息后,借助先进的数据分析手段对资料进行分类和模式识别,旨在发现隐藏的数据结构与关联性,为用户提供更精准的信息检索服务或支持决策制定。
使用Python爬取虎扑体育网站中的球员数据(https://nba.hupu.com/stats/players),包括球员姓名、球队、得分、命中-出手次数及命中率、三分球命中数及其命中率、罚球命中数及其命中率、出场次数和上场时间等信息。对收集到的数据进行整理后存入MySQL数据库,并通过散点图和雷达图展示球员数据。在进行数据分析时,先对原始数据执行标准化处理,随后运用聚类算法将球员分为不同的组别。最终目标是生成包含六个簇的聚类结果。
全部评论 (0)
还没有任何评论哟~


