Advertisement

Udacity DSND Arvato: 数据科学纳米学位的最终项目

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
本简介介绍的是Udacity数据科学纳米学位课程中的一个实际项目——DSND Arvato。该项目由学员运用机器学习技术来解决Arvato公司提出的营销挑战,旨在提升学生的实战能力和解决行业问题的能力。 毕业项目:为Arvato Financial Services金融服务公司实现一个顾客分类报告。这是优达学城数据科学家纳米学位的毕业项目。 开发环境: - Python 3.7.4 - conda 4.8.3 - numpy 1.18.1 - pandas 1.0.2 - scikit-learn 0.22.1 - scikitplot 0.3.7 文件说明: - imgs:博文使用的图片。 - kaggle_result.csv:提交kaggle的结果文件。 - rfc_result.csv:通过随机森林的预计结果,也已提交过kaggle。 - Arvato_Project_workbook_zh.ipynb:工程记录实现代码 - DIAS属性-值2017.xlsx:Arvato提供的数据说明文件。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Udacity DSND Arvato:
    优质
    本简介介绍的是Udacity数据科学纳米学位课程中的一个实际项目——DSND Arvato。该项目由学员运用机器学习技术来解决Arvato公司提出的营销挑战,旨在提升学生的实战能力和解决行业问题的能力。 毕业项目:为Arvato Financial Services金融服务公司实现一个顾客分类报告。这是优达学城数据科学家纳米学位的毕业项目。 开发环境: - Python 3.7.4 - conda 4.8.3 - numpy 1.18.1 - pandas 1.0.2 - scikit-learn 0.22.1 - scikitplot 0.3.7 文件说明: - imgs:博文使用的图片。 - kaggle_result.csv:提交kaggle的结果文件。 - rfc_result.csv:通过随机森林的预计结果,也已提交过kaggle。 - Arvato_Project_workbook_zh.ipynb:工程记录实现代码 - DIAS属性-值2017.xlsx:Arvato提供的数据说明文件。
  • Udacity分析师完结:我作品...
    优质
    在这篇文章中,我分享了我在Udacity数据分析师纳米学位项目的最后成果和学习经历,涵盖了数据分析的关键技能、工具和技术。 Udacity Data Analyst纳米学位最终项目集合:这是我完成的Udacity数据分析师纳米学位项目的汇总。
  • IBM_DSND_建议:IBM推荐
    优质
    本简介推荐IBM的数据科学纳米学位项目,强调其在培养数据分析、机器学习及Python编程技能方面的卓越表现,适合初学者与专业人士。 IBM Project的建议:IBM数据科学纳米学位项目目录 1. 安装 为了能够运行和查看该项目,请安装最新版本的Jupyter Notebook。 2. 项目动机 在这个项目中,我分析了用户与IBM Watson Studio平台上的文章之间的交互,并向他们提出了有关新文章推荐的意见。 3. 文件说明 该项目包含一个data文件夹,其中包含数据集csv文件: - user-item-interactions.csv:该文件包含了关于用户和文章之间互动的数据。 - articles_community.csv:该文件包含了社区内关于文章的信息。
  • Bikeshare:Udacity Bikeshare 分析
    优质
    本项目为Udacity推出的Bikeshare数据分析纳米学位课程,专注于通过Python等工具进行数据清洗、分析和可视化,旨在提高学生在共享单车行业中的数据处理能力。 在过去十年间,自行车共享系统在全球各大城市中的数量与受欢迎程度都在持续上升。用户可以通过短期租用的方式使用这些系统内的自行车,在任意一个站点借车并在另一个站点还车;当然如果只是为了骑行享受也可以在原地归还。无论哪种方式,每辆自行车每天都能为多个用户提供服务。随着信息技术的发展,现在用户可以轻松通过技术手段解锁或返回车辆,并且这种便利性也带来了大量数据资源,可用于深入研究如何更有效地使用这些系统。 在这个项目里,你将利用美国主要城市中由Motivate公司提供的自行车共享系统的实际运营数据进行分析。你的任务是对比芝加哥、纽约市和华盛顿特区这三个大城市的自行车共享系统的使用情况,并通过计算各种描述性统计信息来了解它们各自的特征与差异。
  • Projects for Udacity Data Engineering Nanodegree: 本仓库包括在Udacity工程期间所有和工作。
    优质
    此GitHub仓库收录了在Udacity数据工程纳米学位课程中完成的所有项目与作业,涵盖数据处理、数据库设计及大规模数据管理等多个方面。 该存储库包含了在Udacity数据工程纳米学位课程期间开发的所有项目。其中一个项目使用Postgres(SQL)进行数据建模,模拟了一个名为Sparkify的初创音乐流服务,并结合关系数据库和数据模型知识来创建一个ETL管道。 该项目的目标是构建一个包含优化后的表结构的Postgres数据库,这些表格旨在提高歌曲播放分析查询的效率。在此过程中运用了OLAP、事实表与维度表以及星型模式等概念,以便开发出高效的ETL流程。此流程能够快速从JSON文件生成所需的数据,并通过少量命令来运行必要的查询。 项目完成后,将创建一个数据库,其中包含可用于执行多种数据分析任务的数据集,供任何有兴趣使用这些数据的人参考。另一部分项目则涉及使用Apache Cassandra(NoSQL)进行数据建模,在这个模拟的音乐流场景中探索非关系型数据库的应用。
  • P2_连续控制:Udacity深度强化课程2-机械臂控制
    优质
    本项目为Udacity深度强化学习纳米学位课程第二部分,专注于通过连续控制算法优化机械臂运动路径,实现高效精准操作。 项目2:连续控制介绍 在这个项目中,您将使用一个特定的环境。在此环境中,双臂可以移动到目标位置。每当代理人的手靠近目标位置一步时,都会获得+0.1的奖励分数。因此,代理人需要尽可能长时间地保持其手在目标位置上。 观察空间由33个变量组成,分别对应于手臂的位置、旋转、速度和角速度等信息。每个动作是一个包含四个数字的向量,代表施加到两个关节上的扭矩值。该向量中的每一个数值应在-1至1之间。 分布式训练 对于此项目,您将获得两种不同的Unity环境版本:第一个版本仅包括一个代理;第二个版本则含有20个相同的代理副本,在各自的独立环境中运行。第二种版本非常适合那些采用多份(非交互且并行的)代理人副本来分散经验收集任务的方法和算法。 解决环境 请注意,您的项目提交只需满足上述两个版本中的任意一个即可。选择一:解决第一个版本
  • Udacity 自动驾驶汽车计划地图 1.7z
    优质
    本资源为Udacity自动驾驶汽车纳米学位课程中的地图文件(版本1.7),用于辅助学习者进行相关编程和算法实践。 我的实现代码是关于Udacity 自动驾驶汽车纳米学位项目的部分成果。
  • Matlab游戏代码-深度强化3:合作与竞争
    优质
    本项目是Matlab中利用深度强化学习进行游戏开发的一部分,专注于探索智能体间的合作与竞争策略,展现高级算法在复杂环境下的应用。 在Matlab代码项目DeepRL-Nanodegree-Project3(合作与竞争)中,我们将使用多代理深度确定性策略梯度(MADDPG)算法训练两个代理打网球。 环境设置:这是一个两人游戏,在其中代理人控制球拍来回弹跳。目标是特工必须相互反弹,同时不能让球落地或出界。在环境中包含有两个链接到一个名为TennisBrain的单个大脑的代理。经过训练后,可以将另一个称为MyBrain的大脑附加到其中一个代理上以与您已训练好的模型进行对战。 奖励功能(独立):每当特工成功击中网球时获得+0.1分;如果球落地或出界,则扣-0.1分给导致这种情况的特工。大脑具有以下观察和动作空间: 向量观测空间包括8个变量,分别对应于球的位置、速度及拍子的位置、速度。 连续的动作空间大小为2,代表朝网方向移动或者远离网的方向并跳跃。 没有视觉观测信息。 重置参数:仅有一个关于球的大小的相关参数需要调整。基准平均奖励值是2.5分。 如果您想在计算机上尝试这个算法,请确保系统中已安装Python3.6,并且还需一些库来帮助运行代码。
  • Brian组合(my_portfolio_site)
    优质
    Brian的数据科学项目组合网站汇集了他多样的数据科学作品,包括机器学习模型、数据分析案例和可视化项目,展示了他在数据驱动决策领域的专业技能和经验。 Brian的数据科学项目组合包括在UTHealth公共卫生学院与贝勒医学院及哈里斯县公共卫生合作开展的一个研究项目。该项目为所有哈里斯县居民(包括儿童)提供免费测试服务,无论他们是否生病以及他们的性别、种族、收入或移民身份如何。 在我的职责范围内,我负责数据架构的设计和实施,确保收集的数据得到有效的清理与分析,并将其可视化以供进一步的研究使用。 此外,在另一个项目中,我建立了一个分类模型来预测银行信用卡客户的流失率。通过网格搜索交叉验证优化了线性回归、随机森林以及XGBoost算法的性能。我还引入了一种新的建模方法:结合随机欠采样和Tomek链接消除技术,并利用XGBoost进行套袋操作,以提高正分类的效果。 在成本效益分析方面,我考虑到了客户生命周期价值(LTV)、误报与漏报的成本以及保留客户的干预成本。最终模型的建议得到了提出,并总结了类似问题的学习经验。
  • DQN-Pong-Master:深度习课程
    优质
    DQN-Pong-Master是深度学习课程中的一个收官项目,运用深度强化学习技术训练智能体玩经典游戏Pong,展示了从零开始到精通游戏的过程。 该存储库详细介绍了使用强化学习的深度学习代理实现,并特别强调了在经典Atari 2600游戏Pong中的深度Q网络应用,以达到最先进的成果。提供的解决方案包含高级优化工具如epsilon-greedy算法、重播缓冲区和目标网络等,进一步提升模型性能。实验结果表明我们的模型能够击败硬编码的Pong代理,并取得21-0(最高分)的成绩。