Advertisement

Brian的数据科学项目组合(my_portfolio_site)

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
Brian的数据科学项目组合网站汇集了他多样的数据科学作品,包括机器学习模型、数据分析案例和可视化项目,展示了他在数据驱动决策领域的专业技能和经验。 Brian的数据科学项目组合包括在UTHealth公共卫生学院与贝勒医学院及哈里斯县公共卫生合作开展的一个研究项目。该项目为所有哈里斯县居民(包括儿童)提供免费测试服务,无论他们是否生病以及他们的性别、种族、收入或移民身份如何。 在我的职责范围内,我负责数据架构的设计和实施,确保收集的数据得到有效的清理与分析,并将其可视化以供进一步的研究使用。 此外,在另一个项目中,我建立了一个分类模型来预测银行信用卡客户的流失率。通过网格搜索交叉验证优化了线性回归、随机森林以及XGBoost算法的性能。我还引入了一种新的建模方法:结合随机欠采样和Tomek链接消除技术,并利用XGBoost进行套袋操作,以提高正分类的效果。 在成本效益分析方面,我考虑到了客户生命周期价值(LTV)、误报与漏报的成本以及保留客户的干预成本。最终模型的建议得到了提出,并总结了类似问题的学习经验。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • Brian(my_portfolio_site)
    优质
    Brian的数据科学项目组合网站汇集了他多样的数据科学作品,包括机器学习模型、数据分析案例和可视化项目,展示了他在数据驱动决策领域的专业技能和经验。 Brian的数据科学项目组合包括在UTHealth公共卫生学院与贝勒医学院及哈里斯县公共卫生合作开展的一个研究项目。该项目为所有哈里斯县居民(包括儿童)提供免费测试服务,无论他们是否生病以及他们的性别、种族、收入或移民身份如何。 在我的职责范围内,我负责数据架构的设计和实施,确保收集的数据得到有效的清理与分析,并将其可视化以供进一步的研究使用。 此外,在另一个项目中,我建立了一个分类模型来预测银行信用卡客户的流失率。通过网格搜索交叉验证优化了线性回归、随机森林以及XGBoost算法的性能。我还引入了一种新的建模方法:结合随机欠采样和Tomek链接消除技术,并利用XGBoost进行套袋操作,以提高正分类的效果。 在成本效益分析方面,我考虑到了客户生命周期价值(LTV)、误报与漏报的成本以及保留客户的干预成本。最终模型的建议得到了提出,并总结了类似问题的学习经验。
  • Udacity DSND Arvato: 纳米最终
    优质
    本简介介绍的是Udacity数据科学纳米学位课程中的一个实际项目——DSND Arvato。该项目由学员运用机器学习技术来解决Arvato公司提出的营销挑战,旨在提升学生的实战能力和解决行业问题的能力。 毕业项目:为Arvato Financial Services金融服务公司实现一个顾客分类报告。这是优达学城数据科学家纳米学位的毕业项目。 开发环境: - Python 3.7.4 - conda 4.8.3 - numpy 1.18.1 - pandas 1.0.2 - scikit-learn 0.22.1 - scikitplot 0.3.7 文件说明: - imgs:博文使用的图片。 - kaggle_result.csv:提交kaggle的结果文件。 - rfc_result.csv:通过随机森林的预计结果,也已提交过kaggle。 - Arvato_Project_workbook_zh.ipynb:工程记录实现代码 - DIAS属性-值2017.xlsx:Arvato提供的数据说明文件。
  • PMASD:异常声音检测
    优质
    PMASD项目致力于运用先进的数据分析技术,特别是针对音频数据中的异常情况进行检测。该项目旨在通过机器学习和人工智能的方法,帮助数据科学家识别并分析复杂环境下的不寻常声音模式,从而提升监测系统的准确性和效率。 PMASD:异常声音检测(DataScientest项目)
  • 投资普建模.pdf
    优质
    《投资组合的数学科普建模》一书通过浅显易懂的方式介绍数学模型在构建和优化投资组合中的应用,帮助读者理解风险与收益之间的关系。 投资组合数数学建模.pdf,继续努力,相信你的数学建模能力会不断提升。多阅读相关论文,并研究往年题目,这对学习很有帮助。
  • :含 PySpark、R 和 Python 源代码
    优质
    本项目集成了PySpark、R和Python源代码,利用大数据技术进行高效的数据处理与分析,适用于机器学习与统计建模。 数据科学项目:技术: 功能选择: - PCA(主成分分析) - AIC(Akaike 信息标准) - BIC(贝叶斯信息准则) - LASSO(最小绝对收缩和选择算子) 模型: - 随机森林 - 梯度提升 - XGBoost - 深层神经网络 - 自动编码器 - 贝叶斯方法 实现语言/框架:Python (Scikit-Learn, TensorFlow), R, PySpark 分类任务: - GLM(广义线性模型): Ridge/Lasso/Elastic Net - 随机森林(使用 Python Scikit-Learn 实现) 回归任务: - 线性回归 - 多项式回归 实现语言/框架:R, Python (Scikit-Learn) 分类方法: - 决策树 - 高斯朴素贝叶斯 - 支持向量机(SVM),包括线性、多项式和 RBF 核函数 实现语言/框架:Python (Scikit-Learn), R
  • IBM_DSND_建议:IBM纳米推荐
    优质
    本简介推荐IBM的数据科学纳米学位项目,强调其在培养数据分析、机器学习及Python编程技能方面的卓越表现,适合初学者与专业人士。 IBM Project的建议:IBM数据科学纳米学位项目目录 1. 安装 为了能够运行和查看该项目,请安装最新版本的Jupyter Notebook。 2. 项目动机 在这个项目中,我分析了用户与IBM Watson Studio平台上的文章之间的交互,并向他们提出了有关新文章推荐的意见。 3. 文件说明 该项目包含一个data文件夹,其中包含数据集csv文件: - user-item-interactions.csv:该文件包含了关于用户和文章之间互动的数据。 - articles_community.csv:该文件包含了社区内关于文章的信息。
  • 电子技大课程讲义
    优质
    《电子科技大学的组合数学课程讲义》是为该校本科生设计的教学材料,涵盖了组合计数、图论基础等核心内容,并结合实例讲解和习题练习,旨在帮助学生深入理解和掌握组合数学的基本理论与应用技巧。 电子科技大学卢老师的讲义详细阐述了组合数学的原理,是广大学子考试和学习的必备资料。
  • 北京技大计算机成原理课程设计
    优质
    本项目集合由北京科技大学计算机专业学生完成,涵盖多种计算机组成原理课程设计任务,旨在提升学生的硬件系统设计与实践能力。 北京科技大学计组课设项目集合包括cpu、cpu132_gettrace、soc_axi_func、soc_sram_func和soft等多个模块的全套资源完整实现。
  • 中国技术大考试卷
    优质
    本试卷为中国科学技术大学组合数学课程的考试材料,旨在评估学生对于组合计数、递推关系、母函数及容斥原理等核心概念的理解与应用能力。 11年、12年、13年的组合数学试卷是计院的,请放心下载。