Advertisement

用于预测肥胖的数据集,涵盖饮食习惯、家族史及身体状况等影响因素,适合分类、回归与聚类分析

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
此数据集旨在预测个体肥胖风险,包含饮食习惯、遗传背景和身体健康状况等多种变量,适用于进行分类、回归及聚类研究。 这个数据集旨在根据饮食习惯、家族史和身体状况等因素来估计个体的肥胖水平。它包含了来自墨西哥、秘鲁和哥伦比亚三国个人的数据,涵盖了16项生活方式与健康相关特征,共2111条记录。标签将肥胖程度分类为从体重不足到不同类型的肥胖。 列描述如下: - Gender:性别(男或女) - Age:年龄(岁) - Height:身高(米) - Weight:体重(千克) - family_history_with_overweight:是否有超重家族史 - FAVC:是否经常食用高热量食物 - FCVC:每周蔬菜消费频率(1至3分) - NCP:每天主要餐数 - CAEC:非正餐时间进食的频率(从不、有时、经常、总是) - SMOKE:是否吸烟 - CH2O:每日饮水量(1至3分) - SCC:是否监控卡路里摄入 - FAF:体力活动频率(0至3分) - TUE:使用科技产品的时间(0至3分) - CALC:酒精消费的频率(从不、有时、经常、总是) - MTRANS:主要交通方式(汽车、自行车、摩托车、公共交通或步行) - NObeyesdad:肥胖程度(体重不足、正常体重、过重一级、过重二级、肥胖一级、肥胖二级或肥胖三级)

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 优质
    此数据集旨在预测个体肥胖风险,包含饮食习惯、遗传背景和身体健康状况等多种变量,适用于进行分类、回归及聚类研究。 这个数据集旨在根据饮食习惯、家族史和身体状况等因素来估计个体的肥胖水平。它包含了来自墨西哥、秘鲁和哥伦比亚三国个人的数据,涵盖了16项生活方式与健康相关特征,共2111条记录。标签将肥胖程度分类为从体重不足到不同类型的肥胖。 列描述如下: - Gender:性别(男或女) - Age:年龄(岁) - Height:身高(米) - Weight:体重(千克) - family_history_with_overweight:是否有超重家族史 - FAVC:是否经常食用高热量食物 - FCVC:每周蔬菜消费频率(1至3分) - NCP:每天主要餐数 - CAEC:非正餐时间进食的频率(从不、有时、经常、总是) - SMOKE:是否吸烟 - CH2O:每日饮水量(1至3分) - SCC:是否监控卡路里摄入 - FAF:体力活动频率(0至3分) - TUE:使用科技产品的时间(0至3分) - CALC:酒精消费的频率(从不、有时、经常、总是) - MTRANS:主要交通方式(汽车、自行车、摩托车、公共交通或步行) - NObeyesdad:肥胖程度(体重不足、正常体重、过重一级、过重二级、肥胖一级、肥胖二级或肥胖三级)
  • 个人RAR文件
    优质
    本RAR文件包含了一个详尽的数据集,探讨了个体饮食习惯与身体健康状况(如睡眠、运动量)如何共同作用于体重变化。数据涵盖了多年的生活记录与分析模型,旨在为健康管理和营养学研究提供宝贵资源。 与饮食习惯相关的属性包括:频繁食用高热量食物(FAVC)、食用蔬菜的频率(FCVC)、主餐数量(NCP)、两餐之间的食物消耗频率(CAEC)、每日饮水量(CH20) 和饮酒量(CALC)。与身体状况相关的属性包括:卡路里消耗监测 (SCC)、身体活动频率 (FAF)、使用技术设备的时间 (TUE)、使用的交通工具 (MTRANS) 获得的变量: 性别、年龄、身高和体重。 预测指标可以通过肥胖系数BMI进行判断 BMI = 体重[kg] ÷ (身高[m])² 体重过低 BMI<18.5 正常 18.5≤BMI<24 超重 24≤BMI<28 肥胖 28≤BMI 也可以用数据集自带指标NObesity。 该数据集可用于基于分类、预测、分割和关联算法的分析。数据以CSV格式提供。
  • 主成产量探究
    优质
    本研究运用主成分回归分析方法探讨了影响粮食产量的关键因素,旨在为提高农业生产效率和保障粮食安全提供科学依据。 在现代农业研究领域中,探索粮食产量的影响因素具有极其重要的意义。影响粮食生产的因素包括自然条件、生产基础、物质投入以及人力资本等多种要素。传统的多元线性回归分析方法虽然直观易懂,但当多个变量间存在多重共线性时,可能导致分析结果出现较大误差,从而降低研究的准确性。为此,本段落引入了主成分回归分析法来解决这一问题。 主成分回归分析是一种结合了主成分分析和回归分析的方法。首先通过对数据进行主成分分析提取出几个主要因素(即“主成分”),这些因子能够捕捉到大部分信息,并且减少了变量的数量。每个主成分数值都是原有变量的线性组合,其中载荷系数体现了原始变量在该主成分数值中的重要程度。通过这种方法可以有效减少多重共线性的干扰问题。接着使用多元回归分析方法对提取出的主要因素和粮食产量进行建模,以建立一个统计模型。 研究中作者采用了《中国统计年鉴》(1990~2010年)的统计数据作为数据源,并选取了农业机械总动力、化肥施用量、农村人口数量、农村用电量、粮食播种面积以及有效灌溉土地等变量进行分析。通过主成分分析提取出对粮食产量影响最大的几个主要因素,然后使用多元回归方法建立预测模型。该模型可以有效地预测未来几年的粮食产出,并且具有良好的经济解释性。 研究发现表明化肥施用量是决定粮食品质的重要因素之一,其贡献率高达45%,占据首位;农业机械总动力和有效灌溉面积则分别位列第二、第三位。这说明提高肥料使用效率、增强农机力量以及扩大农田水利设施覆盖范围都是提升粮食产量的关键措施。此外自然条件特别是水资源状况对作物生长也有着显著影响,因此选取水灾与旱灾受灾程度作为衡量指标可以更准确地评估自然灾害对于农业生产的影响。 本段落的研究成果为指导农业生产和政策制定提供了重要的参考价值。通过主成分回归分析的应用不仅可以揭示出主要的产量决定因素,还可以帮助农民做出科学决策,理解并控制粮食生产波动的原因以提高整体产出水平和保障国家粮食安全。 研究过程中使用了SPSS统计软件进行数据处理与建模工作,保证了结果的准确性和可靠性。作为一种有效的数据分析工具,在多变量分析领域中主成分回归法具有广泛的应用前景,并值得在更多实际问题的研究中推广使用。
  • UCI Car Evaluation
    优质
    本研究运用UCI汽车评估数据集,深入探讨了分类、回归与聚类三种机器学习方法的应用,旨在揭示不同模型对汽车评价指标预测的效能。 通过在UCI开源网站上下载Car Evaluation数据集,并使用机器学习算法进行分析。分别应用了分类、回归和聚类算法。文件包括数据集以及代码,可以在Jupyter中运行这些代码,其中的解释通俗易懂,从头到尾都可以顺利执行。
  • 廊坊市GDP多元模型.docx
    优质
    本文构建了用于分析和预测廊坊市GDP影响因素的多元回归分析模型,旨在揭示经济增长的关键驱动要素,并提供政策制定参考。 近年来,随着中国经济的快速发展和城市化进程的加快,廊坊市作为京津冀地区的一部分,其经济也实现了快速增长。本段落选取2002年至2018年的相关数据,并利用MATLAB编程建立了多元回归模型来研究影响廊坊市GDP的因素,并对最近两年的GDP值进行了预测。通过这些分析结果可以更好地了解廊坊市未来的发展趋势。
  • 经济增长
    优质
    本文运用岭回归方法探讨了影响经济增长的关键因素,旨在克服多重共线性问题,提供更加准确和可靠的经济分析。 岭回归分析是一种改进的最小二乘法,在实际工作中具有重要的应用价值。本段落以河北省为例,利用标准的统计软件,通过岭回归技术对改革开放以来影响河北省经济增长的因素进行了详细而深入的实证研究,并提出了实现河北经济快速、稳定增长的建议和措施。
  • 大量负荷
    优质
    本项目包含丰富多样的负荷数据分析集,广泛应用于分类、聚类及预测模型中,助力研究人员深入探究电力系统需求模式。 负荷数据(爱尔兰),格式为txt文件,包含电力负荷数据及天然气使用情况,时间分辨率为30分钟。文本的第一列是智能电表编号,第二列表示时间(非标准格式需要转换),接下来的三列表示用电量。
  • VAR模型CPI
    优质
    本研究采用VAR模型深入分析了影响CPI的主要因素,并进行了未来趋势预测,为经济决策提供依据。 基于VAR模型的CPI影响因素分析及预测研究探讨了利用向量自回归(VAR)模型对消费者价格指数(CPI)的影响因素进行深入剖析,并在此基础上对未来趋势做出科学预测。这种方法能够全面考虑多个经济变量之间的动态关系,为政策制定者和市场参与者提供有价值的参考信息。
  • 酒店代码
    优质
    本数据集和代码分析项目聚焦于探究各类变量如何影响酒店运营表现,涵盖预订模式、客户偏好及市场动态等多维度信息。 酒店影响因素分析数据集和相关代码。