Advertisement

艾滋病病毒感染预测数据集 CSV格式含7.2万+条记录

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
本数据集为CSV格式,包含超过72,000条记录,旨在用于研究和预测艾滋病病毒(HIV)感染情况,支持相关疾病的预防与控制工作。 数据集包含已诊断为艾滋病患者的医疗保健统计数据及分类信息。 字段包括: - 时间:失败或审查的时间。 - trt:治疗指示(0=仅 ZDV;1 = ZDV + ddI,2 = ZDV + Zal,3 = 仅 ddI)。 - 年龄:基线时的年龄(岁)。 - WTKG:基线时体重 (千克)。 - 血友病:是否患有血友病(0=否;1=是)。 - 同性恋活动:是否有同性恋活动(0=否,1=是)。 - 药物滥用历史:有无静脉注射毒品史(0=否,1=是)。 - Karnofsky 评分:基线时的Karnofsky评分(范围从0到100分)。 - oprior:在前175年中是否接受过非 ZDV 的抗逆转录病毒治疗(0 = 否;1 = 是)。 - z30:前175天内是否使用过ZDV ( 0=否, 1=是 )。 - Preanti: 前175年的抗逆转录病毒疗法情况 - 种族:种族分类(0=白人,1=非白人)。 - 性别:性别(0=F;1=M)。 - STR2:患者之前是否接受过任何类型的抗逆转录治疗 ( 0 = 初次使用, 1 = 经验丰富 )。 - strat:根据既往的抗逆转录病毒疗法进行分类,分为三种情况( 1=初次使用者,2=>1但<=52周的既往治疗者,3=>52周)。 - 症状指示器:患者是否出现症状 (0 = 渐进性;1 = 出现症状 )。 - 治疗方式:当前使用的具体治疗方案(0=仅 ZDV, 1=其他)。 - offtrt: 在96+-5周前是否有停药情况 ( 0=否, 1=是)。 - CD4细胞计数:基线时的CD4细胞数量以及20+-5周后的值;另外还有相应的基线和后续时间点上的CD8 细胞 计数。 - 感染者状态:是否感染艾滋病(0 = 否,1 = 是)。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • CSV7.2+
    优质
    本数据集为CSV格式,包含超过72,000条记录,旨在用于研究和预测艾滋病病毒(HIV)感染情况,支持相关疾病的预防与控制工作。 数据集包含已诊断为艾滋病患者的医疗保健统计数据及分类信息。 字段包括: - 时间:失败或审查的时间。 - trt:治疗指示(0=仅 ZDV;1 = ZDV + ddI,2 = ZDV + Zal,3 = 仅 ddI)。 - 年龄:基线时的年龄(岁)。 - WTKG:基线时体重 (千克)。 - 血友病:是否患有血友病(0=否;1=是)。 - 同性恋活动:是否有同性恋活动(0=否,1=是)。 - 药物滥用历史:有无静脉注射毒品史(0=否,1=是)。 - Karnofsky 评分:基线时的Karnofsky评分(范围从0到100分)。 - oprior:在前175年中是否接受过非 ZDV 的抗逆转录病毒治疗(0 = 否;1 = 是)。 - z30:前175天内是否使用过ZDV ( 0=否, 1=是 )。 - Preanti: 前175年的抗逆转录病毒疗法情况 - 种族:种族分类(0=白人,1=非白人)。 - 性别:性别(0=F;1=M)。 - STR2:患者之前是否接受过任何类型的抗逆转录治疗 ( 0 = 初次使用, 1 = 经验丰富 )。 - strat:根据既往的抗逆转录病毒疗法进行分类,分为三种情况( 1=初次使用者,2=>1但<=52周的既往治疗者,3=>52周)。 - 症状指示器:患者是否出现症状 (0 = 渐进性;1 = 出现症状 )。 - 治疗方式:当前使用的具体治疗方案(0=仅 ZDV, 1=其他)。 - offtrt: 在96+-5周前是否有停药情况 ( 0=否, 1=是)。 - CD4细胞计数:基线时的CD4细胞数量以及20+-5周后的值;另外还有相应的基线和后续时间点上的CD8 细胞 计数。 - 感染者状态:是否感染艾滋病(0 = 否,1 = 是)。
  • 糖尿CSV770(Diabetes Dataset)
    优质
    本数据集为糖尿病相关研究设计,包含770条详细记录,以CSV格式存储。每一记录均提供多项关键指标,便于分析与建模。 糖尿病是一种全球性的慢性疾病,严重影响着人们的健康状况。科研人员与医疗工作者常利用数据集来研究如何更好地理解和预防这种病症。本篇文章将详细介绍一个名为“糖尿病数据集 CSV”的资源,其中包括770条记录,涵盖其来源、内容以及潜在的应用价值。 该数据集由美国国家糖尿病、消化和肾脏疾病研究所提供,是科研领域的重要资料之一。它的主要目标在于通过一系列的诊断测量来预测患者是否患有糖尿病。每个记录代表一个个体,并包含多个特征变量,这些变量反映了患者的生理指标,有助于评估患糖尿病的风险。 CSV文件格式是一种通用的数据交换格式,特别适合于存储结构化的表格数据。“糖尿病数据集 CSV”中的每行表示一位患者的信息,而各个列则包含了各种特征和结果变量。例如,该数据集中可能包括年龄、性别、体重、身高及血压等基本信息,以及空腹血糖水平与胰岛素水平等直接关联到糖尿病的生物指标。 在770条记录中,每个个体的特征通常可以分为以下几类: 1. 基本人口统计信息:如年龄和性别。这些因素可能影响着患糖尿病的风险。 2. 生理测量值:例如体重、身体质量指数(BMI)及血压等。这些都是与糖尿病发生和发展密切相关的指标。 3. 生化标志物:包括空腹血糖水平以及糖化血红蛋白浓度,它们是诊断糖尿病的关键依据。 4. 长期并发症的迹象:如视网膜病变和肾功能情况,这些信息可以反映疾病的严重程度。 通过分析此数据集,研究者们能够探究不同特征与糖尿病患病率之间的关系,并揭示风险因素、建立预测模型或评估现有干预措施的效果。此外,该数据集规模适中,非常适合初学者进行数据分析实践,例如使用Python的Pandas库执行数据清洗和探索性数据分析(EDA),并应用机器学习算法如逻辑回归、决策树和支持向量机来构建预测模型。 总的来说,“糖尿病数据集 CSV”为研究提供了丰富的实证材料。无论是在学术领域还是临床实践中,该资源都能帮助我们更深入地了解糖尿病的成因,预测疾病的发展趋势,并可能推动新的预防和治疗策略的研发。通过CSV格式存储的数据易于处理与共享,从而促进了全球范围内的科研合作。
  • 心脏疾30,表
    优质
    这是一个包含30万条记录的心脏疾病数据集,以表格形式呈现。数据集中包含了诊断、患者特征等多方面信息,适合用于心脏病研究和模型训练。 心脏病数据集包含30万条记录,并已完成数据清洗工作。该数据以Excel表格形式呈现,包括以下属性:HeartDisease(心脏病)、BMI(身体质量指数)、Smoking(吸烟情况)、AlcoholDrinking(饮酒习惯)、Stroke(中风历史)、PhysicalHealth(身体健康状况)、MentalHealth(心理健康状态)、DiffWalking(行走困难程度)、Sex(性别)和AgeCategory(年龄分类)。
  • 心脏疾与中风 CSV3.5+
    优质
    本数据集包含超过35,000条记录,旨在研究和预测心脏疾病及中风的风险因素,为医疗健康领域的科研提供支持。 该数据集是心血管疾病监测系统的一部分,旨在整合来自多个来源的指标以全面了解美国心血管疾病的公共卫生负担及相关风险因素。这些数据根据地理位置(国家、州、县及选定地点)以及各种健康状况和危险因素进行分类,包括心力衰竭等心脏问题与高血压等风险因子。此外,该数据库支持趋势分析,并允许按年龄组、性别和种族民族分层展示信息。
  • 海上风电发电量CSV4
    优质
    本数据集包含超过四万条详细的海上风力发电记录,以CSV格式提供,旨在为研究者与开发者提供精确的海上风电发电量预测所需的数据支持。 海上风电出力预测的数据分为训练组和测试组两大类,主要包括风电场基本信息、气象变量数据和实际功率数据三个部分。风电场基本信息涵盖各风电场的装机容量等信息;气象变量数据包含从2022年1月到2024年1月份期间,每间隔15分钟记录的各风电场的气象情况;实际功率数据则是各风电场每间隔15分钟的发电出力详情。这些数据集文件采用csv格式存储。A榜提供两个训练集和两个测试集的数据。
  • CSV的金融欺诈检104+
    优质
    本数据集包含超过104万条记录,采用CSV格式存储,专为金融欺诈检测设计,涵盖多种交易类型与特征信息,助力模型训练及算法优化。 该数据集展示了移动货币交易的全面表示,并经过精心设计以反映现实世界金融活动中的复杂性以及欺诈行为的研究目的。此数据来源于名为PaySim的模拟器,利用了非洲某国实际财务日志中汇总的数据来填补公开可用金融数据集中用于检测欺诈研究方面的空白。它涵盖了多种类型的交易,包括现金存入、兑现输出、借记、支付和转账等,并为评估各种欺诈检测方法提供了一个全面的环境。 **数据集结构** - **step:** 表示现实世界中的时间单位,1 步等于 1 小时;整个模拟历时744步,相当于30天。 - **type:** 包括CASH-IN、CASH-OUT、BIT-OUT、PAYMENT 和 TRANSFER等交易类型。 - **amount:** 表示以当地货币单位表示的每笔交易金额。 - **nameOrig:** 发起该笔交易的客户名称。 - **oldbalanceOrg:** 代表发起方在进行特定操作前账户中的余额。 - **newbalanceOrig:** 指的是执行完相关操作后,发起方账户的新余额。 - **nameDest:** 接收这笔交易的客户的标识符(或称目的地)。 - **oldbalanceDest:** 表示接收方在收到资金前的账户余额。对于以M表示商家身份的客户而言,此字段不适用。 - **newbalanceDest:** 收到转账后的新收款人账户余额;同样地,如果交易涉及的是一个标识为“M”的实体,则该信息不被提供。 - **isFraud:** 标识由欺诈代理执行的那些企图通过诸如提现或转移等操作来耗尽客户资金的行为。 - **isFlaggedFraud:** 用于标记账户间未经授权的大额转账行为,任何单笔金额超过20万单位货币的交易都被视为非法。
  • 与症状CSV5000+目)
    优质
    本数据集包含了超过5000个条目的疾病及相应症状信息,以CSV格式存储,便于研究人员和开发者进行医疗数据分析、模式识别以及辅助诊断工具开发。 该数据集包含800多种独特的疾病和600种不同的症状。每一种疾病都关联着不同数量的症状,如果某疾病的症状较少,则相关字段会留空。整个数据集中共有18列信息。
  • 飞猪景点CSV5
    优质
    该数据集包含超过5万条飞猪平台上的景点信息,以CSV格式存储,便于数据分析与挖掘。内容详尽丰富,涵盖众多旅游目的地详情。 使用Python爬取飞猪网站以获取全国景点的数据。包含的字段有:序号、景点标题、封面图、销量、价格以及对应飞猪网站的地址和景点城市。
  • -图相似性搜索
    优质
    本数据集聚焦于艾滋病相关研究,包含大量用于图相似性搜索的数据,旨在支持药物发现及疾病机理分析等领域的深入探究。 艾滋病:这是用于NCI/NIH开发和治疗计划的抗病毒筛查数据集。它包含42390个化合物,平均每个化合物有25.4个顶点和26.7个边。该数据集是一个大型图形数据库,在图形相似性搜索领域通常被使用。原始数据集下载后需要自行清洗。
  • 试包(更新至2012.1.24)密码
    优质
    《病毒测试包》是一款包含多种经典与新型病毒样本的安全软件测试工具,截止于2012年1月24日的版本中特别加入了密码病毒以供专业人员研究分析,但仅供学习交流使用,请勿用于非法途径。 病毒测试包(最新版本) 密码:virus