Advertisement

肝硬化病人存活预测数据集.rar

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
该数据集包含用于预测肝硬化患者生存率的相关信息和医学指标,旨在为临床研究与模型训练提供支持。 肝硬化是由长期肝脏损伤导致的广泛疤痕化病变,通常由肝炎或慢性饮酒引起。一项关于原发性胆汁性肝硬化的研究数据来源于梅奥诊所1974年至1984年的记录。 预处理步骤: - 删除“药物”列中存在未命中值(NA)的所有行 - 用平均结果填充缺失的数值 - 对所有类别属性进行一个热编码 问题描述:在1974年到1984年间,有424名原发性胆汁性肝硬化患者转诊至梅奥诊所,并符合测试药物D-青霉素随机安慰剂对照试验的标准。其中312人参与了该实验,其余的112名没有参加临床试验但同意记录基本指标并进行生存追踪。这其中有6人在确诊后不久就无法跟踪,因此最终有总共418人的数据可用于研究。 字段介绍: - ID:唯一标识符 - N_Days: 从登记到患者死亡、移植或截至研究分析时间的较早者之间的天数。 - Status: 患者的状态(C表示审查,CL因肝脏治疗而审查,D代表死亡) - Drug: 药物类型(D-Penicillamine 或 安慰剂) - Age: 年龄(以日为单位) - Sex:性别(M 男性或 F 女性) - Ascites: 是否存在腹水(N 否, Y 是) - Hepatomegaly: 是否存在肝肿大 (N 否,Y 是) - Spiders: 蜘蛛痣的存在与否(N否、Y是) - Edema:是否存在水肿(无水肿且未用利尿剂治疗[N];无利尿剂的水肿或通过使用利尿剂解决的水肿[S]; 尽管有利尿剂疗法但仍有肿胀[Y]) - Bilirubin: 血清胆红素,单位为mg/dl - Cholesterol: 血清胆固醇, 单位是 mg/dl - Albumin:白蛋白 [gm/dl] - Copper: 尿铜[微克/天] - Alk_Phos: 碱性磷酸酶的水平(以单位/升为单位) - SGOT :SGOT在[U/ml]中的值 - Triglycerides: 甘油三酯含量[mg/dl] - Platelets:血小板计数 [10^3/uL] - Prothrombin: 凝血酶原时间(秒)

全部评论 (0)

还没有任何评论哟~
客服
客服
  • .rar
    优质
    该数据集包含用于预测肝硬化患者生存率的相关信息和医学指标,旨在为临床研究与模型训练提供支持。 肝硬化是由长期肝脏损伤导致的广泛疤痕化病变,通常由肝炎或慢性饮酒引起。一项关于原发性胆汁性肝硬化的研究数据来源于梅奥诊所1974年至1984年的记录。 预处理步骤: - 删除“药物”列中存在未命中值(NA)的所有行 - 用平均结果填充缺失的数值 - 对所有类别属性进行一个热编码 问题描述:在1974年到1984年间,有424名原发性胆汁性肝硬化患者转诊至梅奥诊所,并符合测试药物D-青霉素随机安慰剂对照试验的标准。其中312人参与了该实验,其余的112名没有参加临床试验但同意记录基本指标并进行生存追踪。这其中有6人在确诊后不久就无法跟踪,因此最终有总共418人的数据可用于研究。 字段介绍: - ID:唯一标识符 - N_Days: 从登记到患者死亡、移植或截至研究分析时间的较早者之间的天数。 - Status: 患者的状态(C表示审查,CL因肝脏治疗而审查,D代表死亡) - Drug: 药物类型(D-Penicillamine 或 安慰剂) - Age: 年龄(以日为单位) - Sex:性别(M 男性或 F 女性) - Ascites: 是否存在腹水(N 否, Y 是) - Hepatomegaly: 是否存在肝肿大 (N 否,Y 是) - Spiders: 蜘蛛痣的存在与否(N否、Y是) - Edema:是否存在水肿(无水肿且未用利尿剂治疗[N];无利尿剂的水肿或通过使用利尿剂解决的水肿[S]; 尽管有利尿剂疗法但仍有肿胀[Y]) - Bilirubin: 血清胆红素,单位为mg/dl - Cholesterol: 血清胆固醇, 单位是 mg/dl - Albumin:白蛋白 [gm/dl] - Copper: 尿铜[微克/天] - Alk_Phos: 碱性磷酸酶的水平(以单位/升为单位) - SGOT :SGOT在[U/ml]中的值 - Triglycerides: 甘油三酯含量[mg/dl] - Platelets:血小板计数 [10^3/uL] - Prothrombin: 凝血酶原时间(秒)
  • 症状
    优质
    该数据集旨在通过收集和分析各种疾病的症状信息,为疾病早期预警系统提供支持,帮助提高诊断准确性和效率。 此数据集旨在帮助学生创建疾病预测或医疗保健系统,并为他们提供必要的资源。 该数据集包含有关疾病的详细信息,包括症状、预防措施以及相关权重的数据。 通过使用文件处理技术,可以轻松清理这些数据,用户只需了解表格中行和列的结构即可。 具体而言: - 疾病种类:真菌感染、过敏、慢性胆汁淤积、药物反应、消化性溃疡、艾滋病、糖尿病、肠胃炎、支气管哮喘、高血压、偏头痛以及颈椎病。 - 其他信息包括瘫痪(脑出血)。
  • 心脏疾:UCI
    优质
    本研究利用UCI数据集分析和建模,旨在准确预测心脏疾病的发生风险,为早期预防提供科学依据。 ### 心脏病预测 该实验旨在根据心脏病的缺失情况来简单地预测其存在与否。 #### 关于数据集: 此数据集可以在Kaggle上获得,并且可以从UCI机器学习存储库中下载。 数据包含总共14个属性,具体如下: - **年龄**:以岁为单位 - **性别**:性别(1=男性;0=女性) - **cp**: 胸痛类型 值说明: - 1: 典型心绞痛 - 2: 非典型心绞痛 - 3: 不典型非心绞痛 - 4: 无症状 - **trestbps**:静息血压(以毫米汞柱为单位) - **chol**:血清胆固醇,mg/dl - **fbs** :空腹血糖 > 120 mg/dl (1=是;0=否) - **restecg**: 静息心电图结果 值说明: - 0: 正常 - 1: ST-T波异常(T波倒置和或ST升高或降低> 0.05 mV) - 2:符合Estes标准显示可能或确定的左心室肥大 - **thalach**:达到的最大心率 - **exang**: 运动引起的心绞痛
  • 泰坦尼克号生.rar
    优质
    泰坦尼克号生存预测数据集包含乘客信息,旨在通过机器学习模型预测他们在泰坦尼克号灾难中的幸存情况,为数据分析和建模提供宝贵资源。 Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rar Titanic生存预测数据集.rarTitanic生存预测数据集包含多次重复,表明这是一个与泰坦尼克号乘客生还情况相关的数据分析文件集合。
  • 模型.rar模型.rar模型.rar
    优质
    本资源包含一个用于预测疾病的数学模型,旨在通过分析个人健康数据和生活习惯来评估患病风险,有助于早期预防与干预。 疾病预测.rar包含了用于预测疾病的模型和数据。文件内详细介绍了如何利用机器学习方法进行疾病风险评估,并提供了相应的代码示例和实验结果分析。此资源对于研究者、医生及对健康数据分析感兴趣的个人具有重要参考价值。
  • 糖尿风险.zip
    优质
    该数据集包含了用于预测个体患糖尿病风险的相关信息,包括年龄、性别、家族史等变量,适用于机器学习模型训练与测试。 数据集来源于孟加拉国锡尔赫特市医院的糖尿病患者问卷,并已获得批准。特征信息包括:年龄范围为20至65岁;性别分为1.男 2.女;多尿症情况分为1.是 2.否;突然体重减轻情况分为1.是 2.否;多食症情况分为1.是 2.否;视觉模糊情况分为1.是 2.否;瘙痒症状分为1.是 2.否;烦躁情绪状态分为1.是 2.否;康复延迟状况分为1.是 2.否;部分偏瘫情况为1.是 2.否;肌肉无力状况为1.是 2.否;脱发情况为1.是 2.否;肥胖情况为1.是 2.否。类别标签包括正面和负面,分别用数字表示:1代表正面,2代表负面。
  • LITS
    优质
    LITS肝脏数据集是一个包含70例肝脏CT影像及其标注的数据集合,广泛应用于肝脏和肿瘤区域的分割研究中。 LITS肝数据集中分出来的2D图像只有肿瘤区域,并且是单通道灰度图。
  • OULU-NPU体检
    优质
    OULU-NPU人脸活体检测数据集是一个专为评估防伪算法效能设计的数据库,包含多种攻击类型的真实世界样本,促进生物识别安全研究。 目前质量最好的平面呈现攻击检测数据集现已上传至百度网盘。
  • 用纸强度
    优质
    该数据集专注于生活用纸强度的预测研究,包含大量影响纸张强度的关键参数和测试结果,旨在为造纸工业提供优化生产流程、提升产品质量的数据支持。 生活用纸张强度预测数据集包括一个训练文件train.csv,其中包含原纸的抽检样本检测数据。这些数据涵盖了抗张强度数值(作为预测目标)、与原纸批次相关的质检过程中的纤维形态信息以及前工序的关键参数。在实际业务场景中,这部分数据主要通过人工记录获得。 此外还有一个名为paper_machine_data.csv的数据文件,该文件包含了纸机运行的实时参数,可用于模型训练时提取特征,并且可以通过时间信息和训练数据集进行关联。