该数据集包含胸外科手术后肺癌患者的相关信息,旨在通过UCI机器学习资源平台探究影响患者术后生存期的关键因素。
胸外科手术肺癌数据集来源于主要的Jupyter笔记本,并包含其中的主要代码。此外,该资料还包括PowerPoint幻灯片演示文稿和项目报告。
这个数据专用于与肺癌患者术后预期寿命相关的分类问题:1类表示在术后一年内死亡;2类则代表生存期。
这些数据是在Wroclaw胸外科中心回顾性收集的,涉及的是那些在2007年至2011年间因原发性肺癌接受了广泛肺切除手术的患者。该中心与弗罗茨瓦夫医科大学胸外科及波兰下西里西亚肺病中心有联系,并且研究数据库是结核病和肺病研究所管理下的国家肺癌注册中心的一部分,在华沙。
数据文件夹内包含的是从Weka ARFF格式转换为CSV格式的原始数据。在Data_Wrangling Jupyter笔记本中,展示了将原始数据集更改为用于此项目的特定形式的过程。
属性描述包括诊断ICD-10编码(原发性和继发性以及多种肿瘤),FVC值即尽可能深呼吸后从肺部强行呼出的最大空气量等信息。