本研究运用逻辑回归分析方法,旨在评估和预测患有腹股沟阴囊疝的马匹生存概率,为兽医临床决策提供数据支持。
本次实战内容将使用Logistic回归来预测患疝气病的马能否存活。原始数据集包含了368个样本和28个特征。这种疾病不一定源自马的肠胃问题,其他因素也可能引发该病症。数据集中包括了医院检测马疝病的一些指标,有的较为主观且难以测量,例如疼痛级别等。
此外需要注意的是,在部分指标主观及难测之外,还存在约30%的数据缺失情况。预处理阶段主要完成两项工作:对于测试集中的特征值缺失项,我们用实数0来替换所有空缺值;由于采用Logistic回归模型并考虑到sigmoid(0)=0.5这一特性(即它对结果的预测不具有任何倾向性),这不会影响到回归系数。而对于类别标签缺失的数据,则直接丢弃。
原始数据集经过处理后,保存为两个文件:horseColicTest.txt和horseColicTraining.txt。