
基于临床记录和结构化数据,预测ICU再入院率的源代码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
NLP在医疗保健领域的应用,利用MIMIC III数据库中的结构化和非结构化数据,旨在预测患者未来30天再次入住ICU的情况。数据处理方面,结构化数据的ETL流程可于结构目录中查阅,具体包括structured_etl_part1.scala和structured_etl_part2.py这两个脚本。与此同时,非结构化数据的处理脚本均位于dataproc目录内。为了处理NOTEEVENTS并提取单词向量,我们采用data_processing_script.py。此外,使用get_discharge_summaries.py脚本获取放电汇总信息,并借助build_vocab.py脚本从这些放电摘要构建词汇表(vocab)。随后,利用word_embeddings.py脚本在所有单词上训练单词嵌入。最后,通过extract_wvs.py中的gensim_to_embeddings方法,结合我们构建的词汇表,对经过训练的单词嵌入进行生成和造型,构建了结构化网络在struc_net中的应用。
全部评论 (0)
还没有任何评论哟~


