GAIN-GTEx是一种基于生成对抗网络(GAN)的方法,专门用于从大规模人类基因组数据集GTEx中插补缺失或未测序的基因表达值。这种方法能够有效填补数据空白,提高后续生物医学研究的数据完整性与分析准确性。
该存储库包含论文《带有生成对抗性插补网络(GAIN-GTEx)的基因表达插补》的代码,作者为Ramon Viñas、Tiago Azevedo、Eric R. Gamazon和Pietro Liò。基本生物学意义的问题是:基因子集的表达可以在多大程度上恢复完整的转录组,这对生物学发现和临床应用具有重要意义。
为了应对这一挑战,我们提出了一种基于生成对抗插补网络(GAIN-GTEx)的方法来填补基因表达缺失值。为提高方法的应用性,我们利用了GTEx v8数据集进行研究;该数据集是一种参考资源,在多种人体组织中产生了完整的转录组信息。
我们将模型与其他几种标准和最新的插补方法进行了比较,结果显示GAIN-GTEx在预测性能及运行时间方面均表现出明显优势。此外,我们的结果还表明:无论缺失水平如何,来自三种癌症类型的RNA-Seq数据都具有很强的概括性。
我们希望这项工作能够促进大规模RNA生物存储库的有效整合和使用。