Advertisement

ALRA:一种利用低秩逼近进行scRNA-seq数据插补的方法

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:ZIP


简介:
ALRA是一种专为单细胞RNA测序(scRNA-seq)设计的数据插补方法。它通过低秩矩阵逼近技术高效地填补缺失值,恢复原始基因表达模式的完整性和准确性。 自适应阈值低秩近似(ALRA)介绍 ALRA是一种用于在单细胞RNA测序数据中的缺失值插入方法,在预印本“使用低秩近似法对scRNA-seq数据进行零保存插值”中有详细描述。给定一个scRNA-seq表达矩阵,ALRA首先通过随机SVD计算其rank-k近似值。接下来,每一行(基因)都以该基因最负数值的大小为阈值。最后一步是重新缩放整个矩阵。 此存储库包含用于在R中运行ALRA所需的代码。使用ALRA前需要安装RSVD软件包,可以通过执行`install.packages(rsvd)`来完成这一操作。 此外,对于已经安装了该软件包的用户来说,现在提供了一个名为use.mkl的标志,这可以显著提高基于默认rpca版本的速度。需要注意的是,rpca-mkl仍在开发中,并未在CRAN上发布,因此它并非必需的软件包;然而如果用户已安装了此扩展,则可以通过将标志设置为True来启用它的使用功能。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • ALRAscRNA-seq
    优质
    ALRA是一种专为单细胞RNA测序(scRNA-seq)设计的数据插补方法。它通过低秩矩阵逼近技术高效地填补缺失值,恢复原始基因表达模式的完整性和准确性。 自适应阈值低秩近似(ALRA)介绍 ALRA是一种用于在单细胞RNA测序数据中的缺失值插入方法,在预印本“使用低秩近似法对scRNA-seq数据进行零保存插值”中有详细描述。给定一个scRNA-seq表达矩阵,ALRA首先通过随机SVD计算其rank-k近似值。接下来,每一行(基因)都以该基因最负数值的大小为阈值。最后一步是重新缩放整个矩阵。 此存储库包含用于在R中运行ALRA所需的代码。使用ALRA前需要安装RSVD软件包,可以通过执行`install.packages(rsvd)`来完成这一操作。 此外,对于已经安装了该软件包的用户来说,现在提供了一个名为use.mkl的标志,这可以显著提高基于默认rpca版本的速度。需要注意的是,rpca-mkl仍在开发中,并未在CRAN上发布,因此它并非必需的软件包;然而如果用户已安装了此扩展,则可以通过将标志设置为True来启用它的使用功能。
  • MATLAB贪心算代码-SMSC:scRNA-seq谱聚类
    优质
    本文介绍了一种基于MATLAB实现的贪心算法代码SMSC,专门针对单细胞RNA测序(scRNA-seq)数据开发的一种谱系图聚类方法。该工具能够有效提高大规模scRNA-seq数据分析的准确性和效率。 该项目提供了一种用于scRNA-seq数据的谱聚类方法,并使用了贪婪算法来优化短信中心。主要代码文件包括`computeKernel.m`、`run.m`以及由后者调用的`selfweightmkl.m`,其中`computeKernel.m`负责计算内核矩阵,而`run.m`是整个流程的主要入口点。 项目中还附带了一个关于Yan数据集的演示。用户只需下载代码并设置正确的文件路径后运行主函数`run.m`即可开始实验。输入为包含scRNA-Seq表达数据的data.m文件,输出则保存在名为results.txt的结果文档里。 此外,该项目实现了一种称为FINCH(第一个整数邻居聚类层次)算法的方法,并提供了相应的Matlab代码。使用方法如下: ```matlab [c, num_clust] = FINCH(data, initial_rank, verbose); ``` 其中`data`为数据矩阵,每一行代表一个特征向量;`initial_rank`是一个可选的Nx1索引向量,用于指定初始邻居信息(传递空[]则自动计算);参数`verbose`控制是否输出详细过程信息。该函数返回值包括: - `c`: NxP矩阵,每个列向量表示不同聚类结果中的簇标签; - `num_clust`: 显示的聚类数量。 以上为项目的概述与使用说明。
  • 高效Nystrom核及自适应完成-MATLAB实现
    优质
    本文提出了一种改进的Nystrom方法来高效地进行核矩阵的低秩近似,并介绍了其在MATLAB中的自适应完成技术实现。 介绍一个改进的Nystrom低秩近似Matlab包,该工具广泛应用于大规模机器学习和数据挖掘问题。此包无需特定函数、工具箱或库支持。 改进后的Nystrom方法利用K-means聚类中心作为锚点,显著提升了核矩阵的逼近质量。鉴于Matlab内置kmeans函数效率较低,作者编写了一个更高效的版本(eff_kmeans.m)。为了进一步优化性能,建议将K-means迭代次数设为较小值,例如5次。 该包的主要特点如下: 1. 支持改进型Nystrom低秩近似算法应用于核矩阵的计算(包括RBF、线性或多项式核); 2. 适用于大规模数据集下的KPCA、Laplacian Eigenmap/谱聚类及MDS等任务,通过改进的Nystrom低秩逼近技术实现。
  • 论文探讨-EM算缺失.pdf
    优质
    本文深入探讨了使用期望最大化(EM)算法处理和填补缺失数据的有效方法,为数据分析提供了一种强大的工具。通过理论分析与实例验证相结合的方式,展示了该方法在不同场景下的应用价值及优势。 一种基于EM算法的缺失数据插补方法由庄朋和孟凡荣提出。在科学研究中,多维数据集成是一种重要的手段,在实际应用过程中,整合后的数据集不可避免地会出现一些缺失值。本段落提出了一种利用EM算法来处理这种问题的方法。
  • 单细胞RNA测序分析(scRNA-Seq
    优质
    简介:单细胞RNA测序(scRNA-Seq)技术能够解析复杂组织中每个细胞的基因表达情况,为生物学研究提供前所未有的详细信息。本专题探讨了如何有效处理和解读这些海量且复杂的单细胞转录组数据,以揭示细胞异质性和发育轨迹等关键问题。 为期2天的单细胞RNA-Seq分析课程将涵盖从scRNA-seq实验获取的数据计算分析方法。我们非常欢迎所有有助于改进本课程的贡献!如果您在过程中遇到任何疑问、疑虑或困难,维护人员会尽力提供帮助。 请熟悉我们的规定,并了解如何以正确的格式呈现本地课程内容以及编写新章节的方法。您可以查看当前列表来获得为该存储库做出贡献的想法。为了进行您的贡献,我们使用GitHub流,在相关章节中对此有详细解释。 本课程的当前维护者是 [此处应填写维护者的姓名或联系方式] ,如果您想引用此课程,请向他们咨询。 作者可以在“找到参与者列表”部分查看参与本课程的人士名单。
  • .rar_Charef_charef _oustaloup分_oustaloup _view
    优质
    本资源包含Charef近似法和Oustaloup分数阶逼近等技术,适用于研究与应用分数阶系统建模、分析。 oustaloup分数阶近似方法与charef分数阶近似方法可以应用于分数阶控制与动态分析。
  • SL0算似L0范压缩感知信号重建MATLAB
    优质
    本研究提出了一种基于MATLAB实现的SL0算法,用于通过模拟L0范数来优化压缩感知中的信号重构过程。 SL0算法是一种基于近似L0范数的压缩感知信号重建方法。它利用最速下降法和梯度投影原理逐步逼近最优解,并具备匹配度高、重建时间短以及计算量低等优点,同时不需要事先确定信号稀疏度这一先验条件。
  • 最优岩土参概率模型推断(2005年)
    优质
    本文发表于2005年,采用最优数值逼近技术探索并建立了岩土工程参数的概率模型,为不确定性分析提供了新的方法。 本段落提出了一种基于数值逼近原理的最佳方法来推断岩土参数的概率模型,并利用勒让德多项式拟合这些参数的概率密度函数。通过将六种经典概率分布与相应的勒让德多项式概率模型进行对比,结果显示所得到的逼近表达式具有良好的拟合性能。该方法直接根据试验样本信息和统计技术来进行推断,而不是先假设为经典的理论概率分布形式,因此其数学和物理意义更为充分。研究结果表明,这种方法避免了复杂的数值计算,并且计算结果稳定可靠,能够满足岩土工程可靠性分析的需求。文中包含图6、表3以及10篇参考文献的引用。
  • 多项式混沌展开:对若干维概率分布MATLAB实现
    优质
    本研究通过MATLAB实现了多项式混沌展开技术,用于逼近多个一维概率分布,为不确定性量化提供了一种高效算法。 主文件“PC_examples_1D.m”包含使用多项式混沌(PC)扩展来近似几个概率分布的基本示例。该方法的核心在于正交多项式的计算以及 PC 系数的估计:一、提供了 N 维 Hermite、Charlier 和 Jacobi 多项式的计算函数;可以轻松地将其扩展到其他类型的正交多项式。二、PC 系数是通过投影法和高斯-赫米特积分来估算的,目前该步骤仅针对 1D 赫尔梅特多项式编程实现。因此,需要进一步将此方法扩展至其他类型的正交多项式。使用回归方法估计 PC 系数可以解决这一问题(希望它会在未来版本中得到包含)。
  • LRR: 表示
    优质
    低秩表示方法(LRR)是一种用于数据恢复与分析的技术,通过将数据矩阵分解为低秩部分和稀疏部分来识别并修复数据中的异常值。这种方法在计算机视觉、模式识别等领域有广泛应用。 低秩表示是近年来图像处理领域的一个新兴研究方向。本段落档包含了LRR的原始程序及其改进方法。