Advertisement

第三代基因组组装工具

  •  5星
  •     浏览量: 0
  •     大小:None
  •      文件类型:None


简介:
第三代基因组组装工具是指利用最新的测序技术和算法进行高效、精确的基因组序列拼接软件和方法集合,显著提升复杂基因组研究能力。 MECAT是一款针对单分子测序(SMRT)读段的超快速映射、错误校正及从头组装工具。它采用了新型的比对和错误校正算法,相比现有最先进的比对器和错误校正工具更加高效。MECAT适用于大规模基因组的有效从头组装工作。例如,在配备32个线程、2.0 GHz CPU 的计算机上,基于54倍SMRT数据量,MECAT仅需9.5天即可完成人类全基因组的组装任务,这比当前使用的PBcR-Mhap管道快了40倍。同时我们还使用MECAT在配备102倍SMRT数据的情况下,在25天内完成了二倍体人类全基因组的组装工作,相较于之前基于单倍体SMRT数据(54x)所获得的人类全基因组图谱的质量有了显著提升。 我们在五份真实的数据集中将MECAT的表现与PBcR-Mhap管道、FALCON和Canu(v1.3)进行了比较。在配备有32个线程的2.0 GHz CPU 和 512 GB 内存的计算机上,由MECAT产生的组装片段质量不低于或优于 PBcR-Mhap 管道以及 FALCON 的结果。

全部评论 (0)

还没有任何评论哟~
客服
客服
  • 优质
    第三代基因组组装工具是指利用最新的测序技术和算法进行高效、精确的基因组序列拼接软件和方法集合,显著提升复杂基因组研究能力。 MECAT是一款针对单分子测序(SMRT)读段的超快速映射、错误校正及从头组装工具。它采用了新型的比对和错误校正算法,相比现有最先进的比对器和错误校正工具更加高效。MECAT适用于大规模基因组的有效从头组装工作。例如,在配备32个线程、2.0 GHz CPU 的计算机上,基于54倍SMRT数据量,MECAT仅需9.5天即可完成人类全基因组的组装任务,这比当前使用的PBcR-Mhap管道快了40倍。同时我们还使用MECAT在配备102倍SMRT数据的情况下,在25天内完成了二倍体人类全基因组的组装工作,相较于之前基于单倍体SMRT数据(54x)所获得的人类全基因组图谱的质量有了显著提升。 我们在五份真实的数据集中将MECAT的表现与PBcR-Mhap管道、FALCON和Canu(v1.3)进行了比较。在配备有32个线程的2.0 GHz CPU 和 512 GB 内存的计算机上,由MECAT产生的组装片段质量不低于或优于 PBcR-Mhap 管道以及 FALCON 的结果。
  • SPAdes:
    优质
    SPAdes是一款高效的基因组和转录组从头测序组装软件,尤其擅长处理微生物及复杂重复序列较多的基因组数据。 SPAdes 3.15.2手册 1.1 1.2 1.3 2.1 2.2 2.3 2.4 3.1 3.2 SPAdes命令行选项 3.3 组装IonTorrent读取 3.4 组装长的Illumina配对读取(例如:2x150和2x250) 3.5 HMM引导模式 3.6 SPAdes输出 3.7 质粒SPAdes输出 3.8 metaplasmidSPAdes和metaviralSPAdes输出 3.9 生物合成叶片输出 3.10 组装评估 4.1 在SPAdes软件包中发布的独立二进制文件 4.2 k聚体计数 4.3 k-mer覆盖度读取过滤器 4.4 k-mer基数估计 4.5 图的构造 4.5.1 长时间阅读以图对齐 4.5.2 hybridSPAdes对齐器和SPAligner 参考文献 反馈与错误报告 关于SPAdes
  • PGGB:泛图构建
    优质
    PGGB是一款专为研究人员设计的软件工具,用于高效地构建和分析复杂生物体的泛基因组图谱。该工具能够整合来自不同个体的遗传信息,揭示物种多样性,并支持个性化医学研究及作物改良等应用领域。 GG泛基因组图构建器通过将序列集合渲染到变异图模型中的pangenome图来建立全景基因组结构。其目标是创建一个局部有向无环图,并保持大规模的多样性,这对解释、可视化及重用整个基因组变异图至关重要。 该过程分为三个阶段: 1. **对齐**:此步骤使用概率mash-map映射器(如edyeet和wfmash),它们首先通过mashmap获得近似映射,然后进一步细化以得出精确的比对。这两个工具的基本级算法不同:edyeet基于特定方法进行映射,而wfmash则采用不同的策略。这些工具会将输入中的所有基因组片段与其它片段进行比较,并设定一个最大序列差异水平来构建全基因组图。 2. **图形归纳**:从比对中推导出全景基因组图。这一过程在内存有效的磁盘支持下,通过隐式的间隔树结构建立图的表示形式。然后,基于输入序列中的碱基传递闭合计算结果,在图中标记路径以重构原始数据信息。
  • CoGe平台:比较
    优质
    CoGe是一款功能强大的在线工具集,专为比较基因组学设计。它提供了多样化的数据处理和可视化选项,支持用户进行基因组比对、进化分析及遗传信息检索等研究活动。 CoGe平台是一个基于Web的工具集合和数据库资源库,旨在帮助生物学家开展比较基因组学研究。关于详细的安装指南,请访问相关的页面获取更多信息。
  • 测序技术及其作原理简介
    优质
    本文将简要介绍三代基因组测序技术的基本概念、特点及工作原理,帮助读者了解其在现代生物学研究中的重要性。 三代基因组测序技术简介及其原理整理 第一代测序技术:第一代DNA测序技术采用的是1975年由桑格(Sanger)和考尔森(Coulson)开创的链终止法,以及在1976至1977年间由马克西姆(Maxam)和吉尔伯特提出的化学裂解方法。
  • VIGOR3:开源病毒注释
    优质
    简介:VIGOR3是一款先进的开源软件工具,专门用于自动化病毒基因组的功能注释和分析。它能够处理大量数据,提供准确、高效的基因预测及功能分类,助力病毒学研究的深入发展。 VIGOR 是一款用于识别病毒基因组编码基因的工具。它由 Jeff Hoover 和 Wang Shiliang 为 JCVI 传染病基因组测序中心(GSCID)开发。相关研究详情请参阅文献:http://www.biomedcentral.com/content/pdf/1471-2105-11-451.pdf
  • Prokka:高效的原核注释
    优质
    Prokka是一款用于快速、高效地对原核生物基因组进行自动注释的软件工具。它能够迅速处理大规模数据集,并提供高质量的功能预测和分类信息,是生物信息学研究中的重要资源。 全基因组注释是指识别一组基因组DNA序列中的重要特征,并用有用的信息对其进行标记的过程。Prokka是一种软件工具,可以快速注释细菌、古细菌和病毒的基因组,并生成符合标准的输出文件。 安装Bioconda时,请使用以下命令: ``` conda install -c conda-forge -c bioconda -c defaults prokka ``` 如果您使用的是Homebrew或Docker,则分别执行以下命令进行安装: 对于Homebrew,您可以运行: ``` brew install brewsci/bio/prokka ``` 对于Docker,请先拉取最新镜像: ``` docker pull staphb/prokka:latest ``` 然后创建并启动容器实例查看帮助信息: ``` docker run staphb/prokka:latest prokka -h ``` 使用Singularity时,可以构建Prokka的sif文件如下所示: ```shell singularity build prokka.sif docker://staphb/prokka:latest ```
  • Funannotate:真核的注释管道
    优质
    Funannotate是一款专为真核生物基因组设计的全面基因预测和功能注释软件套件。它整合了多种算法与数据库资源,提供从头预测、RNA-seq辅助转录本构建及细致的功能描述等功能,助力研究人员深入解析复杂真核基因组信息。 funannotate 是一个用于基因组注释的管道工具,特别为真菌设计但也可适用于高级真核生物。有关安装、使用及更多信息,请参考快速启动Docker的相关指导。 您可以利用funannotate在Docker环境中运行该软件。需要注意的是,GeneMark组件并未包含在这个Docker镜像中(这是由于许可问题导致难以分发和使用)。此外,我还编写了一个bash脚本,这个脚本能自动检测并绑定正确的用户/卷以运行docker映像。 此Docker镜像是基于master分支的最新代码构建而成,因此它比标记版本更早。该镜像包含了所需的所有数据库;如果您希望在没有这些数据库的情况下进行注释工作,则可以使用名为nextgenusfs/funannotate-slim 的轻量级镜像。 综上所述,您可以通过以下方式来实现上述流程: # 下载/拉取相关资源
  • Open3D
    优质
    Open3D是一款开源库,支持点云数据处理和3D机器视觉。本项目聚焦于介绍与之集成的各类第三方工具和库,丰富其功能应用。 在使用Open3D进行make install阶段安装第三方库时,会因为软件下载而占用较多时间。为避免这一问题,可以将所需资源提前解压到与build文件夹同一级的目录中,从而跳过第三方库的下载步骤。
  • PM_DICOT的MAKER2注释: 四个的研究
    优质
    本研究采用MAKER2工具对四个不同PM_DICOT植物基因组进行深入注释分析,旨在揭示这些物种独特的遗传信息与进化关系。 MAKER2_PM_genome_annotation 使用 MAKER2 对四个 DICOT PM 基因组参考进行注释的软件与数据: **软件先决条件:** - RepeatModeler(版本 1.0.4),包括所有依赖项,如 NCBI BLAST。 - RepeatMasker(版本 4.0.5)和 RepBase(使用的是2015年8月7日版)。 - MAKER 版本 2.31.9 或其他任何版本 2 发行版均可。 - Augustus 版本 3.3 - BUSCO 版本 3 - SNAP - BEDtools(版本为2.24.0) **原始数据/资源:** 1. 基因组支架文件: - > Genome.fa: 使用 CLCbio 从头组装的参考基因组。 - 脱氨修饰 = 是 - 脱氨限制 = 2 - 质量修剪 = 是 - 质量限