
Fasta文件中的序列模式统计。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
序列统计主要涉及对fasta文件进行一系列基本统计数据的计算。 迄今为止,已经完成了GC百分比、GC偏度以及滑动窗口(并可选择性地包含重叠)中唯一kmer计数的实现。 如果能够审阅代码并探索优化其运行效率的方法,那将十分有价值。 我们期待着未来能够添加更多功能,例如在每个窗口中提供更具实际意义的统计信息。 这些位信息已从其他资源中提取,并在源文件中明确标示。 此外,还生成了一个常规统计文件,其中记录了处理的重叠组(即染色体)的数量、总序列长度、全局GC百分比以及L/N10-50的值。 例如,使用的参数包括:-f Athaliana_genome/Athaliana_1_5_m_c.fasta。 总的 contigs 处理数量为7个,处理的总序列长度为119668634个碱基对,全局GC%为0.3605598671007913,L/N10-50的值为L。
全部评论 (0)
还没有任何评论哟~


