高通量测序基因组拼接技术指标中的Contig N50和Scaffold

来源:学生作业帮助网 编辑:作业帮 时间:2024/05/12 17:44:01
高通量测序基因组拼接技术指标中的Contig N50和Scaffold

高通量测序基因组拼接技术指标中的Contig N50和Scaffold
高通量测序基因组拼接技术指标中的Contig N50和Scaffold

高通量测序基因组拼接技术指标中的Contig N50和Scaffold
给你举个例子,比如一个基因组大小是1M,测序得到若干条reads,这些reads进行拼接,如果完全可以拼接起来,中间没有gap的序列称为contig,即连续的意思.如果中间有gap,但是可以知道gap的 长度,这样的序列就叫做scaffold,即脚手架(非连续)的意思.
然后把contig 和 scaffold 从长到短进行排列,然后相加,当恰好加到1M的50%,也就是500k的时候 ,那一条contig 或者scaffold 的长度就叫做Contig N50和Scaffold N50.很明显这个数值越大说明组装的质量越好.