高通量测序技术堪称DNA序列分析技术发展历程的一个里程碑。该技术可以对数百万个DNA分子进行同时测序,这使得对一个物种或个体的转录组和基因组进行细致全貌的分析成为可能,因此 也将其称为深度测序(deep sequencing) 或下一代测序技术(next generation sequencing, NGS)。为便于理解和应用,在此首先介绍常规的DNA测序方法。

DNA常规测序的原理,是基于F.Sanger建立的双脱氧链末端合成终止法。即在以单链DNA为模板的DNA合成反应体系中,利用一定比例的4种3'-双脱氧核苷三磷酸(ddNTP)代替部分脱氧核苷三磷酸(dNTP)作为底物,一旦双脱氧核苷三磷酸掺入到合成的DNA链时,由于核糖的3'位碳原子上不含羟基,无法与下一个核背酸反应形成磷酸二酯键,导致正在延伸的DNA终止。目前最常应用的是四色荧光自动化测序技术。用4种发出不同颜色荧光的荧光素分别标记4种ddNTP, 以一定的比例与4种无标记dNTP混合,在同一反应管中用单向引物进行DNA延伸反应,带荧光素标记的某一3'-双脱氧核苷三磷酸在掺入DNA片段导致合成终止的同时,使该片段3'端标上了这种特定的荧光素。同一反应管中大量的模板DNA经过20~30循环的单向延伸反应,最终会产生许多仅相差一个单核苷酸的不同长度的单链DNA片段混合物,每个DNA片段3'末端的最后一个ddNTP, 决定了该片段发出的荧光颜色。每一管中混合存在的不同长度的单链反应产物可以通过凝胶电泳在同一个泳道有效分开。检测器的激光束在凝胶的底部附近检测并记录通过泳道的每一条带所标记的荧光颜色,计算机阅读这四种颜色后得到并存储核酸序列。

与常规的DNA测序方法相比,高通量测序的原理是将DNA固定在芯片上,测序反应以大规模阵列形式排列,边合成边测序,不依赖于电泳,阵列上DNA合成时的单个碱基改变所发出的荧光信号被检测器捕获并转化为一个测序峰值,从而获得序列信息。荧光信号可以由被荧光标记的dNTP产生,也可以由DNA合成时所触发的酶催化底物激发出的荧光形成。目前应用的高通量测序技术以Roche公司的454焦磷酸测序技术、Illumina公司的Solexa聚合酶合成测序技术和ABI公司的SOLiD连接酶测序技术为主,这些技术在测序开始时,均需要基于PCR扩增的信号放大过程。新近发展起来的以对单分子DNA进行测序(非PCR扩增)的技术,真正达到了读取单分子荧光的能力。

高通量测序技术的实际应用价值是与其他基因组水平研究技术的联合。例如,高通量测序技术与转录组技术结合,可进行高通量的RNA测序,即RNA-seq。通过对同一样品转录组的深度测序可以捕获低表达的基因,而对大量样品同时测序可以获得样品之间的表达差异。高通量测序技术与 ChIP联合,形成ChIP-seq技术;与基因组甲基化检测技术结合,形成Methyl-seq技术;与CLIP技术结合,形成CLIP-seq技术。联合应用RNA-seq、ChIP-seq、Methyl-seq、CLIP-seq, 再应用有效的生物信息学方法,对获得的数据进行深入分析,可大大加深我们对复杂基因调控系统的网络结构和相互作用方式的认识。高通量测序技术使得单细胞测序技术成为可能。