一般用Agilent SureSelect 50M的试剂盒进行外显子建库、捕获。再用HiSeq 2500 V4 PE125的方法进行测序,测10个G的数据量。大约可以得到95X的“有效测序深度”。我们说的有效测序深度(effective sequencing depth)是相对于总测序深度来说的。

总的测序深度,是把所有测得的数据(量)去除以目标区域的大小

举例来说,用Agilent 50M的这个试剂盒,我们测到10个G的数据。去除以目标区域的50M的大小,那么得到的是200X的测序深度(10G/50M = 200X)。但是这个200X的测序深度,对于做生物信息学分析来说呐,并没有太大的实在意义。因为当中还要扣掉许多无用的数据,才能得到有效的数据。

在外显子测序中,要扣掉4种因素引起的无效数据