1. PCR偏差

    单个细胞含有约10pg total RNA,而约80%以上信息为rRNA,从单细胞RNA到文库意味着核酸的扩增量要达到百万倍以上。而在这个高的扩增量不引入PCR偏差一直是个较大的问题。

    所谓PCR偏差,就是在PCR扩增过程当中,某些片段被大量扩增,而大部分片段被扩增的量很少,甚至根本就没有被扩增。结果就导致高通量测序,只能测到这所有样本当中很少一部分的片段序列。

    PCR偏差会随着PCR循环的次数的增多而指数放大。那么,在这种情况下,一方面要把核酸扩增几百万倍,甚至更多的倍数;另一方面,又想得到均一覆盖的文库,这就是单细胞mRNA建库当中,所要解决的第一个大难题。

    我们可以想一下,如果两个样本基因表达量是相同的,但扩增效率A是99%,B是97%,在扩增30个循环后,两者在扩增后的表达就有了1.84 (0.99^30/0.97^30) 倍的差异。而当我们分析差异基因的时候如果选1.5倍作为差异基因的标准,那么本来没有差异的基因也会出现差异。

  2. 去除rRNA

    rRNA (核糖体RNA)在total RNA占比-般在80%以上,如果不加区分地进行逆转录,再扩增、建库很可能测序得到的绝大部分序列都是rRNA的序列,但是一 般情况下,rRNA序列不能给我们带来有效的信息,可以说它是无用的。

    这样,如何能够选择性地把mRNA转化成测序文库,并且避免把rRNA带到测序文库中来,这就是单细胞mRNA测序当中,要解决的第二个大难题。