所谓结构上的变异呐,也就是RNA序列的变异。

主要呐,是3种:

第1种,是可变剪接

第2种,是融合基因

第3种,是点突变,也就是SNP

结构分析需要较深的测序深度

这里要说明一下,对于想要测mRNA结构变异的用户呢,建议测序深度要测比较深。

我们一般呐是建议测10G以上的数据量——原因是二代测序,目前的测长还不是很长,每一个Read呐,只有大约100到125个Bp左右。如果测序深度不够呐,那么读到的这些read在整个的mRNA上的分布呐,是一种比较零碎的一种状态。

Untitled

那么在这种比较零碎的、不完整的覆盖情况下,要去分析哪里有一个剪接点,哪里有一个断点,哪里有一个SNP,它不是很准确的。

当测序深度足够深的时侯,在每一个位点,都有10几次、或者几10次的覆盖的时侯呐,我们就可以比较有把握地来判断出,哪儿有了一个新的剪接点,哪儿出现了一个断点,哪儿,碱基发生了突变。

可变剪接

可变剪接,在真核生物中普通存在。一般一个人的组织样本当中呐,可以通过高通量测序,发现有5000个到20000个左右的可变剪接。

融合基因

融合基因,是指原来在基因组上分开的2个基因,因为某种原因,染色体发生了重排。

重排的结果,是让A基因的头,接到了B基因的身体上,这样就产生了融合基因。

那么这张图,就是一个癌细胞中的融合基因的示意图。

接下来这张图,是高通量测序测到融合基因的这个图。我们可以看到这10几个Reads都横跨在这个融合基因的、交接点的两侧,由此,证明了这个癌细胞当中有这么一个融合基因。

Untitled

Untitled

点突变

RNA-seq呐,还可以找出点突变,这是一张泡泡图,来表示我们所找到的点突变。

发生突变频率最高的这个基因,就用最大的泡泡来表示。(突变)频率低一点的,就画一个小一点的泡泡(频率),再小一点,那么再小一点的泡泡。

这些泡泡呈逆时针排列,形成这样一个泡泡图。

Untitled