那么作为一种针对全转录组的分析,我们希望是一次看到一个整体的样本(表达)差异的情况。而不仅仅是看少数几个基因的表达差异。

科学家做了一种叫“火山图”的一个图形,来比较形象地来说明2个样本之间的表达差异。

这个图呐,是2个样本的RNA的表达量的对比。

Untitled

横轴:表示某个基因的表达是上升了,还是下降了。

如果这个基因的表达是上调了,那么这个点呐,就往右移动。反之,如果这个基因的表达量是下调了,那么这个点呐,就往原点的左移动。

纵轴:表示这种差异的置信程度,这其中的每个点呐,就是两个样本当中同一个基因的mRNA表达量的变化。

如果这个置信程度越高呐,那么这个点的纵轴位置也越高。

在纵轴上划了这样一条水平线,超过这个水平线以上的(点)呐,(其差异水平的)置信程度是很高的。我们就把它标示成红颜色。如果低于(这条水平线的)置信程度呐,它的置信程度也相对低一些,我们把它标成蓝颜色。

这里要解释一下,为什么差异程度是相同的情况下,它们的差异置信程度是不一样的。比如说同样是差了2的5次方,也就是32倍,它的差异置信程度会不一样,有些是蓝点,有些是红点。

A基因在甲样本中,被测到了3200条,而在乙样本中被测到了100条;B基因在甲样本中,被测到了320条,而在乙样本中被测到了10条。它们同样是差了31倍,但是因为A基因的样本统计数,远大于B基因的样本统计数,也就是说,它们的Reads数有那么大的差距。

所以,A基因的这个差异的置信程度,会比B基因的这个差异置信程度要高许多。

那么,我们再来对比这两张图。那么就可以比较直观地发觉,左侧的这个图当中,有更多的基因表现出明显的差异,这样呐,火山图就为我们提供了一个形象的、直观的、整体表达差异信息。

Untitled