用途:展示分布状态;eg:芯片、RNA-seq分析
- 评估两组数据的一个总体的分布趋势
(不同样本之间的集中趋势、表达量的相关性)
- 评估重复样本的重复性(一个样本通常要做三次- - -任意两次数据做相关性分析:
如果都集中在对角线上→说明两个样本相关性非常好,实验重复性好,实验没有问题
)
散点图是用两组数据构成多个坐标点,考察坐标点的分布,判断两变量之间是否存在某种关联(一般用于相关性分析- - -相关系数r)或总结坐标点的分布模式
相关系数r:正相关、负相关、不相关
芯片数据
横坐标:对照组 Ctrl
纵坐标:实验组 exp
点:代表某一个探针信号在不同样本中的一个强弱
线:fold change的阈值线(fold change =2)
在线外:信号的倍数超过两倍,基因表达量具有显著差异
红线一下,绿线以上:相关性非常好