用途:频率分布、突变分析、GWAS关联分析
- 全局的展示数据的全貌
- 快速找到目标位点- - - 获得具体位置、显著性……信息
[ ] 例:全基因组的关联分析 GWAS关联分析**- - 曼哈顿图**
🍅 GWAS 目的:寻找某种疾病/ 某种特定性状相关联的SNP位点
- 为了有效挖掘信息: 做GWAS样本量要足够大、SNP密度要高
- 最佳方案:全基因组测序,但是成本高 - - → 最经济的方案:使用GWAS芯片【芯片上面的SNP位点都是已知的,不像测序能够探测到位置,其密度相对于测序较小,不够的 ———→
需要 **数据填充**(用参照的一个已知的一个单位型的数据去填充)
】
横轴:SNP位点所在的染色体
纵轴:-log10 P
每个SNP计算出来的P值的负对数
P值越显著(越小)—→ 高位显示(远离整体)
基因位点的Pvalue越小即-log10(Pvalue)越大,其与表型性状或疾病等关联程度越强
而且通常来说受到连锁不平衡的影响,强关联位点周围的SNP也会显示出相对较高的信号强度,并依次向两边递减,所以会出现图1中红色部分的现象。
颜色:两种颜色区分单双号/ 不同颜色不同的号
点:每一个点代表一个SNP
蓝色的点表示填充数据
(这里用的是千人基因组计划中的数据作为单位型来填充16号染色体的数据)
线:P值的阈值线
一般,在GWAS的研究中,Pvalue的阈值在10^-6 或者10^-8以下。
P值数量级<10^-8:经典的GWAS研究一般用邦费罗尼校正,它P值的显著性要求P值数量级<10^-8;若实验结果 显著性水平 达不到 10^-8,按实验需求灵活调整
图1 GWAS中常见的曼哈顿图