火山图是散点图的一种,它将统计测试中的统计显著性量度(如p value)和变化幅度相结合,从而能够帮助快速直观地识别那些变化幅度较大且具有统计学意义的数据点(基因等)。常应用于转录组研究,也能应用于基因组,蛋白质组,代谢组等统计数据。
所以关注火山图(其它类型图也是),先理解每个点是什么(点代表基因、样品、通路或其它的,这个认识可以来自于常识,更准确的是看作者的描述),然后看横轴代表什么、纵轴代表什么,再看图例中展示的其他信息,如颜色、大小和形状分别代表什么。这些都理顺了,图理解就不难了。
如图一:
每个点代表一个检测到的基因。
横轴和纵轴用于固定点在空间的位置。
一般横轴是Log2(fold change)
,点越偏离中心,表示差异倍数越大。
纵轴是-Log 10 (adjusted P-value)
,点越靠图的顶部表示差异越显著。
点的大小和颜色也可以表示更多的属性,如下图中点的颜色标记其对应的基因是上调
, 下调
还是无差异
。
大小也可用于展示基因表达的平均丰度,一般我们关注表达水平较高且差异较大的基因用于后续的分析和验证。