前言:GRN究竟 可以被用来做什么?在bulk GSVA学习时我也有过类似的困惑。在官方文档中,多次强调用GRN AUC去cluster,且效果比单纯基于表达量的降维聚类方法好,SCENIC不是文章做到最后充数的高级分析,而是发现 cell type-specific GRN, 后续聚类发现亚型的利器。
SCENIC in R有两个教程,第一个主要是简介、安装与读入,第二个是pipeline。
SCENIC的输入文件比较简单,scRNA的表达矩阵,列名细胞,行名gene symbol。在数据格式的问题上,作者比较自信,无论raw count、Seurat标准化还是TPM标准化,得到的结果都robust。
SCENIC依赖于三个R包以进行四个步骤:
(1)GENIE3 infers the co-expression network (faster alternative: GRNBoost2).但引入了较多假阳性,需要交到第二步进一步验证筛选。
(2)RcisTarget for the analysis of transcription factor binding motifs.个人认为应R-cis-Target比较合适。
(3)AUCell to identify cells with active gene sets (gene network) in scRNA. 这个AUCell和Seurat里的某个功能、bulk里的GSVA很像,用gene set打分。
(4)根据AUCell结果进行细胞聚类
if (!requireNamespace("BiocM