文献解析:生物信息学部分(6)-SCENIC
近期发表于Science上的科研论文《癌症免疫学-人类肿瘤浸润性B细胞的蓝图》文献中提到:
We used SCENIC to predict and validate theTF regulatory network.
1. 文献来源
Ma J, Wu Y, Ma L, Yang X, Zhang T, Song G,Li T, Gao K, Shen X, Lin J, Chen Y, Liu X, Fu Y, Gu X, Chen Z, Jiang S, Rao D,Pan J, Zhang S, Zhou J, Huang C, Shi S, Fan J, Guo G, Zhang X, Gao Q. Ablueprint for tumor-infiltrating B cells across human cancers. Science. 2024May 3;384(6695):eadj4857. doi: 10.1126/science.adj4857. Epub 2024 May 3. PMID:38696569.
那么,SCENIC是什么呢?
SCENIC
SCENIC(Single-CellRegulatory Network Inference and Clustering)是一种用于单细胞RNA测序(scRNA-seq)数据的转录因子(TF)调控网络推断和细胞聚类的工具。它的主要目的是通过识别和分析基因调控网络(GRNs),揭示细胞类型特异性的调控机制。SCENIC通过三步流程实现这一目标:共表达模块识别、调控网络推断和细胞状态评估。以下是SCENIC的详细介绍:
SCENIC的主要功能
1. 共表达模块识别:
- 使用基因共表达网络分析(如GENIE3或GRNBoost)识别基因共表达模块,这些模块通常由多个协同表达的基因组成。
2. 调控网络推断:
- 使用RcisTarget工具在共表达模块中识别转录因子和其潜在靶基因,构建转录因子调控网络(regulons)。
3. 细胞状态评估:
- 使用AUCell(Area Under the Curve cell scoring)方法计算每个细胞中每个调控网络的活性,评估细胞状态并进行聚类分析。
SCENIC的详细步骤
1. 构建基因共表达网络:
- 将scRNA-seq数据输入GENIE3或GRNBoost,构建基因共表达网络。这些工具使用随机森林或梯度提升树算法,基于基因表达数据推断基因之间的调控关系。
2. 识别转录因子调控网络:
- 使用RcisTarget在共表达模块中识别转录因子及其靶基因。RcisTarget通过扫描基因组序列,寻找转录因子的结合位点,预测转录因子的调控靶基因。
3. 评估调控网络活性:
- 使用AUCell方法评估每个细胞中每个调控网络的活性。AUCell通过计算调控网络中靶基因在每个细胞中的表达累积分数,确定调控网络的活性。
4. 细胞聚类与注释:
- 基于调控网络活性进行细胞聚类,将具有相似调控网络活性的细胞分为同一类。然后,通过分析不同细胞群体中特定调控网络的活性,进行细胞类型或状态的注释。
SCENIC的优缺点
优点:
- 识别细胞类型特异性调控网络:SCENIC可以识别和分析单细胞水平的转录因子调控网络,揭示细胞类型特异性的调控机制。
- 无需预定义的基因集:SCENIC无需预定义的基因集,可以从数据中自动识别重要的调控网络。
- 高分辨率细胞状态评估:通过评估调控网络活性,SCENIC可以高分辨率地评估细胞状态和功能。
缺点:
- 依赖于参考数据库:SCENIC的调控网络推断依赖于RcisTarget的参考数据库,如果参考数据库不完备,可能影响结果的准确性。
- 结果解释复杂:SCENIC生成的调控网络和细胞状态评估结果可能比较复杂,需要一定的生物学知识进行解释。
应用实例
1. 细胞类型鉴定:
- 使用SCENIC分析单细胞RNA测序数据,可以识别不同细胞类型特异性的调控网络,辅助细胞类型鉴定。
2. 细胞状态分析:
-SCENIC可以评估细胞在不同条件下的状态转换,揭示细胞状态的调控机制。
3. 发育过程研究:
-SCENIC可以用于分析发育过程中不同阶段的细胞,识别关键转录因子及其调控网络,揭示发育过程中的调控机制。
4. 疾病机制研究:
- 通过分析疾病组织中的单细胞数据,SCENIC可以识别疾病相关的调控网络,揭示疾病机制和潜在的治疗靶点。
总结
SCENIC是一款功能强大的单细胞RNA测序数据分析工具,专注于转录因子调控网络的推断和细胞状态评估。通过识别和分析基因调控网络,SCENIC可以高分辨率地揭示细胞类型特异性的调控机制,辅助细胞类型鉴定和状态分析,在生物医学研究中具有广泛的应用前景。