肿瘤的形成经历了一系列关键的转变,包括从正常病变到癌前病变,以及从癌前病变到恶性状态。多状态与肿瘤微环境 (TME) 中的动态细胞组分和细胞通讯相关。近年来,癌症免疫疗法为癌症治疗带来了范式转变。由于 TME 内显著的遗传和细胞异质性,只有一小部分患者可以从免疫治疗中获益。此外,一些对治疗表现出良好初始反应的患者最终在免疫治疗期间产生耐药性。因此,研究不同条件下细胞类型组成的变化和TME中的细胞间相互作用可能会克服耐药性并发现新的临床意义。
单细胞 RNA-seq (scRNA-seq) 是研究 TME 中细胞类型组成异质性的强大技术。它已被广泛用于发现参与肿瘤进展的新型细胞类型,并鉴定导致耐药的细胞。然而,快速积累的肿瘤scRNA-seq数据也对广泛的数据重用和探索构成了关键障碍。TISCH2是一个专注于 TME 的scRNA-seq 数据集的scRNA-seq 数据库。TISCH 采用标准化工作流程统一处理 scRNA-seq 数据,可去除样本之间的批次,统一注释细胞类型并识别恶性细胞。TISCH2的在线可视化和分析功能使生物医学研究界能够以单细胞分辨率探索TME中的基因表达。
TISCH2 数据库包含来自20 个不同组织中50种癌症类型的190个数据集的6297320个细胞,数据的总数几乎是以前版本大小的三倍。至于治疗的肿瘤scRNA-seq数据集,在当前的TICH2中提供了40个不同治疗条件下的数据集(35个人类数据集和5个小鼠数据集),其中包括免疫疗法、化疗、靶向治疗和联合治疗。平均而言,每个数据集有32210个细胞,NSCLC的最大数据集有816654个细胞。
TISCH2不仅是TME中单细胞基因表达的综合资源,而且还提供了许多有用的分析功能。之前的TISCH版本主要包括两个模块,数据集模块和基因模块。更新后的 TISCH2 在数据集模块中包括两个新功能,即 CCI 和 TF 富集分析,在基因模块中包括两个新功能,即存活和相关基因分析。
数据集模块函数
在数据集模块中,TISCH2 支持对单个数据集或多个数据集之间的详细探索。对于每个数据集,TISCH2 将显示其癌症类型、物种、平台信息、治疗、分期和相关出版物。特别是,对于免疫治疗数据集,TISCH2在数据集页面上提供了额外的治疗相关分析,包括不同治疗组或反应组患者之间的细胞类型比例比较和DEG分析,以及与免疫治疗相关的特征可视化。详细的分析结果将显示在六个不同的选项卡中,包括用于聚类、细胞类型注释和 DEG 的概述页面、用于表达可视化的基因页面、用于每种细胞类型的功能分析的 GSEA 页面、用于转录调节因子分析的 TF 页面、用于细胞间相互作用分析的 CCI 页面以及用于上述所有数据和分析的下载页面。
在TF选项卡中,用户可以使用预先计算的TF富集结果来识别不同细胞类型的驱动调节因子。使用LISA根据每个簇的标记基因鉴定富集的TFs。TISCH2 分别使用热图显示了恶性细胞簇和其他细胞簇的顶部富集 TF。此外,TISCH2 提供了一个点图,表示每个簇的前 50 个富集 TF,以及一个列出每个簇的最富集的 TF 信息的表格。
在 CCI 选项卡中,TISCH2 提供了细胞间通讯分析结果,以探索当前数据集中细胞类型之间的相互作用。所有簇的显著相互作用的L-R对的数量将使用热图显示,以获得全局概览。对于每个细胞类型簇,TISCH2将使用马戏团图来显示所选簇与其他细胞类型的相互作用概率。最后,TISCH2允许用户分别使用两个气泡图探索详细的L-R相互作用对,选定的细胞类型簇既作为源簇,又作为目标簇。
基因模块功能
基因模块支持对单个基因进行高级搜索,以探索其在不同数据集或癌症类型中的表达水平、共表达基因和临床效果。“平均基因表达”选项卡使用热图或小提琴图显示所有选定数据集的不同细胞类型和数据集中的基因表达。
存活和基因相关选项卡是 TISCH2 中的新功能。在生存选项卡中,棒棒糖图显示了所选基因在 33 种 TCGA 癌症类型中的 HR,其中 HR >1 表示死亡风险增加,HR <1 表示死亡风险降低。在基因相关性选项卡中,列出了所有选定数据集中输入基因的前 500 个相关表达基因,供用户发现基因的共表达模式。默认情况下,TISCH2 将通过热图显示使用所有细胞的相关基因;然而,为了深入了解细胞类型特异性共表达,TISCH2 还允许鉴定特定谱系的相关基因。所有相关信息也列在基因相关性选项卡底部的表格中。