基于单细胞RNA-seq和体RNA-seq数据的肝细胞癌相关成纤维细胞(CAF)的表征和基于CAF的风险特征构建

栏目:最新研究动态 发布时间:2022-12-02
癌症相关成纤维细胞(CAFs)参与肿瘤生长、血管生成、转移和治疗抵抗。近日,有研究探索肝细胞癌(HCC)中CAFs的特征......


癌症相关成纤维细胞(CAFs)参与肿瘤生长、血管生成、转移和治疗抵抗。近日,有研究探索肝细胞癌(HCC)CAFs的特征,并建立一个基于CAFs的风险标签,用于预测HCC患者的预后。该研究发表在《Frontiers in immunology》,IF8.786


技术路线:



主要研究结果:

1. 筛选scRNA-seq样品中的CAFs

本研究的流程图如图1所示。初步筛选后,从scRNA-seq数据中共获得69,145个细胞(表1)。图2A为21个样本分布的TSNE图,生成了4个CAF聚类 (图2B)。4个CAF簇中共鉴定出211个DEGs,其中排名前5位的DEGs(被确定为CAF簇的标记基因)在4个簇中的表达如图2C所示。每个队列中4个集群的比例见图2D。这些DEGs富集于多条通路,包括血管平滑肌收缩、黏着斑、催产素信号通路、PPARG信号通路等(图2E)。此外,根据CNV特征,4个CAF簇由1533个肿瘤细胞和正常细胞组成(图2F)。


1 本研究实验流程图


1样品过滤前后的细胞计数


2基于HCC患者scRNA-seq数据识别CAF集群


2. CAF中癌相关途径的表达

不同CAF簇中10条肿瘤相关通路的GSVA评分如图3A所示。CAF_0簇中的恶性细胞比例显著高于其他三个簇(图3B)。而CAF_1、CAF_2、CAF_3之间差异无统计学意义。进一步分析每个CAF簇中恶性与非恶性细胞间10条肿瘤相关通路的GSVA评分,发现有轻微差异(图3C-F)。为了确定CAF集群和预后之间的关联,首先基于TCGA队列计算了每个CAF集群的标记基因(图2C中定义的CAF集群的前5个DEGs)的ssGSEA评分。结果表明,CAF_2簇在肿瘤样本中的评分显著高于正常样本,而其他CAF簇的趋势相反,正常样本中的评分高于肿瘤样本(图4A)。根据survminer R包分析的最佳截断值将TCGA数据集的HCC样本分为高CAF评分组和低CAF评分组。高CAF评分组样本在CAF_0、CAF_1和CAF_2簇中的预后优于低CAF评分组样本,而CAF_3与HCC的预后无关(图4B-E)。上述结果表明,尽管肝癌和正常样本的CAF_3富集不同,但CAF_3簇可能在肝癌进展中作用不大。


3 CAF簇中肿瘤相关通路的特征


4 4CAF聚类与HCC患者预后的关系


3. CAF相关的关键基因的鉴定

为了构建风险标签,首先在肿瘤和正常组织之间筛选出DEGs。如图5A所示,共获得2349个DEGs,其中462个上调,1887个下调。其中,有423个基因与这些预后相关的CAF集群显著相关。进一步通过单因素Cox回归分析评估每个基因的预后价值,有234个基因具有预后价值(图5A, B)。Lasso Cox回归分析缩小基因数量,剩下11个基因lambda=0.047(图5C, D)。采用逐步回归法进行多因素Cox回归分析后,最终纳入6个基因 (图5E)。根据每个样本的风险评分,将样本分为高风险组和低风险组。在TCGA队列和GEO队列中,1 ~ 5年生存率模型的AUC值范围分别为0.68 ~ 0.76和0.65 ~ 0.7(图5F, G)。Kaplan-Meier生存分析显示,高危患者的生存结局显著劣于低危患者(图5H, I)。


5确定用于构建风险标签的核心预测基因


4. 关键基因突变及通路分析

检测该风险标签的6个基因的SNV突变情况。结果显示,ADAMTSL2、SLCO2A1、HMGXB3、LUC7L3和CD4在更多的样本中有SNV突变并均无显著的共现概率,而GCN1中未观察到SNV突变,且在这6个基因中只有非常少的样本有CNV的获得/丢失(图S4A-C)。此外,SLCO2A1与非整倍体评分、同源重组缺陷、改变的部分、节段数量和非沉默突变率呈显著负相关,而HMGXB3、LUC7L3和GCN1与同源重组缺陷和改变的部分呈显著正相关(图S4D)。接下来,还分析了与每个风险基因相关的潜在通路,与这6个基因显著相关的通路共有39条,包括血管生成、顶端连接、凋亡等(图6A和B)。


S4风险特征中包含的基因突变的特征


6识别风险基因参与的通路


5. 核心基因与免疫的关系

ADAMTSL2、SLCO2A1和CD4与间质评分、免疫评分和估计值呈显著正相关,而LUC7L3与间质评分、免疫评分和估计值呈显著负相关。然而,三种评分与其他基因(GCN1和HMGXB3)之间没有观察到显著的相关性(图S5A)。根据各基因表达量的中位数分组后,比较不同表达组的3个评分。结果显示,对于ADAMTSL2、SLCO2A1和CD4基因,高表达组的三个评分均显著高于低表达组(图S5B)。相关性分析显示ADAMTSL2、SLCO2A1、CD4与大部分T细胞呈显著负相关。此外,LUC7L3、GCN1和HMGXB3与M0巨噬细胞和中性粒细胞呈显著正相关(图S5C)。几种免疫细胞中风险基因的高表达组和低表达组之间存在显著差异(图S5D)。


S5风险基因与免疫景观的关系


6. 风险特征对PD-L1阻断免疫治疗的反应性

T细胞免疫疗法已成为一种具有协同生存获益的抗癌疗法。IMvigor210队列中的348例患者对抗PD- l1受体阻滞剂表现出不同程度的缓解,包括完全缓解(CR)、部分缓解(PR)、疾病稳定(SD)和疾病进展(PD)。SD/PD患者的风险评分高于CR/PR患者(图7A)。在高危组中,SD/PD百分比高于低危组(图7B)。在IMvigor210队列中,与高危组患者相比,低危组患者显示出显著的临床获益和显著较长的总生存期(图7C, p=0.0053)。具体来说,I+II期患者在不同风险组之间有显著的生存差异(图7D, p=0.0017),但在III+IV期患者中无显著差异(图7E, p=0.5),提示风险评分在早期患者中更敏感。在GSE78220队列中,还发现低危组患者的总生存期显著长于高危组(图7F, p=0.036),高危组的SD/PD百分比高于低危组(图7G)。


7 IMvigor210队列中风险评分对PD-L1阻断免疫治疗的反应性


8. 确定独立危险因素并绘制列线图

多因素分析显示,风险标签是影响骨肉瘤患者预后的最重要的独立因素,其次是转移状态 (图8A、B)。因此,构建了联合分期和风险评分的列线图(图8C)。校准图显示,列线图可以有效预测实际生存结局(图8D)。此外,DCA显示列线图对高危患者的识别能力优于风险评分和分期(图8E)。TimeROC分析显示,风险评分和列线图的AUC高于TCGA队列中的其他指标(图8F)。


8建立预测肝癌预后列线图


结论:

综上所述,该研究系统地描述了HCC中CAF群体的特征,并产生了4个具有显著多样性的CAF集群。4个聚类之间的DEGs富集在血管平滑肌收缩、黏着斑、催产素和PPARG信号通路等。其中3个基因簇与HCC预后显著相关,并用于构建一个基于6个基因的预后风险标签。作者观察到基于CAF的基因标签与免疫景观相关,可以用于预测对PD-L1阻断免疫治疗的反应性。最后,基于风险标签和临床病理特征建立了一种新的列线图模型,该模型对HCC患者的临床结局具有良好的预测性能。