背景:转录分类已被用于将结直肠癌(CRC)分成具有不同生物学和临床特征的分子亚型。然而,目前尚不清楚这些亚型是否代表着离散的、互斥的实体,还是具有潜在重叠的分子/表型状态。因此,我们将重点放在CRC固有亚型(CRIS)分类器上,并评估将多个CRIS亚型分配给同一样本是否提供额外的临床和生物学相关信息。
方法:我们使用CRIS分类器的多标签版本(multiCRIS)对新生成的606个CRC患者来源的异种移植物(PDXS)的RNA测序数据进行了分析,同时结合了人类CRC批量和单细胞RNA测序数据集。比较了单标签和多标签CRIS的生物学和临床相关性。最后,开发了基于机器学习的多标签CRIS预测器(ML2CRIS)用于单个样本的分类。
结果:令人惊讶的是,约一半的CRC病例可以明显地分配给多个CRIS亚型。单细胞RNA测序分析揭示,多个CRIS成员身份可能是由于同时存在不同CRIS类别的细胞,或者较少情况下由于具有混合表型的细胞。发现多标签分配可以改善对CRC预后和治疗反应的预测。最后,ML2CRIS分类器在单个样本分类的情境下被验证具有相同的生物学和临床相关性。
结论:这些结果表明,即使同时分配给同一CRC样本,CRIS亚型仍保留其生物学和临床特征。这种方法有潜力在其他癌症类型和分类系统中推广应用。
该研究于2023年5月发表发表在《Genome medicine》,IF:15.266。
技术路线:
实验方法:异种移植物收集、TCGA和PDX RNA-SEQ数据预处理、CRC单细胞数据及其预处理、bulk/scRNA-seq数据和预处理、scRNA-seq数据的伪批量、CRIS分类、单标签分级机、多标号单样分级机。
1、结直肠癌内在亚型的多标签CRIS分层研究
为了改善结直肠癌的分层,并根据CRIS分类捕捉生物特征,我们推断其最近模板预测(NTP)算法不仅可以用于指定最显著的单一类别,还可以评估每个样本对所有CRIS类别的分配,以及每个分配的虚假发现率。因此,我们实施了基于NTP的CRIS分类器的新的多标签版本,名为“multiCRIS”,能够根据与每个CRIS中心点的距离和其显著性将每个样本分配给一个或多个CRIS类别。
首先,将MultiCRIS应用于来自癌症基因组图谱(TCGA)的620个样本的RNA测序数据集,以明确地将91%的样本至少分配给一个类别(图1a)。有趣的是,52%的样本还可以被确信地分配给其他CRIS亚型(图1b)。
值得注意的是,对于所有的CRIS亚型,次要分配的数量与主要分配大致相等(图1c)。多重分配主要发生在两个特定的亚家族之间:CRISA/CRIS-B和CRIS-C/CRIS-D/CRIS-E。最后,为了评估这些多重分配是否捕捉到具有多个CRIS生物特征的肿瘤,我们探索了与每个CRIS类别相关的主要特征。
有趣的是,分配给次要类别的样本在图1d中显示了类别的关键分子特征,包括CRIS-A中的MSI状态,CRIS-C中的KRAS突变的消失,以及CRIS-D/CRIS-E中的WNT信号通路活性和CRIS-B样本中的上皮间质转化(EMT)。值得注意的是,我们观察到具有多个分配的样本倾向于与CRIS中心点之间的距离较大,这可能反映了同时具有不同表型的细胞组成或具有不同表型的细胞混合的情况。
2、多个CRIS分配中的单细胞异质性。
观察到一部分结直肠癌的多个类别分配可以通过两种方式解释:肿瘤由具有模糊表型的癌细胞组成,或者存在混合的不同亚型细胞群体。为了探索支持多个CRIS分配的异质性,我们在一个由PDXS(患者源性异种移植)衍生的5个结直肠癌器官样本集合中进行了一系列的配对单细胞RNA测序(scRNA-seq)和批量谱分析。这些数据允许直接比较单细胞和批量转录组谱分析结果。作为第三个选择,通过聚合一个样本中所有单细胞谱分析结果来获得伪批量谱分析结果。值得注意的是,尽管来自单个细胞的谱分析结果平均捕获了至少5个支持读数的1116个转录本,但伪批量谱分析结果平均涵盖了超过17,095个转录本。如预期的那样,匹配的批量/伪批量样本的谱分析结果显示了强烈的相关性,而无法通过非匹配比较获得。这些结果表明,(i)单细胞谱分析结果显示出高度的异质性,以及(ii)聚合的单细胞谱分析结果能够重现批量谱分析结果中所获得的转录组谱。因此,这种3D体外器官样本培养系统捕获了具有复杂转录组异质性的细胞谱。
值得注意的是,我们发现存在同时存在的细胞混合物,每个混合物具有一个单一的CRIS分配,以及具有混合多个CRIS亚型的细胞。来自给定器官样本的个别细胞主要被分配到该器官样本的批量谱分析结果所定义的CRIS亚型/亚型组(图2)。
这些结果强调了在单细胞分辨率下,大多数细胞被分配到单个CRIS亚型,并且它们的混合导致了批量转录组的多亚型分配;然而,也有可能存在一小部分具有混合表型的细胞,在给定的批量样本中对多个CRIS亚型的分配产生贡献。事实上,在所有接受多个CRIS批量分配的器官样本中,我们检测到了具有不同CRIS标识的细胞和具有混合表型的细胞的共存(图2)。
为了将我们的观察扩展到人类肿瘤,我们利用来自一组患者的公共单细胞RNA测序数据(GSE132465),重点关注上皮细胞,比较伪批量和单细胞的多标签CRIS分配情况:这种分析证实了存在多个CRIS分配的患者。在这些样本中,我们证实大多数单个细胞被分配到特定的CRIS亚型(64%的分类细胞,其中75%被分配到单个CRIS亚型,25%被分配到多个CRIS组;图3a)。然而,类似于器官样本,每个样本由不同的细胞群体组成,这些细胞群体被分到不同的CRIS亚型中,导致了一个复杂的表型,该表型通过伪批量分析的多个CRIS分配被捕捉到(图3b)。因此,被分配到单个CRIS亚型的样本往往具有更高比例的被分配到该亚型的细胞。在特定样本中,具有多标签分配的单个细胞的高百分比可能反映出组织中正在经历功能转变或稳定的中间分化阶段。例如,在患者SMC17中发生了这种情况(图3b),其中57%的分类细胞显示出多标签表型。类似地,SMCO3和SMC21患者分别显示出34%和28%的具有混合表型的细胞(图3b),与它们在批量分析中追踪到的多标签状态一致。
总的来说,这些结果表明,CRIS转录组的异质性根源于单个细胞水平,而单个细胞的表型总结起来定义了肿瘤批量的CRIS分类。因此,多CRIS肿瘤的证据主要可以通过具有特定功能特征的不同细胞群体的镶嵌组成或具有混合表型的少量混合细胞来解释。
参考文献:
Cascianelli, S., Barbera, C., Ulla, A.A. et al. Multi-label transcriptional classification of colorectal cancer reflects tumor cell population heterogeneity. Genome Med 15, 37 (2023).https://doi.org/10.1186/s13073-023-01176-5