在癌细胞中观察到的大量异质性,包括基因表达、细胞组成和免疫微环境的差异,对准确诊断和治疗提出了重大挑战。然而,单细胞RNA测序(scRNA-seq)和空间转录组(ST)技术的进步为应对这一挑战提供了有希望的新途径。通过能够以单细胞分辨率解剖癌细胞多样性并弥补源组织空间信息的缺乏,这些发展可以为分析癌症的复杂性提供新的机会。目前,scRNA-seq 和 ST 已揭示了各种组织在各种条件下的转录和空间景观。
随着全球大量单细胞数据集的迅速出现,研究人员必须能够访问和解释大规模的癌症基因组学资源。最近建立的单细胞数据库是合成和呈现大量单细胞数据用于研究的有效工具。为了利用从ST(26)、MERFISH(27)和Visium(28)等高通量方法获得的细胞位置,中国医学科学院团队构建了单细胞和空间分辨癌症资源(SCAR)数据库,该数据库包含广泛的癌症相关资源。该数据库包括两个不同的组成部分:SCAR_ST,一个空间转录组图谱,包含来自21个肿瘤组织的数据,SCAR_Atlas,包含395个癌症亚型的单细胞图谱。设计了用于筛选肿瘤生物标志物和分析基因表达模式的其他模块。通过对公开可用的癌症数据集的广泛分析,SCAR作为癌症基因组学的多功能在线平台,使用户能够在组织、细胞和基因水平上揭示癌症的复杂性。
SCAR数据库的网页是使用HTML、CSS和PHP设计的。数据可视化是使用 R 语言实现的,而 JavaScript 用于创建交互式用户界面。SCAR 网站目前托管在配备 Apache Web 服务器软件包的高性能 Linux 服务器上。该数据库包括来自11种癌症亚型的301352395个细胞的单细胞图谱,以及21种组织类型的空间转录组图谱。“主页”页面为用户提供了多样化和全面的数据库概述,并能够自由探索每个模块的功能。在“统计”页面上,用户可以访问和探索数据库中可用的多组学技术、细胞数量和癌症类型的综合数据。
SCAR_ST模块提供来自三个物种(人类、小鼠和斑马鱼)的 41 个空间转录组数据集,包括37个人类数据集(膀胱、大脑、乳房、肠、肾脏、大肠、肝脏、肺、淋巴结、卵巢、胰腺、前列腺、皮肤、胃和子宫)、1 个小鼠数据集(肺、胃和尾皮肤)和斑马鱼数据集。用户可以通过单击与人类、小鼠和斑马鱼解剖结构相对应的解剖学标签或单独搜索基础表,轻松查询所选数据集中特定基因的空间表达模式。单击解剖标签后,用户将被定向到一个基础表,其中包含数据集中表达的所有基因,以及所选基因的空间表达模式图和源信息。此外,所有图像均可供下载以供进一步分析。
SCAR_Atlas模块包含四种类型的癌症单细胞图谱,包括人、小鼠、类器官和细胞系,涵盖395种癌症亚型的523个scRNA-seq 数据集。用户可以首先使用页面顶部的“高级搜索”按钮单独或结合多个条件查询scRNA-seq数据集。用户可以根据物种、已发表的期刊、癌症类型、样本组织、疾病系统、细胞类型、测序技术和细胞数量筛选感兴趣的数据集。单击“应用搜索”按钮后,搜索结果将显示在下表中。在每个癌症图谱中,用户有多个选项来搜索单细胞数据集。这些包括在列中进行分层选择,单击相应癌症亚型的图像,或从词云中选择相关名称。下表将显示数据集的信息,包括细胞信息、基因表达、图形可视化和数据源,可以使用ShinyCell链接进一步查询。在“详细信息”页面上,用户将找到与SCAR_Atlas_0790数据集相关的完整信息列表,包括癌症类型分类、数据集中的细胞数量、包含的特定细胞类型以及数据来源的文章。用户可以访问七个部分来可视化基因的基因表达谱和基因的细胞类型信息,包括低维的细胞信息和基因表达、任意两个基因的基因共表达、不同细胞类型的小提琴图/箱线图、细胞类型组成的比例图以及多达 50 种基因表达模式的气泡图/热图。
SCAR_CT模块由肿瘤微环境中的 10 种细胞类型组成,即 T 细胞、B 细胞、树突状细胞、单核细胞、巨噬细胞、中性粒细胞、嗜碱性粒细胞、肥大细胞、成纤维细胞和内皮细胞。通过选择感兴趣的细胞类型的图像,用户可以访问有关细胞类型的更多信息,包括每个细胞亚型的数量和通过数据集详细信息。通过单击绿色的“详细信息”按钮,用户还可以跟踪数据集的来源。
SCAR_Meta模块允许用户筛选SCAR_Atlas中每种独特细胞类型的代谢特征,涵盖28个类别的所有癌症类型。选择特定的癌症类型进行搜索后,下表将列出该癌症类型中包含的所有癌症亚型。通过单击表格用户可以访问一系列显示数据集中所有细胞类型的代谢途径的图。用户可以通过选择图像部分中的“下载”按钮自由下载所有图表。
SCAR_Survival模块绘制了 31 种癌症类型中每个测试基因的生存曲线。要查看特定基因的生存曲线,用户可以从表中选择相应的基因符号,按癌症类型分为八个系统类别。通过单击“查看生存曲线”列中的图标,相应癌症类型中所选基因的生存曲线将显示在下面。