新数据库SPASCER——单细胞分辨率的空间转录组学注释

栏目:最新研究动态 发布时间:2022-12-27
本研究展示了一个名为SPASCER (https://ccsm.uth.edu/SPASCER) 的新的空间转录组学数据库,旨在帮助理解组织组织的异质性......



近年来,空间技术的爆炸性增长使组织结构的空间异质性得以表征。先前存在两个空间转录组学数据库提供的分析信息有限。基因和细胞的空间异质性,空间中的细胞-细胞交流活动以及微环境中的细胞类型组成等信息是揭示肿瘤发生和胚胎分化机制的关键线索。本研究展示了一个名为SPASCER (https://ccsm.uth.edu/SPASCER) 的新的空间转录组学数据库,旨在帮助理解组织组织的异质性,特定区域的微环境以及跨组织结构在多个层次上的细胞间相互作用。

 

技术路线


 

主要研究结果

1、SPASCER概述

目前,空间数据集成有两种代表性资源,即SpatialDB和STOmicsDB。STOmicsDB仅提供与空间转录组学主题相关的文献资料库和很少的数据集,并且不使用这些数据提供任何进一步的分析。SpatialDB仅对10个主要基于HPRI的数据集。即seqFISH和MERFISH进行空间可变 (SV) 基因分析和富集分析。作者开发了一种新的数据库SPASCER,以在单细胞水平上系统地研究组织的空间异质性及其相关的生物学过程。SPASCER提供了空间转录组学的系统注释,包括 (i) 空间模型基因,(ii) 空间模型途径,(iii) 基因调控网络,(iv) 细胞-细胞相互作用 (v) 空间转录组学去卷积和相互作用。

SPASCER从43个研究中收集了1082个数据集,这些研究跨越了16个器官类型和4个物种(人,小鼠,鸡和斑马鱼)(图2A)。注释了总共118种细胞类型,包括内皮、上皮、成纤维细胞和免疫细胞等。

检测到的空间模式也可能反映组织组织和特定细胞类型分布。在一个肾脏小鼠模型中,作者发现基因Aadat显示出清晰的空间结构模式(图3A),并且参与了空间模型途径“L-kynurenine metabolic process”(图3B)。空间斑点聚类(图3C)和H & E染色图像(图3D),以及反卷积分析(图3E)表明,这种特定的空间基因和途径模式可能与近端小管段3细胞(PT S3 OS)的分布有关。Aadat的空间格局在损伤后减少,并随着修复过程而增加(图S3B),这将有助于研究再生过程。因此,此数据库提供了细胞类型标记基因,空间基因模式,空间途径模式,基因调控网络以及scRNA-seq和空间转录组学的细胞-细胞相互作用的丰富资源。


1 SPASCER的设计和构造


2A scRNA-seq的细胞数量(绿)和空间转录组学(红)数据中的斑点大小代表数量的多少


3A-E SPASCER获得的部分函数注释示例结果


S3B 小鼠肾脏中Aadat的时间序列特征。

 

2、细胞类型类别

内皮细胞,上皮细胞,成纤维细胞和免疫细胞等是组织构建中的基本细胞类型。根据细胞类型的统计分析,内皮是大多数研究 (23/43) 中包括的主要细胞类型 (图S2B)。在此数据库中,包含内皮细胞的九个人体器官和六个小鼠器官。跨组织的内皮细胞的代表标记显示在图2B和C中。如这些图所示,不同的组织表达独特的标记基因,而聚腺苷酸结合蛋白1 (PABPC1) 在人和小鼠的多个组织中均高度表达(图2B,C)。因此,这可能是一个潜在的研究点,因为目前没有报道揭示聚腺苷酸结合蛋白1与内皮细胞之间的关系。


S2B 在多项研究中包含的9个主要细胞类型,括号中的数字代表研究数量。


2BCViolin plots显示了人类和小鼠多个组织中组织特异性内皮标记基因的表达水平。


3、空间模式路径类别

此类别提供了已鉴定的空间图案化基因的丰富生物学途径。总共,作者使用所有样品确定了22条具有跨组织架构的空间模式的792通路(图S4B)。对于肿瘤研究,“细胞迁移”,“细胞粘附”,“细胞分化”,“细胞增殖”,“白细胞迁移”等在肿瘤区域高度富集,表明肿瘤增殖和侵袭。

特定的模式也可能揭示正常组织中的结构组织。CCK (胆囊收缩素) 高度分布在人皮质的L2和L6层中,Aadat富集在小鼠肾脏的近端小管区域。作者还发现,损伤后2小时空间格局迅速下降,2天后几乎消失,6周后恢复正常,这可能与近端小管的损伤和修复过程有关 (图S3B)。这些检测到的空间模式基因将有助于对组织组织的理解,而这些模式基因在时间序列组织中的动态变化将拓宽对组织发育,疾病进展和损伤再生的关键因素的了解。


S4B 已识别的空间模型路径

 

4、转录因子调控网络类别

本分类提供转录因子调节网络信息。鉴定了697个关键调控因子和一系列潜在的靶基因,涉及总共97种细胞类型。将检测到的潜在调控因子和靶基因定位到蛋白质-蛋白质相互作用中,以构建网络。在该模块中,用户可以输入感兴趣的基因符号,以检查该基因是否在多个组织中起调节作用,以及其潜在的靶基因。对于先前基于研究,作者使用热图提供了每种细胞类型中所有已识别的重要转录因子(图3H)。该类别可以提供组织架构上下文的关键调节。


3H 在不同细胞类型中检测到肥大规律。Hoxb3, z2f1Foxo6VSM细胞中的特异性TFs

 

5、细胞与细胞相互作用类别

此类别在单细胞环境中提供了重要的配体-受体对。配体是一种与一个细胞释放的生物分子形成复合物的物质,以发出自身或不同细胞的信号。当配体与其各自的受体结合时,生物活性会改变,从而引发几种不同类型的细胞反应。使用scRNA-seq数据的细胞-细胞相互作用分析鉴定了135个细胞类型中1020独特的配体-受体对。在网站中,作者提供了所有已识别的重要配体受体对以及相关的源细胞和靶细胞。对于基因的搜索,用户可以搜索各个基因的相互作用伙伴和在各种细胞中的表达水平。对于基于纸张的浏览,用户可以这样做检查网络模块中所有重要交互的单元类型。较厚的边缘表示较强的相互作用。细胞活动取决于细胞-细胞相互作用,这对于组织稳态至关重要。异常的细胞-细胞相互作用可能导致组织紊乱甚至疾病。

 

6、空间反卷积与相互作用分析范畴

此类别通过反卷积分析提供高度丰富的细胞邻域和相互作用。即使我们对每个斑点的细胞类型进行了预测,但在复杂的组织中,一个斑点对于一种以上的细胞类型可能具有较高的富集评分。因此,作者提供了每个数据集的富集热图,并基于Giotto聚类分析了spot-spot通信。使用来自scRNA-seq的注释细胞类型,作者估计了单个细胞类型的分布。用户可以搜索它们是否充当不同细胞中跨组织结构的配体或受体,还可以搜索估计的细胞类型分布以及它们是否与其他细胞通信。例如,在肾损伤研究中,空间反卷积分析结果显示近端小管节段1 (PT S1) 和连接小管 (CNT) 分布在外层,而收集导管 (CD) 分布在内部区域 (图3E)。。这些结果与H & E染色图像的解剖结构一致。具体来说,其可以估计整个组织结构中不同的细胞-细胞相互作用模式 (图3F)。作者发现CNT细胞与外层的PT S1高度相互作用,PT纤维蛋白原与中间区域的PT S3 OS相互作用,VSM与内部区域的CD IC细胞相互作用。在CD IC-VSM细胞中检测到的配体-受体对中,Ccl8 (c-c基序趋化因子配体8) 与Ccr1 (c-c基序趋化因子受体1),Ccr2 (c-c基序趋化因子受体2) 高度相互作用,ccr5 (c-c基序趋化因子受体5) (图3G),这些可能是由于肾损伤过程,因为先前的研究表明这些趋化因子基因家族与炎症和巨噬细胞相关的转移有关 。这些区域特定的细胞类型分布和相互作用将有助于了解疾病微环境中的潜在机制。


3E-G

 

参考文献

Fan Z, Luo Y, Lu H, Wang T, Feng Y, Zhao W, Kim P, Zhou X (2022) SPASCER: spatial transcriptomics annotation at single-cell resolution. Nucleic Acids Res. Oct 16: 889. doi: 10.1093/nar/gkac889.