血液/免疫细胞参与所有人体组织的正常和失调功能。造血和血液/免疫紊乱研究受到单细胞技术突破的显著推动。发现对造血谱系和分化轨迹的高分辨率区分。从胎儿到成人精心描绘了造血系统的发展,涵盖了许多造血谱系,例如造血干细胞、巨噬细胞、树突状细胞、巨核细胞、先天淋巴样细胞和T细胞。同时,许多类型的血液/免疫细胞的异质性通过单细胞测序进一步揭示,例如中性粒细胞、自然杀伤细胞、T细胞和骨髓细胞。另一方面,通过单细胞分析揭示了血液疾病进展和治疗的新型细胞和调节机制。研究表明,恶性血细胞和干细胞的异质性是急性髓系白血病 (AML)、慢性髓系白血病 (CML)、急性淋巴白血病 (ALL)、骨髓增殖性肿瘤 (MPN)、再生障碍性贫血(AA)、淋巴瘤和多发性骨髓瘤(MM)的疾病发生和进展的基础。发现了AML、CLL和MM的亚细胞型特异性药物反应和耐药机制。总之,使用单细胞方法的大规模研究成为血液学和免疫学研究的宝贵资源。然而,仍然缺乏血液学特异性的交互式再分析单细胞转录组数据库。
最近,中国医学科学院北京协和医学院血液病研究所团队发布了一个血细胞的单细胞数据库数据库——ABC portal(http://abc.sklehabc.com),该数据相关文章发表在Nucleic Acids Res期刊(IF:19.160)。
ABC portal是一个血液/免疫细胞特异性数据库和工具,具有单细胞分辨率的血细胞类型,特别是造血干细胞/祖细胞(HSPC)的精选注释。ABC门户网站提供四个交互式模块,用于探索和分析基因表达、细胞组成、基因特征和细胞间通讯。收集了111个造血和发育数据集和87个血液疾病数据集,所有这些都通过统一的分析管道。通过分别整合人类和小鼠的四个和六个数据集生成了精选的细胞类型参考。ABC中的所有数据集均通过两个参考文献统一重新标注,便于跨数据集比较。更重要的是,ABC允许在一个数据集中重新分析用户选择的数据子集或跨数据集进行比较。
ABC portal中的数据集
目前数据库中有122个人类数据集和76个小鼠数据集,来源类型主要包括骨髓、PBMC、脐带血、胎肝等。有111个正常造血数据集和87个疾病相关数据集。与疾病相关的数据集包括12种血液疾病类型和26种与血液和免疫细胞相关的炎症,感染和其他疾病的数据集。淋巴瘤、MM、AML和ALL是研究最常的血液系统恶性肿瘤。正常的造血数据集主要来自造血层次和造血系统发育的研究,涵盖不同类型的造血谱系。同时,我们的数据库包含来自各种平台的数据集。
参考数据集
在总共 198 个数据集中,有 64 个数据集具有原始单元格类型注释。为了便于数据集的重用,除了来自出版物的原始注释外,我们还分别为人类和小鼠数据集提供了统一的细胞类型注释。统一的注释是从我们建立的单细胞转录组参考转移的标签。
对于人类参考数据集,我们整合了来自人类血细胞图谱(ABC)项目的三个骨髓(BM)样本、两个胎儿骨髓(FBM)样本和两个来自人类细胞图谱(HCA)的BM和两个脐带血(CB)样本,以生成人类参考。将集成参考划分为44个簇,并通过组合两种类型的信息来确定簇的单元身份。首先,来自ABC数据集,HCA数据集和FBM数据集文献的单元格注释。二、规范标记基因的表达。比较BM,CB和FBM的细胞组成,GMP在BM和FBM中富集,HSC在CB和成人BM中富集。CD14单核细胞1富集于FBM,CD14单核细胞2富集于CB和成人BM,CD16+单核细胞富集于成人BM,幼稚B和幼稚T细胞富集于CB。
样品选择和过滤功能
ABC门户允许按物种、组织来源、疾病和出版物搜索数据集。ABC门户的一个重要特点是,特定于数据集的过滤器及其组合可以实现定制的样品选择和重新分析。可以使用“+ 添加”按钮有选择地添加特定于数据集的过滤器。恢复样品过滤器的不同组合,包括组织类型、患者表型、流式细胞术门控和治疗,并可应用于所有分析模块。例如,用户可以从B-ALL样品中选择流式细胞术分选的CD45 +细胞进行后续分析和比较。此外,每个单元格的元数据在“元信息”选项卡中提供,数据预处理的步骤记录在“处理”选项卡中。
应用模块
UMAP 模块。
该模块包含两个探索功能。一个功能是多级细胞标注,包括原始样本信息、原始细胞类型标注(如有)、统一细胞型标注和恶性肿瘤。用户可以通过滑块按钮在原始注释和统一注释之间轻松切换。特别地,我们提供了一个开关按钮来显示恶性细胞的可能细胞类型,这允许用户探索恶性细胞的特征和异质性。例如,显示B-ALL样本中的恶性细胞大多是前B细胞和前B细胞。另一个功能是通过UMAP和小提琴图进行基因表达可视化。例如,DNTT是B祖细胞的标记基因,在恶性细胞中高度表达GSE153697数据集。这些结果证实了细胞类型和恶性细胞注释的准确性。还可以比较给定细胞类型、细胞类型或恶性肿瘤的样本之间的基因表达。
表达式模块
该模块显示所选签名中基因的量表表达以及所选基因集的AUCell评分。除了规范基因集外,我们还从文献中收集了15个与血液疾病相关的基因集,以方便用户进行分析,例如“AML LSC +基因”标记。该模块允许比较所选细胞类型中患者或不同细胞类型的特征表达,指示患者之间的特征差异或不同细胞类型的特征富集。例如,AML样本中“AML LSC +基因”基因在细胞类型中的表达表明,白血病干细胞相关基因在HSC / MPP,LMPP和GMP中高表达。