CancerSCEM:人类癌症的单细胞数据库

栏目:最新研究动态 发布时间:2022-04-19
该数据库收集了公共 scRNA-seq 数据集,涉及来自 20 种人类癌症的 208 个样本的 638 341 个高质量单细胞......


随着单细胞 RNA 测序技术 (scRNA-seq) 被广泛应用于回答发育生物学、神经科学、肿瘤学和免疫学中的许多基本问题。scRNA-seq对人类癌症的研究不断增多,各种癌症中的细胞异质性、免疫浸润和发病机制已陆续被揭示。scRNA-seq 成为研究肿瘤微环境、异质性、发病机制、转移和侵袭以及治疗和诊断多种肿瘤不可或缺的手段。在过去十年中,大规模癌症 scRNA-seq 数据集呈指数级增长,迫切需要整合和处理各种癌症类型的肿瘤微环境的基本研究。当前的肿瘤单细胞测序数据库的整合、准确的细胞类型识别和全面的在线分析平台在某种程度上仍然存在不足,给人类癌症研究留下了巨大的挑战。

最近中国科学院团队构建了一个肿瘤单细胞测序数据库:CancerSCEM(https ://ngdc.cncb.ac.cn/cancerscem),该数据库相关文章刊登在Nucleic Acids Research期刊(IF=16.971),题名为CancerSCEM: a database of single-cell expression map across various human cancers。该数据库收集了公共 scRNA-seq 数据集,涉及来自 20 种人类癌症的 208 个样本的 638 341 个高质量单细胞。使用内部管道进行 TME 分析和功能基因注释的多尺度数据分析,并在 CancerSCEM 中配备了一个全面的在线分析平台。



以单细胞分辨率处理了 208 个癌症样本的多尺度数据分析,用户可以浏览、搜索、在线分析和下载所有感兴趣的元数据和分析结果。Project Browse页面上的概览和交互式表格展示了所有收集的癌症 scRNA-seq 项目,信息范围从新分配的唯一项目 ID、癌症类型、样本 ID、样本详细信息、细胞计数到。Sample Details和Analysis列还提供了指向肿瘤样本详细信息的超链接和每个数据集的综合分析结果。



为了更好地访问感兴趣的数据集或基因,CancerSCEM 提供了几种查询方法:(i)快速搜索框和关键字,都可以通过指定癌症类型、基因或数据协议进行实时查询;(ii) 搜索页面上的高级搜索模块:在项目方面,用户可以指定项目/样本ID或登录号,或选择特定的癌症类型; 在基因方面,通过搜索基因符号或基因 ID,用户可以快速查看单细胞和批量 RNA水平的基因摘要和表达分布。



   基因分析模块。它包含四个功能: (i) 样本中的基因表达 (GE)——特定癌症单细胞样本进行全表达谱分析;(ii) 亚型中的基因表达——样本中不同细胞类型或亚型的基因表达;(iii) GE相关性——特定样本中任意两个基因之间的 pearson 相关性计算;(iv) GE比较——不同 scRNA-seq 或 TCGA bulk RNA-seq 数据集的基因表达比较。