类风湿性关节炎(RA)是一种典型的自身免疫性疾病,影响全球约0.24%至1%的人口。RA患者的炎症反应会导致关节疼痛,肿胀,僵硬和功能丧失,如果不及时治疗,可能导致严重残疾。因此,RA给患者带来严重不便,并给社会带来巨大负担。随着测序技术的发展,RA的海量数据层出不穷,涉及转录组、表观基因组、基因组、蛋白质组等。这些数据可以评估当前数据分析方法的可重复性,并为解决各种与RA相关的生物学问题提供实质性帮助,包括识别生物标志物和探索发病机制。
最近,哈尔滨医科大学生物信息科学与技术学院团队发布了一个综合性的RA生物信息数据库——RABC(http://www.onethird-lab.com/RABC/),该数据相关文章发表在Nucleic Acids Res期刊(IF:19.160)。该数据库对分散的RA数据进行收集和分类,使用统一的标准化管道处理多组学数据,并对用户提供数据可视化。
RABC数据库收集了175个多组学数据集,其中140个转录组、22表观基因组、8个基因组和5个蛋白质组结果,涵盖约90万个样本。在RA相关的生物标志物和生物学功能中,分析标准化预处理的多组学数据,获得175209个DEG、105DEM、184464个DMG、1764个KEGG途径、30491个GO术语、74334个风险SNPs、和105个m6A SNPs。
RABC数据库首页提供四个选项包括浏览、搜索、下载和可视化。用户可以浏览模块快速浏览感兴趣的数据。首先,在多组学数据浏览界面中,用户可以查看数据的描述信息。每个数据集的详细信息接口不仅提供更详细的数据描述,还提供原始数据、预处理矩阵数据和分析结果。浏览模块还支持查看差异分析的结果和基因表达数据的基因表达火山图。其次,在RA相关生物标志物和生物学功能页面上,用户可以快速浏览DEG,DMG,DEM,GO术语,KEGG途径,风险SNP,风险eQTL,风险m6A-SNP和风险mQTL。RA相关先验知识(补充图S15和S16)和RA相关文献的相关信息也可以在RABC浏览界面中浏览和搜索。
搜索界面支持用户通过多种条件查询RABC的内容,包括数据集ID、数据类型、基因名称、PMID等。用户可以直接从下载模块下载生物标志物和生物学功能文件以及先验知识。
可视化模块支持绘制差异表达分析的火山图、基因表达的箱线图、两个基因之间相关性的散点图、条形图和基因表达谱分析数据集的功能富集分析气泡图。这些可视化功能只需要用户选择数据集并输入指定的阈值或参数,就可以绘制出相应的图形。这些图表也可以支持下载。