癌症是一个重大的公共卫生问题,也是全球发病率和死亡率的主要原因。在过去的几十年中,人们发现了RNA分子的新细胞作用。已经确定,癌症病理学中基因表达的动态非常复杂。长链非编码 RNA(lncRNA) 作为癌症生物标志物,用于早期筛查、诊断、预后和治疗反应分析,越来越受到关注。环状 RNA (circRNA)是非编码癌症基因组的一个新成员,具有独特的特性和多种细胞功能。
人们对人类lncRNA和circRNA的兴趣日益浓厚,以及高通量和单细胞技术的出现,导致癌症相关lncRNA和circRNA的数量迅速增加。值得注意的是,癌症相关的lncRNA和circRNAs可根据其调控机制、生物学功能或临床应用分为不同的组。lncRNA 和 circRNA 在涉及增强子、遗传变异、microRNA (miRNA) 相互作用、转录因子(TF)和甲基化修饰的癌症相关调控机制中的作用也得到了广泛研究。此外,癌症相关lncRNA和circRNA的新型生物学功能已经出现。近年来,越来越多的证据表明,lncRNA 和 circRNA 在细胞生长、细胞凋亡、自噬、上皮间充质转化(EMT)、免疫和编码能力中发挥重要作用。此外,有人提出 lncRNA 和 circRNA 可以作为外泌体循环、耐药性、癌症预后、转移和复发的非侵入性生物标志物。
高通量RNA测序(RNA-seq)已成为转录组学分析的有力方法。它被广泛用于研究 lncRNA 的功能和生物学模式、寻找候选药物靶标以及识别癌症分类和诊断的生物标志物。在单细胞水平上涉及组织解离和高通量测序的技术的最新进展使单细胞 RNA 测序 (scRNA-seq) 数据集的生成成为可能,这些数据集已越来越多地被存放到公共领域。大量的scRNA-seq和RNA-seq数据为数据挖掘和更深入地理解lncRNA功能创造了新的机会。开发快速且可定制的lncRNA分析和可视化方法是癌症研究的一个关键问题。方便高效的网络工具可以填补癌症相关lncRNA数据与向最终用户提供综合信息之间的空白,从而利用当前的lncRNA数据资源来研究人类癌症。Lnc2Cancer 3.0(http://www.bio-bigdata.net/lnc2cancer)整合了lncRNA、circRNA 和癌症之间关系的重要资源。
Lnc2Cancer 3.0鉴定出15 878个lncRNA、33种癌症类型、9664个肿瘤和711个正常对照样本。
建立了RNA-seq工具的九种功能:(i)通用功能允许用户在涉及癌症相关lncRNA的低通量和高通量实验之间构建串扰。它提供了有关亚细胞定位、功能、基因本体注释、癌症和正常组织中的平均表达以及各种癌症中特定 lncRNA 的箱线图的一般信息;(ii) DEA 功能使用户能够利用各种自定义统计方法和特定癌症阈值获得差异 lncRNA 表达分析和热图;(iii) 箱线图功能生成带有自定义颜色的箱形图,用于比较癌症和正常样本中特定 lncRNA 的表达;(iv) 阶段图功能根据主要和详细的病理阶段生成特定 lncRNA 的表达小提琴图;(v) 生存功能根据特定 lncRNA 的中位数和分位数表达值进行总生存期 (OS) 或无病生存期 (DFS) 分析;(vi) 相似功能使用输入的 lncRNA 和选定的癌症类型识别具有相似表达模式的 lncRNA 列表;(vii) 相关功能提供基于自定义方法(包括 Pearson、Spearman 和 Kendall)的两种癌症相关 lncRNA 的 lncRNA 表达相关性分析;(viii) 网络功能提供有关 miRNA-lncRNA 和 mRNA-lncRNA 共表达网络的信息;(ix) TF 基序功能预测特定 lncRNA 的 TF 基序,并提供 TF 基序序列 LOGO 图。