北京基因组所(国家生物信息中心)宣布更新版人类长非编码RNA数据库LncBook 2.0
克日,由4001老百汇网站(国家生物信息中心)国家基因组科学数据中心开发的人类长非编码RNA(long non-coding RNA, lncRNA)数据库LncBook 2.0正式上线。该研究内容以“LncBook 2.0: integrating human long non-coding RNAs with multi-omics annotations”为题在国际学术期刊Nucleic Acids Research 在线揭晓。
LncRNA是哺乳动物基因组中的主要组成部分,加入DNA甲基化、组卵白修饰、转录调控、转录后调控等多个生物学历程,与人类疾病的爆发和生长亲近相关。LncBook数据库致力于人类lncRNA数据整合,并通过多组学数据剖析对lncRNA举行系统注释。自2019年宣布以来,LncBook数据库在描绘人类lncRNA的转录图谱、挖掘lncRNA分子特征以及展现lncRNA与疾病关系等方面被普遍应用。
LncBook2.0收录了119722个新的转录本,注释了9632个新的基因,更新了21305个lncRNA基因的结构。富厚的多组学数据是LncBook2.0的一大亮点,包括守旧性、表达、DNA甲基化、变异、小卵白、相互作用六个方面。通过与40种脊椎动物较量,LncBook2.0描绘了人类lncRNA基因的守旧性,并在这些物种中判断出了139306个卵白编码及非编码同源基因。表达数据方面,相比1.0版本,LncBook2.0收录的表达谱数据涉及的生物学场景从1种增添到了9种,包括器官发育、细胞分解、亚细胞定位等。而在甲基化数据方面,LncBook2.0涉及到的疾病类型从9种癌症增添到了14种癌症和2种神经系统发育疾病。别的,LncBook2.0网络了959138条与疾病/性状相关的变异信息和34012个lncRNA编码的小卵白,判断了772745条lncRNA-卵白质相互作用并展望了146092274条lncRNA-miRNA相互作用。
LncBook2.0数据库具备友好的检索、浏览与可视化功效,利便用户通过差别基因/转录本ID、基因symbol举行检索和浏览。用户可以在多组学页面中通过排序、筛选功效过滤出切合条件的lncRNA基因,随后在单个lncRNA基因的页面中审查它的转录本、编码潜能、守旧性等信息。LncBook2.0还与团队之前开发的LncRNAWiki和LncExpDB数据库举行了关联,用户在浏览lncRNA基因信息时可以通过链接跳转到相关页面,审查该基因的更多信息。
北京基因组所(国家生物信息中心)博士研究生李昭、特殊研究助理刘琳、硕士研究生冯昶瑞为本文配合第一作者,马利娜副研究员与章张研究员为配合通讯作者。该研究获得了中科院战略性先导科技专项、国家重点研发妄想、中科院青促会等项目资助。
论文链接

LncBook 2.0数据库内容与功效
附件下载: