北京基因组所(国家生物信息中心)宣布更新版表观基因组关联研究开放平台EWAS Open Platform
克日,由4001老百汇网站(国家生物信息中心)国家基因组科学数据中心(NGDC)开发的表观基因组关联研究资源开放平台EWAS Open Platform正式上线。该研究效果以“EWAS Open Platform: integrated data, knowledge and toolkit for epigenome-wide association study”为题在国际学术期刊Nucleic Acids Research 在线揭晓。
随着表观基因组关联研究(EWAS)的爆炸式增添,揭晓了大宗EWAS学术论文,积累了海量EWAS相关的数据。对这些数据举行标准化整合,并从已揭晓论文中提取和挖掘表观关联知识,关于系统的表征和研究差别实验条件下的甲基化状态、探索与种种性状相关的表观遗传分子机制具有主要意义。NGDC在2019年和2020年先后开发了基于高质量的人工审编EWAS知识库(EWAS Atlas)和存储了海量标准化的DNA甲基化芯片数据的EWAS数据库(EWAS Data Hub),获得了业内的普遍使用和国际偕行的高度评价。
为了提供从数据浏览与下载、在线剖析与可视化到知识诠释与验证的周全系统的资源和服务,NGDC研究团队在一直整合和更新中心已有EWAS资源基础上,构建了表观组关联研究资源开放平台(EWAS Open Platform)。EWAS Open Platform包括标准化的数据信息库 (EWAS Data Hub)、人工信息提取的知识库(EWAS Atlas)和表观-特征关联在线工具(EWAS Toolkit) 三部分。EWAS Data Hub整合了115,852个样本的DNA甲基化芯片数据和对应的元数据,并统一接纳GMQN要领举行标准化。同时,EWAS Data Hub使用海量高质量DNA甲基化芯片数据和标准化元数据的优势,为485,512个探针和36,397个基因提供了一系列主要的评估值(包括组织特异性、年岁相关性、性别差别和种族特异性)和差别配景下的参考DNA甲基化图谱;EWAS Atlas共整合了910篇文献中报道的617,018个高质量的甲基化与表型关联,涉及到618种表型和3,385个行列;EWAS Toolkit使用EWAS Atlas和EWAS Data Hub提供的高质量的甲基化与表型关联知识和标准化的DNA甲基化芯片数据,为用户提供多种在线剖析和可视化工具,包括富集剖析、注释、知识图谱可视化等。
北京基因组所(国家生物信息中心)博士研究生熊壮、杨飞以及博士结业生李萌伟为本文配合第一作者,鲍一明研究员、章张研究员及李茹姣高级工程师为配合通讯作者。该研究获得了中科院战略性先导科技专项、国家重点研发妄想、中科院要害手艺人才等项目资助。
论文链接
EWAS Open Platform数据处置惩罚流程示意图