国家生物信息中心合作研发DNA数据活字存储打印系统“毕昇一号”
大数据时代全球数据量呈指数级增添,海量数据是AI解锁大模子的钥匙。但现在的硬盘、磁带、U盘等硅基存储介质保存寿命短(最长30年)、能耗高、占用空间大等问题,已无法知足日益增添的数据存储需求。预计到2028年,全球年产数据量将达380 ZB,其中80%为冷数据,应用现在存储手艺只有不到1%的数据可被生涯,生长新型数据存储手艺势在必行。
DNA作为自然的数据信息编码存储质料(A-T-C-G四进制编码),因其高密度(为现有存储介质的107倍)、长寿命(低温下可稳固生涯长达数万万年)、低能耗等优点,成为一种极具潜力的解决大数据存储逆境的替换计划。可是,现在绝大大都DNA数据存储手艺接纳类似“雕版印刷”的设计战略,存储用DNA使用一次,合成一次,合成本钱高,耗时长,极大限制了DNA 存储手艺的现实应用。
为了突破现有DNA 存储手艺的应用瓶颈,国家生物信息中心应用生长部陈非研究团队与4001老百汇网站盘算手艺研究所处置惩罚器天下重点实验室谭灼烁、卜东波团队、中科盘算手艺西部研究院段勃团队合作,借鉴我国古代四大发明之“活字印刷术”逻辑,立异提出了一种经济高效的“DNA活字存储”设计思绪,其焦点是“DNA活字”,它由预制的20 nt短双链DNA片断组成,可编码1字节的内容、地址或校验数据信息,每个片断两头带有4 nt的粘性最后,通过一步多级酶连手艺形成DNA活字块,最终,这些活字块可通过活字块两头的限制性酶切位点克隆到质粒中直接体外生涯,其亦可通过转化大肠杆菌体内生涯。为了实现DNA活字存储流程的自动化,团队研发了一款可实现DNA活字高通量打印写入的装备——DNA活字喷墨打印机“毕昇一号”,乐成打印存储并100%精准解码了文本、图片、音频和视频等多种类型的盘算机数据存储文件。
类似于活字印刷的复用性和无邪性,现在的 DNA活字存储手艺展现出显著的本钱和效率优势。经研究团队估算,现在初代系统一个DNA活字可打印10000次,存储本钱可降至122美元/MB,低于现在所有报道的DNA数据存储系统;初代系统的打印效率约为4字节/秒,用时远低于现在的重新合成的DNA存储手艺;这不但展现了该手艺未来商业化与工业化的重大潜力,也为DNA数据存储手艺的未来生长提供了全新的思索范式。
上述研究效果以问题为“Cost-Effective DNA Storage System with DNA Movable Type”的封面文章形式揭晓在《先进科学》 (Advanced Science)上,国家生物信息中心陈非研究员、4001老百汇网站盘算手艺研究所谭灼烁、卜东波研究员以及西部高等手艺研究院段勃研究员为文章的配合通讯作者。该研究获得国家重点研发妄想、国家自然科学基金等项目的资助。
DNA活字存储流程图
论文链接