人类社会的文明史,是一部信息存储方式和传播方式变革的历史。以存储介质为例,经历了从远古时代的结绳记事,到甲骨、金属、竹简、纸,直至当今时代的硅基存储。而信息技术与经济社会的交汇 融合则使数据信息成为了国家基础性战略资源。以爆发式增长为特点 的海量数据正日益对全球生产、流通、分配以及国家经济运行机制、 社会生活方式和国家治理能力产生重要影响。据统计,全球数据信息总量2020年为44 ZB(万亿亿字节),预期到2025年将达到175 ZB(约需>1750亿个1 TB硬盘)。因而,研发存储寿命长、空间和能源消耗小、环境稳定性和安全性好的新一代数据存储介质,突破海量数据存储的瓶颈,体现了世界各主要国家的重大战略。

脱氧核糖核酸(DNA)作为亿万年自然进化选择出来的碳基生命遗传密码的天然存储介质,具有极高的存储密度和稳健性。DNA本身所具有的可编码性和高效复制能力,有可能为数据高密度存储和高性能运算提供一种全新策略。DNA存储具有物理稳定性高的优点,不像电子介质会随读取次数而衰退,为数据的长期存储提供了一种根本性解决方案。另外,DNA分子兼具了信息处理和计算能力,为发展新型的存算一体架构和系统提供了新的思路。因此,将核酸作为一种新兴的分子信息材料来发展展,体现了信息技术(IT)与生物技术(BT)的融合,有可能在信息存储、智能计算、纳米机器人等方向成为信息科技发展的重要突破口。

与传统的硅基存储与计算技术不同,DNA信息存储是一种结合DNA分子、生化反应以及分子生物学的技术。基于腺嘌呤(Adenine,A)、鸟嘌呤(Guanine,G)、胸腺嘧啶(Thymine,T)和胞嘧啶(Cytosine,C)四种碱基,利用DNA双链互补杂交的规则,通过设计DNA序列可以调节双链形成的位置结合力等参数,进而设计DNA的化学反应系统,构建DNA存储系统。其原理是数字化信息在二进制码流、四进制碱基序列和DNA片段之间的转化与流动。在一个典型的DNA存储系统中,信息的存储即DNA合成,信息的读取即DNA测序。


DNA 存储技术的出现,为解决大数据存储难题提供了一种变革性的模式,并已成为世界各国和国际大公司布局的技术开发战略。在Science杂志发表的125个科学问题中,DNA存储名列信息科学的四大问题之一。美国半导体研发联盟于2018年制定了“半导体合成生物学路线图”(2018 Semiconductor Synthetic Biology Roadmap),被公认为BT-IT 融合的典型范例。 其中,DNA存储作为突破数据存储容量极限的变革性技术列入半导 体合成生物学六大方向之一。在我国发布的 “十四五科技规划”中,DNA存储与量子计算、量子通信和神经芯片等并列为应加快布局的前沿技术之一。科技部于2019年底召开了“BT-IT 交叉融合”香山会议,着重探讨了DNA存储的规划与发展,并于2021年设立了“BT与IT融合”重点研发专项。

尽管DNA存储领域已经取得了许多重要进展,呈现了广阔的应用前景。然而,该领域的发展仍存在若干重大挑战,如DNA编码容量、核酸分子基元与新型核酸结构、核酸信息材料的宏量制备、智能仿生元器件、DNA存储系统集成与器件、活细胞核酸运算系统等。面对这些挑战,一批来自北京大学、清华大学、上海交通大学、天津大学、湖南大学、南方科技大学、中科院深圳先进院、天津工业生物技术研究所、华大基因、上海微工院等研究院所的中国科学家已形成多个交叉研究团队开展科学探索与技术攻关,期望取得一批具有中国自主知识产权、在国际上有竞争力和重大应用价值的原创性成果。而这一激动人心的领域,更期待来自不同学科背景的年轻学子投身其中,以培养出一批具有国际知名度的优秀科学家,建成DNA存储国际学术高地。