上海交通大学DNA存储研究中心在DNA存储安全领域取得新进展:ZAT-DNA实现分子层“复制即失效”信息保护
发布时间:2026年05月11日

核心亮点:针对DNA数据存储中“样品一旦获得即可被PCR指数扩增复制”的安全隐患,上海交通大学DNA存储研究中心联合天津大学、中国科学院天津工业生物技术研究所等单位,提出了一种名为ZAT-DNA的新型分子层防复制技术。该技术利用天然碱基腺嘌呤(A)与非经典碱基2-氨基腺嘌呤(Z)的排列模式编码信息,使DNA密钥在遭遇PCR复制时自动丢失原始A/Z信息模式,从而实现“可读取、不可复制、复制即失效”的分子层安全机制。基于这一特性,研究团队进一步构建了不可复制DNA密钥、Babel-DNA多档案访问控制系统,以及面向NFT数字资产保护的链上—链下—分子三层安全原型,为DNA数据安全存储和分子级数字资产保护提供了新的技术路径。

近日,上海交通大学联合天津大学、中国科学院天津工业生物技术研究所等单位,在国际学术期刊《自然·通讯》(Nature Communications)发表题为 “ZAT-DNA enables DNA data storage with molecular-layer non-replicability” 的研究论文。该研究面向DNA存储存在的“易复制”安全隐患,提出了一种以非经典碱基2-氨基腺嘌呤(Z)与天然腺嘌呤(A)排列模式为核心的新型信息记录机制,实现了分子层面的“复制即失效”数据保护,为安全DNA数据库、分子级访问控制、数字资产保护和未来分布式分子信息系统提供了新的解决方案。

上海交通大学DNA存储研究中心张雁教授、天津大学合成生物技术全国重点实验室罗云孜教授和元英进教授为本论文的共同通讯作者;中国科学院天津工业生物技术研究所宋理富研究员、王高丽(天津大学博士生)为论文的共同第一作者。本研究得到了新基石科学基金、国家重点研发计划、国家自然科学基金、上海市基础研究特区计划等项目的支持。

从“长期保存”到“安全存储”:DNA数据存储面临新的安全命题

DNA分子具有极高的信息密度、优异的化学稳定性和超长保存寿命,被认为是突破传统硅基存储能耗、空间和寿命限制的重要候选介质。随着DNA合成、测序、编码算法和自动化操作平台的发展,DNA存储正在从概念验证逐步走向大规模数据归档、长期冷数据保存的实际应用。然而,DNA作为天然遗传物质,也具有一个与信息安全高度相关的特征:极易被复制。只要攻击者获得DNA样品,便可以利用PCR等常规分子生物学方法,以低成本、短时间、指数级方式扩增DNA档案。这意味着传统DNA存储虽然能够高密度、长期保存信息,却难以从分子介质本身阻止未经授权的复制、转移和潜在泄露。

在传统信息安全体系中,数据保护通常依赖外部加密算法、权限管理系统和服务器访问控制。但对于DNA数据存储而言,数据本身存在于可被物理获取和生物复制的分子介质中,仅依赖软件层加密并不足以解决“样品一旦泄露即可被指数复制”的根本风险。因此,如何在DNA介质层面赋予数据“不可复制性”,是一个DNA存储数据安全的关键科学问题。

针对这一挑战,上海交通大学DNA存储研究中心联合合作团队提出了ZAT-DNA技术,将数据安全性从传统软件加密进一步推进到分子介质层。

ZAT-DNA:把非天然碱基的复制差异转化为安全机制

ZAT-DNA的核心思想,是在传统A、T、C、G四种天然碱基之外,引入非经典碱基2-氨基腺嘌呤(Z),并利用A与Z在聚合酶复制过程中的识别差异构建信息记录模式。在该体系中,信息并非只由传统DNA序列本身承载,而是进一步嵌入到A/Z的特定排列关系中。Z与A在某些复制语境下都可以与T相关联,但聚合酶在扩增过程中难以准确保留原始A/Z排列模式。因此,当ZAT-DNA分子遭遇PCR等复制过程时,复制产物虽然仍然是DNA分子,却无法保留原始ZAT-DNA中用于解密或验证的A/Z排列信息。

换言之,ZAT-DNA具有一种特殊的分子安全属性:原始分子可以被读取,但一旦被复制,关键密钥信息就会在复制过程中不可逆丢失。这一机制使ZAT-DNA不再只是普通意义上的“加密文件”,而是一类具有内在防复制属性的分子密钥和分子凭证。即使攻击者获得了样品并尝试扩增,也只能得到失去原始A/Z模式的“功能性失效副本”,无法恢复原始密钥功能。因此,ZAT-DNA并不只是“在DNA中加入一个非天然碱基”,而是将非天然碱基在复制过程中的信息损失特征,转化为可编程、可验证、可用于访问控制的安全机制。这为DNA存储提供了一种不同于传统数字密码学的分子层防复制策略。

“分子活字印刷”:面向快速密钥生成的工程化策略

除了防复制安全性,DNA存储走向实际应用还必须面对另一个工程问题:写入成本高、交付周期长。传统DNA数据写入通常依赖按数据内容重新合成寡核苷酸。对于大规模冷数据归档,这类方式可以通过高通量芯片合成实现并行化;但对于安全密钥、访问凭证、数字身份标识、NFT权限令牌等“小体量、高频次、需快速生成”的应用场景,每次重新合成都可能带来不必要的等待时间和边际成本。

受“活字印刷”思想启发,研究团队在ZAT-DNA体系中提出了可预合成、可组合调用的分子单元策略。其基本逻辑类似活字印刷:不是每生成一把密钥都重新“雕版”合成,而是预先构建一套标准化分子单元库,再根据目标密钥按位选择、组合和验证。这一策略使ZAT-DNA密钥的生成从“设计—等待合成—读取验证”的传统流程,转变为“调用分子活字—组合装配—读取验证”的快速流程。由于预合成分子单元可以重复调用和批量准备,单把密钥的摊销成本和生成延迟可显著降低。

Babel-DNA:一池多档案,一键一权限


为验证ZAT-DNA在多数据集安全存储中的应用潜力,研究团队进一步构建了Babel-DNA混合存储架构。在该架构中,多个数字文件首先经过喷泉码纠错编码、CRC校验和加密处理,再被转码为常规DNA序列,并共同存入同一个DNA分子池中。读取时,用户可以通过高通量测序获得混合DNA池中的序列信息,但这些信息本身并不能直接恢复目标文件。只有当用户同时持有与某一特定文件匹配的ZAT-DNA密钥时,才可以完成对应数据的选择性解密和恢复。这一设计将常规DNA存储的高容量优势与ZAT-DNA的分子级安全属性进行了分工结合:常规DNA分子池负责存储大体量数据,ZAT-DNA分子密钥负责访问控制和权限验证。

在研究验证中,多个加密图像文件被共同编码到同一个DNA分子池中,并分别对应不同ZAT-DNA密钥。结果表明,不同用户可以根据所持密钥选择性恢复对应文件,从而展示了“同库共存、按钥匙读取、无钥匙不可用”的DNA数据库安全访问机制。

与传统数字权限管理相比,Babel-DNA的关键特征在于:密钥本身具有分子层不可复制性。即使数据池被复制或测序,没有正确ZAT-DNA密钥也难以恢复目标文件;即使ZAT-DNA密钥样品被攻击者尝试扩增,扩增产物也会丢失原始A/Z信息,无法继续充当有效密钥。这使DNA数据库的访问控制从软件层延伸到了材料层和分子逻辑层。

ZAT-DNA与Babel-DNA:名称背后的技术含义

ZAT-DNA的命名体现了其分子字母基础。其中,“Z”代表非经典碱基2-氨基腺嘌呤,“A”代表天然腺嘌呤,“T”则代表胸腺嘧啶及其参与的配对关系。A与Z在复制体系中均与T存在识别关联,研究团队正是利用这种分子识别中的“可读但难以同时保真复制”的特点,将A/Z/T之间的复制模糊性转化为信息安全优势。

在此基础上,研究团队进一步提出了Babel-DNA架构。Babel-DNA的名称来源于寓言中的“巴别塔”,强调多个加密数据集可以像不同语言一样共存于同一个DNA分子池中,但只有持有对应ZAT-DNA密钥的用户,才能“读懂”其中某一份特定数据。

这一设计使DNA数据库具备类似“多数据集混合存储、按密钥选择读取”的能力:同一个DNA池可以容纳不同来源、不同权限、不同用途的数据档案;不同用户持有不同ZAT-DNA密钥,只能恢复其被授权访问的内容。由此,ZAT-DNA从单一分子密钥进一步扩展为DNA数据库访问控制的核心组件。

NFT保护:从应用设想到原型验证

NFT,即非同质化代币,是基于区块链技术形成的唯一数字凭证,可用于数字艺术品、虚拟物品、数字版权和链上资产的确权与流转。区块链能够提供公开可验证、难以篡改和可追溯的权属记录,但NFT对应的图片、元数据或访问凭证通常仍存放在链下服务器或分布式存储系统中。一旦链下内容被复制,链上权属记录并不能直接阻止内容本身被功能性复用。

针对这一问题,研究团队构建了与NFT场景相连接的双密钥原型流程,验证了ZAT-DNA在数字资产保护中的应用价值。该体系采用“离线ZAT-DNA密钥 + 在线辅助密钥”的双层加密方案:创作者首先使用离线ZAT-DNA密钥对原始元数据进行一次加密,随后辅助服务器使用随机在线密钥进行二次加密,生成最终加密元数据。辅助服务器仅保存在线密钥和相关哈希值,不保存离线ZAT-DNA密钥,也不保存NFT的未加密元数据。在该流程中,最终加密元数据被存放于专门的NFT元数据服务器,其哈希值作为索引记录在区块链条目中。NFT所有者在解密时,需要通过服务器校验相关哈希,并最终使用自己持有的离线ZAT-DNA密钥恢复原始元数据。研究团队还设计并验证了密钥更新流程,使新的离线ZAT-DNA密钥可以在不暴露给辅助服务器的情况下完成权限转移和更新。

因此,ZAT-DNA对NFT的保护并不是简单地“把NFT信息写进DNA”,而是为NFT增加了一层不可复制的分子权限机制:区块链负责记录公开、可追溯、难篡改的资产索引;链下服务器负责保存加密元数据和在线访问控制;ZAT-DNA则作为线下持有、分子层不可复制的密钥,决定谁能够真正解密和访问资产内容。

研究团队进一步将包含未加密图像区域和加密哈希标识的嵌合图像铸造成NFT,展示了这一链上—链下—分子三层保护模型的可操作性。这一原型验证表明,ZAT-DNA有望为数字资产、链下内容和长期数字档案提供一种新的分子级安全凭证。

分布式记录与区块链特征:链上可验证,链下可保护,分子层防复制

该研究对区块链场景的启示在于,ZAT-DNA并不试图替代区块链,而是补足区块链在“链下内容可复制”方面的短板。区块链擅长记录权属、时间戳、交易路径和哈希索引,具有公开验证、难篡改和可追溯等特征;但NFT对应的图片、元数据或访问凭证通常仍位于链下,一旦被复制,链上记录本身并不能阻止内容的功能性复用。ZAT-DNA引入后,可以形成一种更接近现实应用的分布式记录结构:链上记录不可篡改的哈希索引和权属关系,链下存放加密数据和访问服务,持有人线下掌握不可复制的分子密钥。辅助服务器可以作为访问控制组件运行,也可根据需要部署在中心化或去中心化的存储/计算环境中;无论采用何种部署方式, ZAT-DNA密钥在分子逻辑层面的不可复制属性提供了关键安全性。

这一架构使数字资产保护从“证明谁拥有链上代币”进一步推进到“谁能够凭不可复制分子密钥恢复资产内容”。对于需要长期确权、跨平台迁移、稀缺性证明或高安全等级访问控制的数字资产而言,ZAT-DNA提供了一种链上可验证、链下可保护、分子层防复制的新型技术范式,也为区块链技术与合成生物学、DNA存储技术的交叉融合提供了新的研究方向。

研究意义:从DNA存储介质走向分子安全基础设施

总体来看,ZAT-DNA的核心突破在于将非天然碱基的复制歧义性转化为可编程的信息安全功能,使DNA不再只是被动的信息保存介质,而成为具备访问控制、抗复制和稀缺性表达能力的分子安全载体。围绕ZAT-DNA,研究团队系统展示了从分子机制、编码方法到应用原型的完整闭环:在分子层面,利用A/Z排列模式实现复制即失效的不可复制密钥;在工程层面,通过活字印刷式预合成单元降低小型密钥写入成本与响应延迟;在数据库层面,构建Babel-DNA混合存储体系,实现一池多档案、一键一权限;在应用层面,进一步面向NFT和区块链链下内容保护,验证了链上—链下—分子三层安全架构的可行性。

未来,随着非天然碱基合成、DNA读写技术、纳米孔测序、纠错编码算法和分布式计算基础设施的进一步发展,ZAT-DNA有望应用于安全DNA数据库、长期档案访问控制、数字身份凭证、链上资产保护、分子防伪认证和稀缺分子代币等场景,推动DNA数据存储从“高密度、长寿命”进一步迈向“可控、安全、低延迟、可验证”的新阶段。

该成果体现了上海交通大学DNA存储研究中心在DNA信息存储、分子信息安全和交叉前沿技术融合方面的持续探索,也为构建面向未来的数据安全基础设施提供了新的分子层解决方案。

论文链接:https://doi.org/10.1038/s41467-026-72869-9