图片新闻将数据载入DNA,可保存数十万年在墨水中加入叶绿体 科学家开发出3D打印新方式新技术实现大面积制备钙钛矿LED携带角动量的电磁孤子研究获进展
第07版:科技创新·项目
上一版 下一版  
图片新闻
将数据载入DNA,可保存数十万年
在墨水中加入叶绿体 科学家开发出3D打印新方式
新技术实现大面积制备钙钛矿LED
携带角动量的电磁孤子研究获进展
     
 
重庆日报 | 重庆日报农村版 | 重庆科技报
重庆日报报业集团主办 
3上一篇  下一篇4  
2021 年 02 月 04 日 星期 放大 缩小 默认  

将数据载入DNA,可保存数十万年

汤波

  身处大数据时代,人们每分每秒都在产生着大量的数据。为了使珍贵的数据能长期可靠地保存,科学家想出将数据写入活细菌DNA中的方法,并在最近获得了实验的成功。

  DNA成为数据存储理想载体

  众所周知,计算机的二进制语言只需要0和1两个符号,即可编码所有信息。而生命的本质也是一种语言,那就是由A、T、C、G四种碱基串联而成的DNA,四种碱基的顺序蕴藏着生命的信息。早在上世纪80年代末,就有人提出,或许可以将计算机的二进制数字语言转换成DNA的四种碱基语言,从而将数据信息存储在DNA上。读取时只要进行反向DNA测序即可。

  相比于人类津津乐道的硅,DNA简直是数据存储的理想载体。首先,DNA的存储密度非常大。如果能够像大肠杆菌那样包装DNA,那么全世界的数据信息都可以储存在1公斤重、只占粉笔盒大小空间的一堆DNA中。其次,一般物理存储设备使用寿命往往不到10年,DNA则可将遗传信息完整保存100年以上;如果是在零下18℃以下的低温环境中,甚至可保存上万年、数十万年。再者,DNA存储过程耗能极少。要存储同样大小的信息,DNA的耗能量只相当于闪盘的亿分之一。

  人工合成DNA尚有缺陷

  当该想法被提出后,科学家就开始思考如何将二进制数字语言转换成DNA的四种碱基语言。

  2012年,哈佛大学遗传学家乔治·丘奇团队确立的规则是,用碱基A、C编码二进制的0,G、T编码二进制的1。经过简单翻译,一本包含大约5.34万个单词的书籍、11张JPG图片、一段简短的计算机程序,全部被编码进不到亿万分之一克的DNA微芯片中。这些文件大小相当于659KB。之后,研究人员利用反向DNA测序技术进行解读,只略有瑕疵地发现了22个错误。几个月后,欧洲生物信息研究所采用另一种策略,同样将大小为739KB的文件写入人工合成DNA中,这次的读取正确率接近100%。

  这两项研究让人们看到了DNA存储技术的希望,于是开启了研发的热潮。之后,存储数据的大小不断突破上限,从22MB到200MB,再到维基百科所有的数据。不过,人工合成DNA数据存储技术要实现商业化应用,还有一些重大问题要解决。

  一是成本过高,目前人工合成存储1MB数据的DNA,需要3500美元,解码过程还需要额外支付1000美元。二是无论存储还是读取过程都需要专业设备,个人使用极不方便。三是DNA保存需要低温环境,否则时间一长就容易发生DNA降解,导致数据失真或丢失。

  信息录入活细菌获成功

  科学家这次将目光放在了活细菌的DNA上。

  事实上,早在2017年,丘奇团队就开创性地利用“基因魔剪”CRISPR–Cas技术,将编码信息的DNA片段送入细菌体内。CRISPR–Cas系统可以对任何DNA序列进行精准修改,如将碱基A替换成碱基G,或者删除、插入、替换一段特异的DNA序列。

  而这一次,哥伦比亚大学的研究人员则进一步发展了该方法。他们用电化学方法调控CRISPR系统,看它是否能成功行使功能。并且将需要存储的二进制信息先转换为DNA序列,插入环状质粒,然后再随质粒转入大肠杆菌体内。之后通过改变化学试剂的浓度,就可以改变细菌周围的电压,这时一些特定的环状质粒拷贝数会显著增加,CRISPR系统感知到这种变化,就会将质粒中的插入片段写入细菌基因组,在生物体内实现数据信息的自动存储。

  为了研究该方法的可行性,研究人员将“hello world”录入大肠杆菌的DNA中,并测试它们繁衍80代后,所携带的信息是否仍然稳定,结果发现正确率达90%以上。之后,他们还将大肠杆菌混入土壤微生物中,对混合物进行测序,结果是仍然可以恢复存储的信息。

  虽然活细菌存储数字信息的研究还有很多技术难题需要攻克。不过,随着众多科学家和大型企业的加入,这些技术难题将被一一解决,相信在不远的将来,DNA数据存储设备将随处可见。

3上一篇  下一篇  
 
《重庆科技报》版权所有 未经书面授权 不得复制或建立镜像
地址:重庆市渝中区双钢路3号科协大厦 邮编:400013
技术支持:北京北大方正电子有限公司