您的位置:首页 >要闻 >

科学家致力于将数字信息存储在DNA中

卡琳·施特劳斯 (Karin Strauss) 说,她的计算机包含了她的 “数字阁楼”-她在这里存放着发表她在高中时写的数学论文和大学计算机科学课程的地方。

37岁的施特劳斯说,她想 “至少在我活着的时候” 保存这些东西。但是计算机必须每隔几年更换一次,每次她都必须复制信息,“这有点令人头疼。”

她说,如果可以将其存储在DNA中 (我们的基因是由DNA制成的),那就更好了。

施特劳斯在华盛顿州雷德蒙德的微软研究院工作,他正在努力让这种科幻幻想成为现实。

她和其他科学家并不专注于寻找存放高中项目或快照或普通人可能积累的其他东西的方法,至少目前是这样。相反,他们的目标是帮助公司和机构在几十年或几个世纪内存档大量数据,而此时世界正在以比它可以存储的速度更快的速度生成数字数据。

要了解她的任务,了解公司,政府和其他机构现在如何存储数据会有所帮助: 对于长期存储,它通常是磁盘或特殊类型的磁带,缠绕在墨盒中,侧面约3英寸,厚度不到一英寸。包含约半英里磁带的单个盒式磁带可以容纳相当于每本200页的约4600万本书,如果数据易于压缩,则可以容纳三倍。

观看视频: 什么是新闻

销售数据存储设备的Spectra Logic首席技术官Matt Starr说,磁带盒可以在理想条件下存储约30年的数据。但更实际的限制是10到15年,他说。

并不是说数据会从磁带上消失。遇到旧的八轨磁带或软盘并意识到自己不再拥有播放它的机器的任何人都熟悉一个更大的问题。Starr说,技术在不断发展,如果不再有读取数据的方法,则无法检索数据。

因此,由于这个原因和其他原因,长期归档需要反复将数据复制到新技术中。

DNA存储的概念进入了这个世界。DNA本质上是一种信息存储分子; 我们代代相传的基因传递着创造人体的蓝图。该信息存储在通常称为四字母DNA代码的字符串中。这实际上是指在DNA分子中发现的四个构件的序列-缩写为A,C,T和G。特定的序列给出了产生特定蛋白质的身体方向。

另一方面,数字设备将信息存储在两个字母的代码中,该代码会产生1和0的字符串。例如,大写 “A” 是01000001的。

将数字信息转换为DNA涉及两个代码之间的转换。例如,在一个实验室中,大写字母a可以变成ATATG。这个想法是,一旦进行了转换,就可以定制DNA字符串以携带新代码,从而携带代码包含的信息。

一个卖点是耐用性。科学家可以从尼安德特人的化石甚至更老的生命形式中恢复和读取DNA序列。因此,作为一种存储介质,“它可以持续数千年,” 华盛顿大学的路易斯·塞泽 (Luis Ceze) 说,他与微软合作进行DNA数据存储。

倡导者还强调,DNA将信息塞入很少的空间。你身体的几乎每个细胞都携带着大约6英尺的细胞; 一个人加起来有数十亿英里。就信息存储而言,这种紧凑性可能意味着将所有可公开访问的数据存储在鞋盒大小的空间中,Ceze说。

英国欣克斯顿欧洲生物信息学研究所的尼克·戈德曼说,事实上,世界上所有的数字信息都可能存储在一堆白色的粉状DNA中,这些DNA适合一辆大型货车大小的空间。

更重要的是,倡导者说,DNA存储将避免由于读取信息的技术过时而不得不反复将存储的信息复制为新格式的问题。

高盛说: “由于医疗保健应用程序,总会有人从事DNA阅读器的工作。”“这总是我们想要快速、廉价地做的事情。”

将信息输入DNA需要做一些事情。一旦科学家将数字代码转换为4个字母的DNA代码,他们就必须定制DNA。对于Strauss和Ceze最近进行的一些研究,涉及创建大约1000万短的DNA串。

旧金山的Twist Bioscience使用一台机器逐个字母地创建字符串,就像将乐高积木拼凑在一起以建造塔楼一样。机器一次最多可以建立160万个字符串。

每个字符串仅携带来自数字文件的信息片段,外加一个化学标签以指示信息来自哪个文件。

为了读取文件,科学家使用标签来组装相关的字符串。然后,标准实验室机器可以显示每个字符串中DNA字母的序列。

没有人在谈论用DNA替换消费类计算机中的硬盘驱动器。一方面,读取存储的信息花费的时间太长。Ewan Birney说,这永远不会在几秒钟内完成,他与生物信息学研究所的高盛一起从事DNA存储工作。

但是对于有价值的材料,比如长期存储的公司记录,“如果值得的话,你会等待的,” 高盛说。他和伯尼一起正在与投资者讨论成立一家提供DNA存储的公司。

加州大学洛杉矶分校的斯里·科苏里 (Sri Kosuri) 从事DNA信息存储工作,但现在主要转向其他领域,他说,使技术实用的一个挑战是使其便宜得多。

科苏里说,科学家们现在定制了相当短的DNA字符串用于研究,但是要扩大到足够大的规模来处理大量的信息存储,这将需要 “令人难以置信” 的产出飞跃。他说,以目前的技术,这将是非常昂贵的。

哈佛著名遗传学专家乔治·丘奇 (George Church) 同意成本是一个大问题。但丘奇说,“我非常乐观,它可以在十年或更短的时间内被大幅降低”,他正在创办一家公司,提供DNA存储方法。

对于所有对该主题的兴趣,值得注意的是,到目前为止,研究人员存储在DNA中的信息量相对较小。

本月初,微软宣布包括Strauss和Ceze在内的团队存储了200兆字节的记录。信息包括100书 __ 一本,恰如其分,是 “伟大的期望” __ 以及一个简短的视频和许多文件。但它仍然不到普通DVD的5% 容量。

然而,这大约是丘奇上个月报道的9倍,他说这一宣布显示了 “这个领域的发展速度有多快”。

同时,涉及存档数字数据的人们说,他们的领域将DNA视为未来的可能性,但不是万灵药。

北卡罗来纳大学信息与图书馆科学学院教授Cal Lee说: “这是解决存储问题的一种非常有趣且有前途的方法,但存储问题实际上只是数字保存的一小部分。”

他说,的确,社会可能总是有读取DNA的设备,因此可以解决过时读者的问题。但这还不够。

“如果你只读1和0,你不知道如何解释它,” 李说。

例如,那串是图片,文本,声音剪辑还是视频?你还有软件来理解它吗?

此外,负责保存数字信息的人希望定期检查它,以确保它仍然完好无损,“我不知道DNA有多可行,” 耶鲁大学图书馆数字保存经理Euan Cochrane说。他说,这可能意味着更少的检查。

科克伦将他的工作描述为保持信息可访问 “10年到永远”,他说,如果DNA的成本可以降低,科学家们找到更快地存储和恢复信息的方法,DNA看起来很有趣。

斯塔尔说,他的数据存储设备公司没有详细研究DNA技术,因为它在未来太远了。

他说,“总有一些东西可以在很长一段时间内存储数据”。但将这些想法转化为实用产品的挑战 “确实很快就削减了这一领域。”

相关推荐

猜你喜欢

特别关注