存储的未来:分布式存储、原子存储、DNA存储

2005年人类收集了大约130艾字节的数据(1EB=1024PB==2^60字节),要把这些信息写在纸上,你大概需要把整个地球都覆盖上树木,然后再把它们变成书。2015年这个数字是7900艾字节,到2020年,这一数字达到40900艾字节。2005年之后,每个季度产生的数据量远远超过人类在互联网使用之前几千年的数据总和,同时,一些亚非拉非发达国家和地区仍然有很多人没有接入互联网,互联网的用户仍在爆发式增长,智能手机和可穿戴设备等智能设备的激增,社交媒体的普及,以及物联网等等,由此产生的数据也在呈超指数级增长。

这就产生了一个数据存储的问题,这么多数据该如何高效、快捷、便利地存储呢?

世界各地的团队都在数据存储公司和大学等研究机构致力于解决这个问题。在这里,我们概述了一些即将进入市场的技术,以及数据存储的未来概念。

分布式存储

分布式存储伴随着区块链的概念应运而生,主要通过去中心化的方式来存储、提取、检索数据。世界各地存在大量未使用的存储空间,主要由各种实体拥有,大型企业、小型家族企业、地下室有巨大硬盘机架的个人,以及每个人笔记本电脑中的小型硬盘,这些资源空间都可以用来存储。但是,由于种种障碍限制,使得这些存储空间很难被拿出来使用和共享。通过去中心化、分布式存储就可以充分挖掘闲余的存储市场,提高整个存储网络的应用效率。

01

数据的恢复性

我们在生活中经常会遇到自己的照片或者视频被误删了,之后怎么都找不回来了,但是分布式存储就可以避免这种情况。。首先你的数据会被切分成数个小片段,然后分发到分布式网络上,存储到分布式的节点存储盘中,如果你不小心丢失了数据,那么你就可以向网络请求数据,下载数据。

02

数据的便利性

随着短视频的爆发,未来将有越来越多的视频传输到网络上,在分布式存储网络中,人们可以从身边的人那里去下载视频,而不是通过中心服务器请求通过DSN网络分发,这样无疑增加了传输的效率,增加了用户下载的便利和高效。

03

数据的长久性

近年来,在数据存储领域比较火的一个概念是Long data,我们称之为长数据,它主要是指那些需要我们长期保存的数据,比如银行相关的交易日志数据,四大行的内部规定,普通数据材料保存5年,业务数据10年,信贷业务相关核心数据永久保存,存量“原始流水数据”银行还是主要使用磁带备份方式,这种磁带存储的弊端显而易见。在这种应用场景下,如果银行的交易日志的备份由最传统的磁带技术转化为分布式存储技术,这就可以使重要数据得到永久保存,并且我们可以实时去检查Long Data的可用性。

04

数据的隐私性

分布式存储数据与现有的云系统相比,可以更好地保护隐私。现今各种云存储提供商将用户的数据完全存储在未加密的空间中,即使一些添加了静态加密的加密系统,也通过控制用户的加密密钥来做到这一点,而不是创建真正”零知识证明”系统。这是一种危险的安排,因为它意味着客户数据可能会被黑客或其他攻击者窃取、泄露或出售。分布式存储系统将数据存储端到端加密,即使有权访问加密文本的攻击者也无法了解其中的内容。同时通过将一个文件切分成数据块的方式存储到不同的存储服务节点上,所有数据内容都进行加密处理,只有用户访问密钥,并且单个数据存储提供商的故障不能损害数据的恢复能力,这是一个比中心化存储方式更安全、高效的去中心化的存储网络。

05

数据的价值性

分布式存储网络体现了一种替代方案,即创建网络价值的参与者通过网络中的数字通证进行补偿。在分布式网络上存储、分发、检索、管理数据的矿工可以赚取网络通证货币,他们可以选择持有或清算这些通证得以兑现。这种共识机制和正反馈循环会激励协作参与者积极地参与网络建设,他们也都将从网络的成功中获得丰厚的回报。另外作为个人数据的拥有者,可以选择性地授权企业使用自己的数据,由此数据产生的价值也归个人所有。

在材料科学领域,存储芯片的存储效率一直是技术攻关的要点和难点。几十年来,计算机存储已涵盖各种技术,包括打孔卡、软盘、磁带、硬盘和闪存技术。在每种情况下,目标都是相同的,使数据保持可访问性,并可供将来使用。这些速度和容量的进步构架了当今复杂的计算框架系统。

工程师们从硬盘和闪存存储中挖掘出进一步的性能和容量收益,研究人员正在开发下一代技术,这些技术可以在小物体上保存大量数据数十万年或更长时间。这些技术可以在未来几年一劳永逸解决世界的数据存储问题。这其中包括原子存储技术和DNA存储技术。

目前研究原子存储技术有两个分支,

一个是原子位置存储( atom positions storage),

一个是原子磁化存储(atom magnets storage),

原子位置存储

原子位置存储主要的研究者是一群来自荷兰代尔夫特理工大学(Delft University of Technology)科维理纳米研究所(Kavli Institute of Nanoscience )的科学家们。他们利用氯原子的位置记录下每一个数据,成功地储存1KB的数据。理论上,该技术能够在邮票大小的面积上储存60TB的数据,而目前的常见硬盘是1-2TB的,这一存储密度要比目前的硬盘高500倍。相关的论文于2016年7月18日正式发表在《自然》杂志的《纳米技术》子刊上。

在1959年,物理学家理查德·费曼(Richard Feynman)在其著名演讲《There’s Plenty of Room at the Bottom》上提出,精确地操纵每一个单原子并非梦想,一旦成功,即可借助原子来储存信息和数据。

在研究中使用的操作仪器也非常高端,扫描隧道显微镜,简称STM,是人类史上第一次实现了单原子操作的仪器,其厉害之处在于一根非常“尖”的探针,探针的头上只有一个金属原子。研究小组借助它操纵着一个一个的氯原子,完成了这块硬盘所有的数据写入和擦除。

这块最小硬盘的每个字节都是依靠单个氯原子的位置来记录的。硬盘的基板是铜,表面覆盖了一层氯原子(单原子层)。因此,如果某一个氯原子缺失,就会形成一个“空位”(vacancy),而这些空位的位置就成了这块硬盘存储数据的基本单元,通过移动氯原子的方法,将空位“送”到我们想要的位置,从而实现了数据的写入。

STM探针接近并通过隧穿电流,从而引导氯原子向右移动,这样造成的效果就是空位移到了左边。在能够随意摆放空位之后,接着就是将这些空位的位置转化成二进制编码,这与其他存储设备的原理没有任何分别。

由于两个空位不能相邻,因此空位在中间时,就表示1,不在中间,则为0,图中八个比特组成了一个字节,按照国际通用的二进制ASCII码,这个字节代表的是字母“e”。

上图中展示了,空位的位置是如何转化为二进制编码,并建立一个字节的数据。而二进制是计算机系统的基石,通过无数的0和1构成成了我们现在的数字世界,有了编码之后,就可以开始真正地写入数据了。

原子磁化存储

将磁铁切成两层,变成两块较小的磁铁。再次切片,变成4块小磁铁。我们知道磁铁越小,那么它们的稳定性越差。它们的磁场往往从一个时刻翻转极性到下一个时刻。好消息是现在物理学家已经成功地从单个原子中制造出稳定的磁铁。

研究小组于2017年3月8日在《自然》杂志上发表了他们的研究报告,他们使用单原子磁铁制造了原子硬盘。瑞士联邦理工学院(EPFL)的物理学家、论文作者Fabian Natterer表示,这种由2个这样的磁体制成的可重写装置只能存储2比特数据,但扩展系统可以增加1000倍的硬盘存储密度。

荷兰代尔夫特科技大学的物理学家Sander Otte说:”这是一个里程碑式的成就,不可否认,磁极稳定性在单个原子中得到了证明。

在常规硬盘内,磁盘被分割成磁化区域,每个区域都像一块小棒磁铁,其中的磁场可以指向向上或向下,每个方向表示 1 或 0 ,这种就形成了数据比特单位。可以磁化区域越小,存储的数据就越密集。但磁化区域必须稳定,否则硬盘内的”1″和”0″就会相互干扰,在无意中切换磁极。

目前的商业化的可使用比特包括大约100万个原子。但在实验中,物理学家已经从根本上缩小了储存1比特所需的原子数量——从2012年的12个原子到现在的只需要1个原子。Natterer和他的团队在低于5开尔文的温度下,使用放置在氧化镁薄膜上的稀土金属“钬”原子,就可以实现单原子存储。

钬原子特别适用于单原子存储,因为它有许多不成对的电子产生强磁场,它们位于靠近原子中心的轨道中,在那里它们不受环境影响,这给钬提供了一个大而稳定的磁场。但是有一个缺点,它使钬之间很难互动,直到现在,许多物理学家怀疑是否能够可靠地确定原子的状态。

为了将数据写入单个钬原子,研究小组使用扫描隧道显微镜磁化尖端的电流脉冲,它可以在0或1之间翻转原子场的方向。在测试中,磁体被证明是稳定的,每个磁体保留其数据几个小时。为了进一步证明可以可靠地读取比特,该团队(包括技术公司IBM的研究人员)设计了第二种间接的读出方法。他们使用邻近的铁原子作为磁传感器,对其进行调谐,使其电子特性取决于2-bit系统中两个磁体的方向,这种方法还允许团队同时读出多个比特位,这使得它比显微镜技术更实用,干扰性也更低。

使用单原子作为存储单位将从根本上增加数据存储的密度,Natterer说,他的EPFL同事正在研究制造大型单原子磁体阵列的方法。但是2-bit系统还远远没有实际应用,远远落后于另一种单原子存储,这种存储在原子的位置编码数据,而不是在磁化中编码,并且已经构建了一个1千字节可重写的数据存储设备。

然而,磁化存储系统的一个优点是它可以与自旋电子学兼容,这种新兴技术不仅使用磁性状态来存储数据,还利用移动计算机周围的信息代替电流,并产生更节能的系统。

虽然Natterer和他的同事的工作还远远没有实际应用,但他们在扫描探针显微镜技术方面的进步表明,在单个原子中存储和检索磁性信息是可行的。在读取和写入数据方面,所涉及的技术不是最方便用户或最实惠的。即使开发了其他传感方法,作者利用的钬原子的特殊磁性特性也只能在极端条件下实现,比如在超高真空中。

DNA存储

将数据存储在DNA中的想法听起来似乎很先进的,但在某些方面,情况正好相反。在计算机出现很久之前,大自然已经想出了如何以DNA的形式存储大量信息,而DNA是我们所知道的生命的基石。现在一些研究者正在接受创建人工基因序列的想法,这些序列使用四个DNA碱基对——A、C、G和T——来表示二元信息位。

几年前,斯洛文尼亚University of Ljubljana的研究人员证明,将计算机代码片段编码到烟草植物的DNA中是可能的。他们创建了一个简单的计算机程序,然后将其拼接成烟草植物的基因构成。

从那时起,哈佛大学的一个研究小组使用CRISPR基因编辑技术来在细菌DNA里存储了一段视频。这段视频更像低分辨率GIF,而不是我们大多数人今天习惯观看的高分辨率视频,但还是代表着一个重大的进步。领导这项实验的哈佛大学神经学家Seth Shipman博士表示”我们想测试细菌中的CRISPR-Cas系统是否可以在活性细菌中用来捕捉具有时间成分的复杂信息。

在过去的几年中,Catalog公司一直致力于将DNA存储商业化。他们的宣传是,有可能很快将世界的全部数据存储在一个与衣橱大小的空间里。这要归功于他们的方法,将数据编码成合成聚合物,2019年夏天,这家初创公司宣布,它成功地将所有16GB的英文维基百科压缩成一小瓶的这种材料。

“当我们将信息输入这些DNA分子时,我们已经开发了理论框架,用于操纵这些分子进行基本计算,建立复杂的功能,”CJ Huntzinger,  Catalog的通讯主管说道。”我们的目标是在不久的将来建立一个通用计算系统,我们可以将任何类型的布尔逻辑和功能转化为一组分子指令,因此,在计算它们之前,我们不必将DNA分子中的信息提取到数字介质中。随着该技术的不断发展,它不仅在存储方面提供了巨大的潜力,而且能够跨 PB字节执行模式识别等操作。”

目前这些存储技术在商业上应用较为广泛的就是分布式存储技术,原子存储技术和DNA存储技术距离商业应用还有一段距离。

添加微信免费咨询更多建站信息
微信号:landui07

未经允许不得转载:云技术 » 存储的未来:分布式存储、原子存储、DNA存储

赞 (0)