到2030年袖珍型DNA计算机可能会拯救世界

我们于2020年10月首次听说Catalog,这是基于DNA的数据存储的先驱,并采访了其首席执行官兼IBM校友DavidTurek。将近一年后,他们宣布了由HamwhaImpactPartners领投的3500万美元B轮融资,并计划推出其第一个基于化学的计算平台,该平台通过合成DNA操作结合了数据管理(和存储)和计算。

因此,是时候赶上Catalog并将其首席执行官HyunjunPark置于受访者席位上。

在过去的一年里,CATALOG与几家领先的IT、能源、媒体和娱乐公司合作,帮助推进商业化技术。通过这项工作,CATALOG发现了我们平台在各个行业领域的广泛适用性,以及对基于DNA的计算在大量数据用户中所承诺的几乎普遍的需求。我们目前可以谈论的早期应用包括数字信号处理,例如能源部门的地震处理,以及数据库比较,例如金融行业的欺诈保护和身份管理。

2.现在的香农有点像那一代的ENIAC:笨重、缓慢、昂贵、有限但具有开创性。如果我们快进到2030年;香农v10会是什么样子?

Shannon帮助证明了自动化和扩展基于DNA的存储以及现在基于DNA的计算的过程是可以实现的。仅仅为了这个目的,建造香农就很重要。十年后,该技术的未来版本将更小、更便携、更快、更高效。可以想象,到2030年,您可以看到桌面版和袖珍版Shannon可用,并且在存储和计算方面使用非常少的能源。

3.计算中的DNA通常与存储数据有关。Catalog想将DNA带入算法和应用程序?但是如何?

用DNA计算是指将DNA编码的数据转换成某种新的信息。例如,如果我有一个包含两个大数字的输入文件,将它们相乘会创建一个以前不存在于文件中的数字——这是代表两个数据的乘积的新信息。我们相信我们可以创建一组化学“指令”,这些指令可以对DNA编码数据进行操作以创建新信息。示例包括优化问题(在金融、物流、制造中寻找最大、最小、最好的事物)、信号处理问题(应用于石油和天然气行业的地震处理等领域)以及推理和机器学习开始。DNA的优势在于我们可以在极端的并行性水平下执行这些操作,这意味着我们可以应用数十亿或数万亿个计算代理来共同解决手头的问题。每个计算代理(可能由一组分子组成)作为计算引擎的能力将相对较弱,但将数十亿或数万亿的人聚集在一起解决问题的机会可能会大大减少获得洞察力的时间。

可以想象,到2030年,您可以看到桌面版和袖珍版Shannon可用,并且在存储和计算方面使用非常少的能源。

朴贤俊目录社长

我们感兴趣的另一个领域是搜索。我们可以使用化学指令快速找到编码到DNA中的数据对象,而不受数据量的影响。这意味着随着我们搜索的数据量的增长,我们可以使用化学搜索技术,该技术基本上与数据量无关——求解时间或多或少保持不变。在当今的许多电子搜索应用程序中,情况并非如此,差异的原因在于DNA存储是漂浮在液体中的分子集合,独立于电子媒体中存在的物理组织类型:磁带盒必须以串行方式检查,因为这就是它的物理组织方式(A在B之前,在C之前,依此类推)。

4.你们的资金新闻还提到预计2022年会出现基于DNA的计算?这是什么意思,它会更广泛地使用吗?

到明年,CATALOG将通过特定的业务用例展示基于DNA的计算的价值。它可能会显示分析某个特定行业中先前保存在冷库中的数据的商业价值。我们的期望是,随着用例的扩展,我们将允许客户通过Web即服务(2024年的某个时候)访问我们的技术;我们还考虑了在随后的某个时候构建能够在客户场所执行计算的微型设备的可能性

5.现在,基于DNA的存储样本看起来像试管中的橙色物质。它最终会采用什么形状/尺寸?

基于DNA的存储是漂浮在液体中的DNA分子(在CATALOG案例中为橙色,因为我们用来编码DNA的墨水的成分)或者可能是用于长期存储的DNA颗粒。以液态形式存储有很大的用途,因为它提供了直接在文件中找到“记录”的机会:我们可以创建探针,一旦插入文件,就会直接找到目标记录或数据。

6.去年我问过目录一个问题,是“要多少钱?”我们现在有答案可以分享吗?我们在考虑什么样的存储密度,以及每存储PB或TB的成本是多少?

DNA存储的第一个商业化选项,其次是基于DNA的计算,可能会作为服务提供。我们将在更接近该产品的可用性时公布定价模型。目标是与传统存储近似相等,但通过面密度的显着改进(比电子介质密度高一百万倍)、有效无限寿命和避免技术过时来表达价值:今天编写的DNA将是可读的在未来的任何时候,因为DNA不会改变:不存在固件、操作系统或设备升级等相关问题。

7.目前,DNA存储/计算能力快速发展的最大障碍是什么以及正在采取哪些措施来解决这些障碍

目前,障碍在本质上是工程,并专注于客户认为对任何计算技术而言始终重要的问题:可靠性、性价比、可用性、一致性等。我们有一支由工程师、化学家和计算机科学家组成的专门团队,对这些问题中的每一个进行分类,以创建客户习惯的价值指标。这包括现有机器的小型化、覆盖整个过程的自动化扩展,以及客户所需的软件基础设施和工具的设计和实施。

8.当前正在考虑哪些解决方案来解决吞吐量问题(例如,写入10MBps每月只有26TB)。

Shannon的当前吞吐量属性旨在帮助CATALOG更好地理解我们在机器上所做的设计选择的限制影响,包括缩放编码和计算模型背后的化学的含义。我们可以通过改变当前系统的一些性能参数来调整吞吐量,这会产生几个数量级的影响。但我们已经开始布局其他设计选择,这些选择甚至可能远远超出这种改进。例如,增加增量式喷墨打印头对机器的吞吐量产生指数影响。这只是我们可用的许多调整或设计选择中的一个例子。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

最新文章