“上帝不响,像一切全由我定。”
——《繁花》
《繁花》的热播引起了上海人的集体追忆热潮,黄河路上人头攒动,排骨年糕排起长龙。
翻开原著,全书用700余页、近35万字的体量凝练浓缩了一代上海人的成长蜕变,成为上海改革发展的时代切片、回忆琥珀。文字,是古老悠久的信息载体,一笔一划之间道生死、记兴替。但是,书写的效率和纸张的大小决定了它不会是最高效的信息载体。
当我们繁华看尽暮然回首,忽然发现苦寻不得的答案原来就在我们每个人的身体当中——DNA不响,却装下了生命和世界。
30秒全文速读:
71年前的一页论文,开启了生命科学的新纪元。DNA双螺旋,科学界的永恒画卷,揭示了遗传信息的奥秘,引领着无数科学探索。核酸检测、基因测序的技术突破,如同历史长河中的波澜,推动了生物技术的巨浪。DNA计算机与存储技术,预示着信息与生命科技的融合未来。正如书写的线条勾勒出时代的印记,DNA在微观世界中编织着生命和宇宙的故事。
01 一页纸的论文,开启一个新的时
20年前,有人把DNA的双螺旋结构和蒙娜丽莎融合到了一起。在艺术中,永恒的形象是蒙娜丽莎;在科学里,永恒的形象是DNA双螺旋结构。
DNA双螺旋结构的发现故事,可以追溯到1953年。当年,沃森和克里克在英国的《自然》杂志上发表了一篇文章,题为《核酸的分子结构》。整篇论文一共就一页纸,却开启了生命科学进入微观世界的新征程。
A(腺嘌呤)、T(胸腺嘧啶)、G(鸟嘌呤)、C(胞嘧啶)四个字母组成的遗传密码,在双链中有特定的配对方式——A与T配对,C与G配对。沃森和克里克在论文中写道:从DNA配对的方式,我们马上可以推测出遗传物质的复制机制。
几代科学家接力,揭示了DNA的复制过程到底是怎么进行的。细胞里有一种蛋白质,叫DNA聚合酶。它的大小大约是十几个纳米,比头发丝还细100-1000倍。DNA可以穿过聚合酶的孔洞。穿过孔洞的时候,双螺旋的DNA就像是拉链一样被打开,并进行复制。就这样,1条链变成了2条,2条链变成了4条……这一过程无时无刻不在我们身体内进行。
1962年,沃森、克里克和威尔金斯一起获得诺贝尔生理和医学奖。之后,几十个诺贝尔奖都颁给了与DNA和RNA相关的研究,包括核酸的结构功能、信息调控、基因编辑技术等等。
02 一页纸的论文,带来产业的变革
对于DNA和RNA的研究,带来了生物技术的高速发展。过去几年,大家都经历了无数次的核酸检测,就是其中的一个缩影。核酸检测技术背后的原理很简单,就是DNA复制。首先,获取唾液或者鼻黏液,提取病毒RNA,再将RNA反转录成一种特异的DNA。获得了DNA后就可以进行大规模的扩增,并进行检测。这样,只需要一点点样品,就能测出体内是不是有新冠病毒的存在。相比之下,抗原检测虽然方便,但达不到核酸检测的灵敏度。因为,抗原检测测的是病毒抗原本身,而核酸检测的是经无数次“复印”过的病毒核酸。
核酸检测技术是一个非常强大的工具。它不仅能检测新冠病毒,也能检测其他的病毒、细菌,甚至在癌症筛查上也很有用。
和核酸检测一样,基因测序也有着同样巨大的市场。人体细胞的DNA就像是一本由30亿个遗传密码写成的密码书。30亿个A、T、C、G的排列组合,每个人都不相同。基因测序就是把这本书的每个密码读出来。至于密码的含义,科学家们还在持续努力地破译中。
上世纪末,完成了人类基因组计划。当时全世界几十个国家,花了几十亿美元,只测了一个人的基因。我们中国仅仅参与了其中的1%。但现在,在深圳的华大基因,我们可以花1000块钱,在几个小时内就把自己的基因序列测出来。测出来之后有什么用呢?通过对我们的基因组序列的分析,我们有可能知道我们的祖先从哪里来、我们能不能喝酒,对音乐的感知能力如何、得病之后如何用药……
我们不仅能测我们的基因序列,也能测古人类、古生物的基因。现在已经测出了100万年前猛犸象的基因,使我们得以了解了它们的生物学信息。
03 DNA是一种“看得见也摸得着”的材料!
DNA存在于我们每个人的体内,但这种来自微观世界的生物分子显得非常神秘!DNA到底长什么样?我们把细胞里的DNA拿出来,放到高分辨率的原子力显微镜下观察,就可以看到,DNA长得像一根柔软的毛线一样。
DNA的直径很小,只有2纳米左右。胡钧教授等曾在2001年把细胞里的DNA拿出来、观察它、并用它写成了“DNA”三字。
我们跟清华大学的张洪杰院士合作,将极细的DNA作为丝线,将它纺织成了“布”。由DNA织成的布,强度比蜘蛛丝织成的布还高,可以用作防弹衣的衬衣。
因此,DNA不是一个玄幻的名词,是一种看得见也摸得着的高分子材料——一种由A、G、T、C四个字母组成的、可编码的、通过自然选择而来的分子信息材料!
04 DNA计算机是梦想还是未来?
我们都知道,计算机世界是由写在硅基上面的0和1所构成的。而生命世界实际上是由写在碳基上面的A、G、T、C所构成。也就是说,纷繁复杂的网络世界的背后是0和1在跳动;花鸟鱼虫、飞禽走兽的背后其实就是A、G、T、C四个密码在跳动。这是一件非常奇妙的事。一个是硅基、一个是碳基;一个是二进制,一个是“四进制”。那如果把两者相融合呢?
1994年,著名的计算机科学家、图灵奖的获得者伦纳德·阿德曼(Leonard M. Adleman),提出了DNA计算机的概念。DNA计算机具有高并行、低能耗的优势。在一个试管里,一步就能完成1020次运算。一些电子计算机不能计算的问题,比如哈密尔顿路径问题,就可能通过DNA计算机来完成。
DNA计算机虽然有着硅基计算机所不可比拟的优势,但是它的发展过程却十分艰难。为什么呢?因为DNA计算是在溶液中发生的,没有办法寻址的,它的规模就会受到限制。我们实验室最近的一项突破就有望解决这个问题。我们通过对DNA反应过程的调控,第一次实现了超大规模的可编程的DNA逻辑门阵列,从而为未来实现真正的DNA计算机提供新的可能!
05 仅200公斤DNA就能存储全世界的数据!
应该说,今天的DNA计算机的发展程度,距离应用还是非常遥远。而与DNA计算相关的DNA存储则显得距离我们更近。DNA存储是国家“十四五”科技规划中明确提出要加快布局的前沿技术之一。美国《科学》杂志提出了未来125个科学问题,其中之一就是DNA是否可以用作信息存储的介质。美国的微软、哈佛大学、华盛顿大学等一起成立了DNA 数据存储联盟,旨在推进DNA存储行业生态系统的发展。
回顾整个人类社会的文明史,它就是一部信息存储方式和传播方式变革的历史。原始人通过结绳记事等方式把信息记录下来。后来人类又发明了纸,信息的存储时间和存储量就大大提升。上世纪末开始,电子信息时代来了,似乎已经解决了信息存储的问题。那么,未来还需不需要变革呢?
2020年,全世界的数据是440万亿字节。光把这些数据存储下来,全世界数据中心的耗电量就是三峡大坝的发电量。其占地、耗能、人力、物力都是非常大的问题。到2025年,全球的数据量预计会达到1,750万亿字节。这些数据能耗巨大,传输体积也巨大。但其中,高达80-90%的数据是极少被调用,我们称之为“冷数据”。
在这样一个历史时期,DNA存储就应运而生。碳基的、基于生化反应的、四进制的DNA存储一下子把信息存储的容量极限提升了6-7个数量级。1000万块硬盘的数据,用50克的DNA就可以存储下来,“揣”在口袋里就能带走。全世界440万亿字节的数据用200公斤DNA就可以存下来。当然,这在目前仅是一个理论推算。但是毋庸置疑的是,这将是一次划时代的进步,未来的数据存储问题将有可能因此得到解决!
DNA存储不仅密度高、能耗低,而且寿命长。信息存储在硅上,寿命大约是数十年。但信息存储在DNA上,则能稳定保存百年、千年,极端条件下甚至可达百万年。
06 DNA存储,未来可期
大家会问,DNA存储什么时候能够实现?微软已经做了一台DNA存储机。虽然看起来不起眼。但是回想一下,1946年,第一台计算机整个屋子都装不下。到了1982年,它就进化得和今天的计算机非常像了。所以,根植于生物技术(BT)的DNA存储,可能也会遵循信息技术(IT)爆发式、跨越式、非线性的发展模式,在不远的未来有可能投入使用!
1994年,比尔盖茨做了一场展示秀。他坐在33万张纸上,手中拿着一张光盘(存储容量为600兆字节)告诉全世界:1张光盘能记录的内容,比这33万张纸都多!那时候,美国在科学与技术上是远远走在我们前面的。但是,在现在的中国,我们有能力直面美国的竞争,来解决包括像DNA存储这样的前沿或卡脖子问题!上海交通大学的团队正在努力!我们的团队包括丁奎岭院士、陈海波教授等一众科学家。希望在未来,我们有可能在数据中心,手中拿着一管DNA告诉全世界:这里面能记录的内容,是当前全世界的所有数据!