大家好,我是王立铭。2021年1月6日,生命科学·巡山报告又和你见面了。
对于我们这一两代人来说,刚刚过去的2020年实在是发生了太多“活久见”的事情,每个人都有自己刻骨铭心的体验,我就不越俎代庖做年终总结了。
单就生命科学而言,刚刚过去的这一年有一个鲜明的主题,我不说你也知道,那就是新冠肺炎。在20世纪50年代开始的现代生物学革命之后,这是人类第一次遭遇一种突如其来、快速扩张、有巨大危险的全新疾病。全人类的生物科学研究力量被前所未有地动员起来,向着这种疾病,展开了 “饱和式救援”。
我猜,你肯定还是会抱怨特效药来得不够快,疫苗研发得不够及时,对病毒来龙去脉的研究好像也不足以回答所有的困惑。但是公平地说,这一年当中,伴随着全世界科学家发表的近10万篇学术论文,关于新冠病毒的基础生物学、关于疾病的救治经验总结、关于药物开发和评估、关于疫苗的开发和检验,人类的进展速度是史无前例的。
这期报告的时间正好是辞旧迎新。这段时间,我集中回顾了2020年发生的生命科学大事,也看了不少媒体评出来的2020年重大科学新闻,想看看有没有漏掉什么特别值得大家知道的东西。结果还真发现了两件事,一件是纯粹的基础科学突破,另一件是革命性的药物开发进展。今天,我就来讲讲它们的故事。
1.
鸟类智慧的秘密
这是一个特别基础但是脑洞特别大的科学突破。科学家们发现,鸟类的大脑结构里蕴含着智慧的蓝图。
当然,我这句总结肯定是不够科学的。毕竟 “智慧” 这个词,我们就很难给出一个科学严谨的定义。但是,不知道你有没有这么一个感觉,长期以来,关于鸟类的脑袋里到底装着什么,我们人类其实是很困惑的。
这个困惑来自一个尖锐的对比:
一方面,我们知道有些鸟类其实是非常聪明的。
从密涅瓦的猫头鹰到填海的精卫,甚至是《伊索寓言》里喝水的乌鸦,东西方人类的祖先都不约而同地认可鸟类的智慧。
科学研究也证明了这一点。不少鸟类可以熟练使用工具,即便把筑巢行为排除在外,也有不少鸟类能够叼起小树枝帮它们够到远处的食物,有些乌鸦甚至能拼接几段短树枝,制造一个更长的棍子去够食物。
还有,如果把喜鹊放到一面镜子前,它们居然能够顺利地认出镜子里出现的是自己而不是另一只鸟。这说明它们可能具备非常高级的 “自我意识”。要知道,整个地球上也只有十种左右的生物具有这种能力,而且都是一般意义上特别智慧的生物,比如我们人类、黑猩猩、红毛猩猩、海豚等。就连人类,也是差不多到了一岁半两岁之后才逐渐具备这个能力的。
而另一方面,我们又长期有意无意地忽略了鸟类的这种智慧能力。
我猜,这主要是因为我们实在无法解释这种能力。因为智慧这件事本身含义太丰富、太难定义,而且很多时候又特别主观,所以我们对它的研究往往只能局限在人类当中。
如果真要推广到动物世界,我们一般的策略是推己及人——根据人类大脑的各种特征,按图索骥到动物大脑里找相似,然后再根据这些相似反过来推测为什么动物也具备人类的某种智慧能力,以及为什么某种能力在动物之间有差别。
这么说可能有点抽象,我来打个比方。
比如我们认为,人类的高级脑功能都是由大脑皮层,更准确地说应该叫 “新皮层” 来完成的。人类大脑长得有点像一个大号的核桃,表面布满了各种褶皱。皮层就是这颗核桃外面那层薄薄的有颜色的膜,它的厚度只有几毫米,从外到内还可以继续分成6层。
与此同时,从前到后,从左到右,大脑皮层还能分成一个个垂直的、直径在几百微米尺度的结构单元,叫作 “功能柱”。每个功能柱的直径大概是几百微米,包含了完整的大脑皮层的6层。而在功能柱之间,神经细胞还能形成横向的联系。
这么看的话,薄薄的一张大脑皮层,可以看成是由数以亿计的功能柱密密麻麻排列在一起而形成的结构。有点像一大堆粉笔密密麻麻装在一个盒子里,然后每一支粉笔还都有六截儿,有六种不同的颜色。
请注意,在所有哺乳动物当中,包括人类在内,大脑皮层的组织结构都是非常类似的,都是六层,都是密密麻麻的功能柱。这样一来,想要推己及人地做研究就比较方便了。
举个例子。我们知道,视觉功能是在大脑里一个叫作“视觉皮层”的区域完成的,这个区域在整个大脑的后面,后脑勺那个地方。所以,如果要在哺乳动物里研究视觉的信息处理,我们就会关注动物大脑的类似区域。然后我们就会发现,不同动物的视觉信息处理有很多共性。
这种纵向和横向的组织方式保证了视觉皮层能对视觉信息进行充分和精细的处理,最终在大脑中呈现出复杂生动的视觉图像。
同时,我们也会研究人和动物的视觉皮层有什么区别,比如尺寸不一样、皮层的褶皱密度不一样、发育过程不一样等,并且从这些差异里推测为什么人类和动物的视觉能力不同。
大致就是这么一个研究路线。
但是,这套方法论对于鸟类是失效的。因为虽然鸟类能够完成很多复杂的任务,表现出高超的智慧,但是鸟类的大脑结构和人类大脑完全不一样。
之前人们普遍认为,鸟类大脑的结构完全不同,根本就没有哺乳动物的大脑皮层。说得更形象一点,打开鸟类的大脑,我们看到的不是六色粉笔密密麻麻排列在一起,而更像是一个一个小乒乓球松散地堆在一起。这样一来,想要解释鸟类的智慧就变得困难了。
但是,这个难题在2020年得到了初步的解决。
2020年9月25日,德国鲁尔大学的科学家们在《科学》杂志发表了一篇论文 [1] 。他们把鸽子和猫头鹰的大脑切成薄片,在显微镜下仔细追踪神经纤维的伸展方向。结果发现,至少在鸟类大脑的某些核心区域,神经细胞的组织结构其实和哺乳动物的大脑皮层没啥区别,也是横向可以分成几层,纵向可以分成一个个的圆柱体。
当然,如果你仔细看,仍然会发现,鸟类大脑的组织结构和哺乳动物不太一样,比如到底哪一层和哪一层的神经细胞纵向产生联系,比如功能柱之间如何传递信息。但无论如何,至少从大脑的基本组织原则来说,我们可以说,人类和鸟类没什么区别。
顺便说一句,大概是有意安排的结果,同一期《科学》杂志还发表了一篇讨论乌鸦的论文 [2] 。来自德国图宾根大学的科学家们成功训练两只1岁的乌鸦完成了一个很好玩也很烧脑的任务。
为了完成任务,乌鸦们需要紧盯显示屏,在屏幕上出现一个红色或者蓝色色块之后,做出合适的动作才能得到食物的奖励。其实,如果仅仅是蓝色转头、红色不转头这样的简单反应,倒是不难,就是一个简单的学习过程罢了,即便是果蝇这样的小昆虫也能完成。
但是,科学家们设计了一个挑战:在红蓝色块出现之前2.5秒,有时候屏幕上会快速闪过一个非常浅的灰色色块。如果灰色色块出现,乌鸦们需要做的动作就彻底被颠倒过来了——本来是蓝色转头、红色不转,现在变成红色转头、蓝色不转。也就是说,在根据红色蓝色信号做出反应的时候,乌鸦们还必须考虑整个事情的“大背景”。
这个任务乌鸦们完成得非常出色,几乎可以做到100%的准确率。在很多科学家看来,这个发现意味着,乌鸦具备某种复杂的思考能力,而不仅仅是对一个外界刺激机械做出反应。
这两个发现意味着什么呢?
我觉得,一个特别重要的提示是,也许刚刚咱们描述的大脑组织方式,也就是多色粉笔整齐排列这个方式,可能是形成大脑复杂功能、形成智慧最好的方式。
在进化历史上,鸟类和哺乳类已经分开生活超过3亿年了,它们的共同祖先也许是一种不那么聪明的爬行类动物。也就是说,它们各自的大脑结构和复杂智慧,都是分别独立发展出来的。跨越3亿年的时光,地球上最聪明的两大类生物,最后殊途同归,选择了同样一种大脑组织结构来承载智慧。这也许就说明,这种组织结构是最容易产生智慧甚至是唯一能产生智慧的。
既然如此,这个被进化两次选中的结构也许对于人类设计人工智能算法或者制造类似人脑的计算机,都有强烈的提示作用。
2.
RNA药物时代开始
2020年12月11日,一款治疗高血脂的新药inclisiran在欧洲获批上市,在美国上市应该也近在眼前 [3] 。这款药物最早是由美国阿里拉姆(Alnylam)公司设计的,之后诺华制药几经辗转,在2019年获得了这款药物的开发权,并最终在2020年底将其推向市场。
按说,降血脂药物本身没什么值得讨论的。大名鼎鼎的他汀类药物,从1980年代开始就扎堆进入市场,让几大制药公司赚得盆满钵满,还诞生过立普妥(阿托伐他汀)这样历史销售额超过1600亿美元的冠军药物。近几年,新一代降脂药物又纷纷问世,主要以大分子抗体药物为主。
但是,inclisiran这个药物仍然值得大书特书。因为它既不是传统的小分子药物,也不是一般意义上的大分子药物,它是一个RNA分子药物。
简单来说,它就是一小段由几十个碱基连接而成的RNA链,经过一些所谓“糖基化”的化学修饰之后做成药物,直接通过皮下注射进入人体。这些RNA分子进入人体的肝脏细胞以后,能够寻找碱基序列恰好互补的RNA分子,和它们结合在一起,然后启动一个名为 “RNA干扰” 的过程,把这些RNA分子降解破坏掉。
我们知道,在人体细胞中,所有的蛋白质合成都需要两个步骤——DNA到RNA的所谓 “转录” 步骤,和RNA到蛋白质的所谓 “翻译” 步骤。RNA是抄写DNA的产品,同时也是蛋白质生产的图纸。要是一个RNA分子被破坏了,它指导生产的那个蛋白质自然也就没有了。而一个特定的重要蛋白质没有了,人体细胞的正常工作就会受到影响。这就是这一类药物治疗疾病的原理。
具体到inclisiran这个药物,它专门针对一个叫作PCSK9的基因搞破坏。这是因为人们在1990年代发现,有一些人的PCSK9基因天生就不能工作,但这些人不光身体健康,血脂还特别低。这个发现就启发大家开发一个专门破坏PCSK9蛋白质工作的药物来降血脂。inclisiran就是这样。
不光如此,在经过化学修饰以后,inclisiran的效用还特别长,打一针管半年。这对于需要长期管理的高血脂患者来说,当然是个好消息。
光说到这,好像这条消息还不够刺激对吧?
别着急。在我看来,inclisiran的上市标志着一个重要的历史性时刻——RNA药物的时代到来了。
传统的人类药物主要是各种小分子化学物质,比如阿斯匹林、二甲双胍、布洛芬。它们一般是通过结合人体细胞中某一个或者几个蛋白质分子,关闭或者开启它们的工作来起到治疗疾病效果。
在上个世纪后半叶,分子生物学的革命为我们带来了大分子药物,特别是抗体药物。这些药物本质上就是一个庞大的抗体分子,同样能够识别和结合人体细胞中的某一个蛋白质并且影响它的功能,从而治疗疾病。比如,治疗乳腺癌的药物赫赛汀(曲妥珠单抗)、癌症免疫药物可瑞达(帕博利珠单抗),都是这样的药物。
拿这次新冠来说,“人民的希望” 瑞德西韦就是小分子药物,特朗普使用的来自美国再生元公司的鸡尾酒药物是抗体药物。
但是,小分子药物也好、抗体药物也好,开发周期都非常长,动辄十几年甚至几十年,耗费的资源也是极其惊人的,消耗十几亿美元都不算什么惊人的数字。因为这些药物从筛选、设计到生产、人体测试,有大量的技术障碍需要克服,也有大量的未知因素会影响它们的安全性和药效。往往一个成功药物背后,有数以百计的失败药物垫底。
而所有这一切,最底层的原因都是:我们从原理上不知道怎么设计一个小分子或者抗体药物,使其能够专一结合我们想要干扰的蛋白质分子。因此,药物开发本质上是一个有点玄学和运气色彩的工作。
但是,RNA药物有可能彻底颠覆药物研发的整个传统逻辑。
RNA药物的设计思想非常直接:人体里有哪个蛋白质作怪让人得病,或者有哪个蛋白质只要消灭了就能治病,就针对哪个蛋白质的RNA序列设计一个能和它互补结合的短RNA链条,注射到人体,就完事儿了。
在上个世纪的分子生物学革命以来,人类对RNA分子的特性掌握得不说面面俱到,至少也是七七八八了。而且,相比小分子药物和抗体药物,RNA分子本身的特性也特别简单,无非就是四种碱基的排列组合。
也就是说,RNA药物的设计思想和开发路线,要比之前的药物开发简单太多了,简直是一种降维打击。
这个道理我打个比方你就明白了。
传统汽油车的开发是有很多玄学和历史经验在里头的,发动机什么尺寸什么材料,活塞设计成什么形状,传动齿轮怎么组合,都需要反复测试。一家新公司底子薄、积累少,想要超过欧美日本的老牌企业是非常难的。但到了电动车时代,所有经验都归零了。因为电动车的动力无非就是电池加上一个电动马达而已,复杂度大大下降。这也是特斯拉能够弯道超车成为汽车行业市值第一的企业,国内新势力造车厂一夜之间纷纷崛起的根本原因。
RNA药物就有这样的潜力。
当然,我也得强调一句,RNA药物不是今年刚刚出现的。Alnylam这家公司之前已经把三款RNA药物推向市场了,inclisiran只能排第四。
但是,前三款药物都是针对罕见遗传疾病的。原因也不奇怪,RNA药物本质上可以看成是基因治疗药物,自然地,一个用途就是消灭出现了先天遗传缺陷的蛋白质分子,治疗罕见遗传病。inclisiran是有史以来第一款针对大众疾病的RNA药物。
未来,这条药物开发路线的潜力几乎是无穷无尽的。还是那句话,人体里哪个蛋白质作怪让人得病,或者哪个蛋白质只要消灭了就能治病,就针对哪个蛋白质的RNA序列设计一个能和它互补结合的短RNA链条,注射到人体,就完事儿了。
未来,人类药物开发甚至有可能做到彻底个性化。
比如,一个人被诊断出了某种癌症,通过基因测序发现,这个病是他身体里某蛋白质发生了基因突变导致的。那么医生就可以直接在电脑上下单,订购一款专门针对这个突变蛋白质的RNA药物,工厂合成出来打一针,患者的癌症可能就迅速治好了。而且整个生产周期,即便在今天的技术水平下,也只需要一两周时间就能完成。
2020年底,德国BioNTech公司和美国Moderna公司开发的两款新冠病毒疫苗已经在美欧各国正式获批上市。
这两款疫苗都是RNA疫苗,开发逻辑和inclisiran有点类似,主体也是一段由四种碱基组合而成的RNA链条。只是,inclisiran是干扰破坏细胞里原有的RNA、阻止蛋白质合成的,而新冠疫苗的RNA则是进入人体细胞,指导蛋白质合成的。它们是参照新冠病毒的基因组序列设计出来的,可以在人体细胞里生产新冠病毒表面刺突蛋白的一部分,释放到血液中,供人体免疫系统识别和捕捉,从而形成对新冠病毒的免疫记忆。
根据上面的讨论,我想你现在也能理解,为什么在众多疫苗开发路线中,RNA疫苗能够率先撞线,而且可以保证每年十几亿剂的天量产能了。
相比传统疫苗,RNA疫苗的设计开发步骤大大简化,基本可以说,只要有病毒的基因组序列就可以开始疫苗设计。后续的生产环节也非常简单,无非就是在实验室里合成一段一段的RNA嘛。RNA疫苗还有一个巨大优势,就是如果病毒出现了重大变异,原来的疫苗失效,也可以迅速重新设计和生产。
当然了,这是有史以来RNA疫苗第一次正式上市,并投入大规模应用,确实还需要一些时间检验它的安全性和有效性。
但和我刚刚对inclisiran的评论类似,如果这次新冠RNA疫苗能够取得成功,那它的意义将远远超过新冠肺炎这一种疾病。人类的整个疫苗开发体系,都将会有一次革命性的升级。
从这个角度说,国产新冠灭活疫苗上市的消息当然非常值得我们高兴,但是着眼于未来,RNA疫苗(也包括可能出现的DNA疫苗)这条技术路线是我们一定要努力去掌握的。
3.
人类相貌的基因大数据分析
讲完了前面两个重量级的研究突破,还有个饭后甜点我想稍微聊一聊。
人类的很多生物学特征,比如身高、头发颜色、智商高低、是不是内向、甚至能不能上大学、会不会暴力犯罪、是不是容易得糖尿病,都在很大程度上受到基因差异的影响。
这个结论本身是很可靠的,科学家们通过分析同卵双胞胎之间的异同,就可以推测个八九不离十。但真正困难的地方在于,有没有可能找到具体是哪些基因差异,通过什么方式影响了什么人类特性。
要是这个问题能被回答,人类将真正进入一个个性化时代。我们知道,现在的互联网巨头会根据你的浏览历史、点击记录来给你做个性化推荐,要是把基因差异的信息也包括进去,那算法也许还真能做到比你自己还懂你。
这个东西怎么研究呢?
一个比较常用的研究方法叫作 “全基因组关联性分析”,简称GWAS。简单来说,人和人之间的基因序列差异其实很小,大概只有整个基因组长度的0.5%,这部分差异分散在整个基因组超过1百万个位置上。因此,如果我们能够测定每个人在这些位置上的基因差异,然后收集每个人的生物学特征,两套数据之间做一个关联分析,就能知道哪些基因差异会在多大程度上影响什么人类特征。
这个逻辑说起来简单,但真做起来有两个技术障碍。
第一个障碍当然是要采集足够多人的基因差异信息。
这个问题现在已经被比较好的解决了,特别是英国和美国的几个机构已经进行了数百万人的人类基因差异检测。
但第二个障碍解决起来要更困难一些,就是要针对这些人采集到足够精确和详细的特征。
有些特征是比较容易采集的,比如身高、体重、血型、疾病历史等,数据库里可能本来就有。有些特征定义起来简单,发个问卷也就解决了,比如有没有同性性行为、什么政治倾向、什么教育水平。但更多的指标是模糊不清,需要重新定义才能开始计算的。比如,一个人到底是什么性格、长相如何、适合什么工作、适合什么配偶、抗风险能力如何、喜欢看什么视频、喜欢点什么外卖……所有这些都不是非黑即白、能用几个字描述的,需要一个系统的方法加以分析和提取。
就在刚刚过去的这个月,有篇发表在《自然·遗传学》上的论文做了一个特别有趣的示范 [4] 。来自美国宾州州立大学的科学家们用刚刚咱们说的思路,研究了人类长相的遗传学。
他们的研究方法是很有普适性的。因为长相和刚才咱们说的复杂特征一样,不是三言两语就能描述清楚的,于是这些科学家就收集了来自美国和英国的8246个人的3D人脸图像,每张脸都用7000多个点来描述。这样一来,就把一张张生动的人脸简化成了7000多个点的位置组合。
可想而知,这7000多个点的位置彼此之间是有联系的。人脸不管再变,结构上总是有一些基本规律的对吧?根据这些关联,科学家又把对人脸的描述简化成了63个变量的组合。到这里,对人类相貌的评价就变成了一个纯粹的数学问题。
之后,科学家们就把这8000多人的基因差异和他们的相貌差异对应起来,研究哪些相貌差异是哪些基因差异决定的。他们还真找到了200多个这样的基因差异,有的影响嘴角的弧度,有的影响额头的形状,有的影响鼻子挺不挺……
当然,如果你非要问我这项研究有什么用,我觉得大概率也并没有什么用。一个人的相貌大概率是基因决定的,这一点根本不奇怪。就算你知道哪些基因差异能够如何影响相貌,也不可能用来整容,毕竟相貌是从小到大发育而成的,哪怕你现在做基因编辑也改不了了。
但是我觉得,这项研究为未来一定会到来的基因大数据时代做了一个很好的注脚。
利用基因差异研究人类疾病已经是非常常规的操作了。现在市场上大量的基因检测产品,不管靠谱的还是不靠谱的,都是这么发展出来的。但是,利用基因差异研究正常人的复杂特性就做得比较少了。从相貌出发,我想,更多的人类复杂特性都能被精确描述和研究。别忘了,互联网平台已经掌握了很多人类的复杂行为特征,如果和现成的基因数据结合起来,也许突破是指日可待的。
注意,一旦这种研究有了重要发现,天然就能和互联网时代特别重视的精准投放、千人千面、个性化推荐结合起来。
这个情景,仔细想想还是有点可怕的。也许有一天,互联网平台掌握了一个人的基因信息和一个人的行为习惯信息,两相比较和结合之后,就能对一个人的性格、行为、爱好、习惯、健康情况、教育水平做出无比精准的推断,然后为他推送最有针对性的广告、产品和服务。而且,方式和时机还能选得恰到好处,让你根本无法抗拒。
我觉得,这一天的到来大概是无可避免的。毕竟今天我们已经在通过上交我们的行为数据,换取精准便利的互联网服务。如果上交基因数据能进一步提高服务质量,大多数人大概不会抗拒。
但是,考虑到基因数据对每个人来说都是唯一的、不可改变的、无法消除的,基因数据未来将会怎样处理,如何监管,也会更加谨慎。
我想,在这一天到来之前,人类应该有足够的智慧发展出一整套系统来处理互联网上的数据所有权、使用权、隐私权和利益分配问题。考虑到基因科学的快速发展,这套机制的研究大概还需要更快一点、更有前瞻性一点才好。