“它是个非常了不起的工具。我想知道这个系统从头到尾如何工作。” Francisco Mojica并非第一个看见CRISPR的人,但他可能是第一个为它着迷的人。他还记得1992年当他首次瞥见可能引发一场生物技术革命的这个微生物免疫系统的那一天。他在评估地中海嗜盐菌的基因测序数据,注意到14个不寻常的DNA序列,每个有30个碱基。
它们的前后读数大致相同,每次重复35个碱基左右。很快,他看到更多的类似现象。Mojica由此踏入该领域,使重复序列研究成为他在西班牙阿利坎特大学集中研究的对象。
这并不是一个受欢迎的决定。他的实验室连续数年没有收到资助。在会议上,Mojica会抓住机会逮住他能找到的任何大人物追问他们如何看待这种奇怪的小序列重复。“别太关注重复。”他们总是这样警告他。“很多有机体中都有很多重复。我们知道它们已经有几年了,但并不知道它们中的大多数如何工作。”
今天,人们已经了解到更多关于这个团簇的信息,即定期中间短回文的重复序列,这使它获得了CRISPR的名字,并帮助CRISPR-Cas微生物免疫系统毁灭入侵细菌。但是尽管生物医药领域大多数人已经开始敬畏这一系统的运行机制,尤其是一种叫作CRISPR-Cas9的版本,因为它可被用于编辑基因,Mojica和其他微生物学家仍对该系统的一些基础问题以及它如何运行感到困惑。它如何演变?如何影响微生物演化?为什么一些微生物在使用它,而另一些则没有?它是否在基础生物学上拥有一些其他仍待了解的优点?
它来自哪里?
诸如CRISPR-Cas的生物学优势非常明显。原核生物(细菌以及鲜有人知道的被称为古生菌的单细胞生物)面临基因入侵者的不断冲击。病毒数量远超过原核生物,其数量比可达10:1,并且每过两天就会杀死世界上一半的细菌。原核生物还会交换DNA的废弃物:质粒。它们可能是寄生的——通过使宿主的资源逐渐枯竭迫使其自杀,如果宿主在设法驱逐这个“搭便车”的分子。似乎没有什么地方是安全的:从土壤到海洋到地球上最不宜居的荒凉地方,基因入侵者无处不在。
原核生物已经进化出大量武器来应对这些威胁。但这些防御有些迟钝。每个酶都经过规划以识别特定的序列,只有当一个微生物获得争取的基因复本,它才可能得到保护。CRISPR-Cas更具活力。它能以类似于人类抗体在感染后提供长期免疫的方式适应和记住具体的基因入侵者。“当我们一开始听到这种假设,我们认为这种方式对于简单的原核生物可能过于复杂了。”荷兰瓦赫宁根大学微生物学家John van der Oost说。
Mojica和其他人在看到CRISPR回文重复之间的空间中的DNA有时和病毒基因组中的序列相匹配时,他们推断了CRISPR-Cas的功能。从那时起,研究人员开始研制出与CRISPR相关联的特定蛋白,并在细菌和古生菌接触特定病毒或质粒之后,将这些间隔的序列添加到基因组中。来自于那些间隔区的RNA会指导其他Cas蛋白吞掉任何与该序列相匹配的入侵DNA或RNA。
它如何工作?
近年来,很多关于Cas蛋白补充间隔区的分子细节已经得到详细了解,但病毒DNA在化学上近似于宿主DNA。在一个承载着DNA的细胞中,这些蛋白如何知道将哪个DNA添加到CRISPR-Cas记忆中?
这一赌注非常高:如果一个细菌添加了它本身DNA的一个片段,它会因为自动免疫进攻而自杀。立陶宛维尔纽斯大学生化学家Virginijus Siksnys说,“这些酶是一把双刃剑。”
可能是因为细菌和古生菌种群能够吸收一定错误,美国北卡罗莱纳大学微生物学家Rodolphe Barrangou说。如果其他细胞能够在病毒攻击之后蓬勃发展,一些细胞的自杀可能并不重要。
实际上,当病毒潜入细菌生态系统时,通常1000万个细菌中会有一个细菌获得一个自我防御的间隔区。这一几率使得研究是什么驱动间隔区识别非常困难,同时了解为什么其他细胞失败之后另一个细胞会继续下去也很困难。“当它真正发生的时候,很难捕捉到那些细菌。”纽约洛克菲勒大学微生物学家Luciano Marraffini说。
它还可能做什么?
一些间隔区的起源是另一个谜题。到目前为止观测到的低于3%的间隔区与DNA数据库中任何已知的序列相匹配。
这反映了人们对病毒了解得多么少。大多数测序工作集中于那些感染者、牲畜或是庄稼。“我们对细菌的敌人知之甚少,特别是疯狂的古生菌的敌人。”雅典佐治亚大学RNA生物学家Michael Terns说。
还有可能一些间隔区是已经不存在或者变异到不可分辨的病毒的鬼魂。但第三种可能性也是热门的研究领域。研究人员已经发现了CRISPR-Cas系统不仅是阻止基因入群者的案例。在一些细菌中,CRISPR-Cas成分会控制DNA修复、基因表达和生物膜的形成。它们还能决定一个细菌影响其他细菌的能力:嗜肺军团菌会导致退伍军人病症,它们一定拥有Cas蛋白Cas2,从而感染其天然宿主变形虫。“一个主要的问题是有多少生物在防御之外。” 马萨诸塞大学医学院分子生物学家Erik Sontheimer说,“这是未来几年若干只‘靴子’要落地的领域。”
为什么只有一些微生物会用它?
无论CRISPR-Cas有什么其他的功能,很明显一些微生物使用它的几率超过另一些。超过90%的古生菌具有基于CRIPSR的免疫,而经过测序的细菌仅有1/3拥有它,Koonin说。并没有非原核生物,甚至是单细胞生物,被发现存在CRISPR-Cas。
其中一种叫作纳古菌的古生菌就像一种寄生虫一样,寄生在接近沸水中的另一种古生菌身上,并分发了很多与能量制作相关的基因和常规的细胞管家。然而,在其49万DNA字母的说明书的小世界中,纳古菌在CRIPSR-Cas系统上拥有约30个间隔区。“其一大部分基因组致力于CRISPR。”英国圣安德鲁斯大学分子生物学家Malcolm White说,“CRISPR一定非常重要,然而我们并不知道其原因。”
这样的不同表明有一些关键的生态因素支持CRISPR-Cas系统,更重视病毒防御或其他益处,而非细胞自杀的风险,埃克塞特大学彭林校园微生物学家Edze Westra说。极端环境似乎会支持CRISPR-Cas系统,但Westra强调,类似系统的频率在更适宜居住的栖息地的细菌中间也会呈现出一定变化。例如鸟类病原体——鸡毒支原体在其宿主从鸡转变为野雀时会丢掉其CRISPR-Cas装备。然而,为什么该系统在鸡身上有用,但在野雀身上无用,谁也说不清楚,Westra说。
存在多少种CRISPR-Cas类型?
研究人员已经正式分辨出6种不同的CRISPR系统,包含19个亚种。“实际上我们只知道它们中一小部分在发挥作用。”Marraffini说。
解开那些机制可能就会找到利用CRISPR-Cas系统的新生物技术。例如,备受科学家喜爱的CRISPR—Cas9属于II系统,该系统利用转录自间隔区序列的RNA分子导向一种酶,切断入侵病毒或DNA质粒。
系统III是自然界最常见的CRISPR-Cas系统,也是了解最少的系统。到目前为止,证据表明它们不是对DNA或RNA自身作出回应,而是对把DNA转译到RNA内部的过程作出回应。其他的系统可能也会突然出现,尤其是研究人员将他们的寻找目标扩展到培养皿之外时,包括了来自环境DNA样本的基因测序。
对于Mojica来说,探索这种多样性并回答关于CRISPR系统的基本问题比它们引发的革命更吸引人。“我知道它是个非常了不起的工具。它妙极了。它可以被用于治疗疾病。”Mojica说,“但这不是我的事。我想知道这个系统从头到尾如何工作。”