“物理当中我们尚未解的、最重要的部分是暗能量,它大约占整个物质世界的70%,非编码序列在整个人类遗传密码中实际上也是这个数量级的。”
在自然科学中,没有一个领域受到如此强烈的关注。
“物理当中我们尚未解的、最重要的部分是暗能量,它大约占整个物质世界的70%,非编码序列在整个人类遗传密码中实际上也是这个数量级的。”在中国第一届分子诊断技术大会上,生物信息学家、中国科学院院士陈润生说。
他说,大量事实证明,非编码序列具有非常重要的生物学功能,进入21世纪之后,它已成为“热得不能再热”的研究领域。
没有一个领域受到这样的关注
人类有多少个遗传密码?陈润生介绍说,人类大概有30亿个遗传密码。“如果在一页纸上打印3000个密码,100页订一本书,会有1万本书,如果每本书厚1厘米,那么1万本书就是100米高,差不多是40层楼。”
陈润生的工作就是解析、组装和分析这些密码。他说,人们关心的问题是:在这本如此厚重的密码书里,基因有多少?在人类基因组计划开启之前,人们认为在遗传密码表中,大部分都是基因。
当上个世纪90年代开始破译遗传密码时,人们很快认识到,基因在整个人类的遗传密码里,大约占2%至3%。
这些基因也就是编码序列,它编码蛋白质,具有重要的生物学功能。另外大于97%的序列由于不编码蛋白质,被称为非编码序列。
“这就是我多年来研究的领域。”陈润生说,上个世纪,人们对非编码序列是否具有生物学功能充满了疑惑。在所有的疑问当中,最直逼核心的问题是,“你非编码没有任何信息表达出来,我们当然有理由认为你没用”。
生物学家Aluizio Borem,Fabricio R.Santos,David E.Bowen等人撰写的一本颇受欢迎的小册子《生物技术》中说:人类DNA中绝大多数核苷酸序列由不具备编码基因的序列组成。这种DNA的非功能部分因缺乏更为合适的术语,被称作“废物DNA”,对它们的功能和用途还不了解。
陈润生说,进入21世纪之后,非编码领域成为热得不能再热的研究领域。他解释说,由于大量转录子的工作发现,非编码序列其实和编码序列一样——它是转录的,“转录的意思是,它有大量的RNA产物。这些东西进一步印证它有某种功能,没有功能为什么要有产物呢?”
统计表明,从2001年至2010年,Science杂志每年评出自然科学领域的十大科学突破中,至少有6~7次是关于基因组里的非编码相关研究。
“自然科学中,没有一个领域受到这样的关注。”陈润生说。
还未揭开冰山一角
陈润生介绍说,非编码序列所产生的RNA通称为非编码RNA。大量的研究证明,非编码RNA中相当多的一部分具有某种功能。这些有功能的非编码RNA对应的基因组序列被称为非编码基因。
陈润生说,大量的事情证明非编码RNA具有重要的生物学功能,疯牛病就是一个极端的例子。
研究证明,疯牛病的产生是蛋白质内部构象引起的。2003年,Nature杂志发表的一篇文章让陈润生印象颇深。这篇文章称,引起疯牛病的蛋白哪儿有呢?非常简单,核糖核酸酶。这样的蛋白不只是高等的动物例如牛、羊、人身上有,最基本的单细胞生物也有。问题是,谁也没看到单细胞生物得疯牛病。也就是说,当生物低到一定程度,即使有这些所谓疯牛病相关蛋白,但没有任何产生疯牛病的迹象。
文章作者发现,差别不是在蛋白本身,而在于能够引起疯牛病和不能引起疯牛病的细胞里面存在一些非编码RNA。
“这个例子说明,即使在最经典的生物行为中,认为和RNA无关的最后证明还是和它有关。”陈润生说,越来越多的事实证明,它几乎参与生命活动中蛋白质参与的所有过程。
研究表明,非编码RNA也可能引起恶性肿瘤、白血病、非小细胞肺癌。实际上,非编码还和目前国际研究热点表观遗传、干细胞实际上都紧密相关。
有人认为,在对宇宙的认识中,暗能量是最重要的部分,它大约占整个物质世界的70%,但这部分尚未被人类了解。“我们的非编码实际上也是这个数量级的。”陈润生说。
“有人说我们对非编码RNA的功能和基因的了解仅仅是冰山一角,我估计一角是否搞完了都很难说。”陈润生说,它是我们对人类、对生物的遗传密码认识当中非常重要的核心部分。
在应用上,它具有明显的前景,包括临床诊断、治疗,同时具有非常重要的基础研究关联性。
有人开玩笑说,占人类基因组2%至3%的这部分一共有50个诺贝尔奖金获得者,面对未开发的97%~98%,将有多少位诺贝尔奖获得者诞生,则不可估量。