洛斯阿拉莫斯国家实验室提出基因测序数据分类新标准 - 生物医学 - 科技动向

洛斯阿拉莫斯国家实验室提出基因测序数据分类新标准

作者：冯卫东｜ 2009/11/13 15:17:36 ｜浏览：3723 ｜评论：0

　　最近，美国洛斯阿拉莫斯国家实验室（LANL）的一个遗传学小组和一国际财团联合提出了一套旨在阐明可公开获取的基因测序数据信息的质量标准。新标准最终可使遗传研究人员开发出更有效的疫苗，或有助于公共健康部门或安全人员更迅速地应对潜在的公共卫生突发事件。

　　在最新一期的《科学》杂志上，LANL遗传学家帕特里克•钱恩和他的同事提出了6个基因组测序数据标签，可将基因测序数据按其完整性、准确性以及由此带来的可靠性进行归类。这些标签可在公共数据库中获取，而目前使用的标签仅为两个。此项成果的重要性在于，研究人员必须每天使用这样的数据，以对未知遗传数据和已知生物体的遗传数据进行相互参照，而有了这样的新的分类标准，数据的获取与对比工作的效率将大大提高。

　　每个生物体的细胞内都有DNA，由4个分子构建模块（或称碱基对）组成，碱基对排成特定序列时就可构成基因。这些基因序列可包含对生物体有益或有害的遗传指令。基因组研究人员编目了数以千计的基因数据，并将其放在公众数据库中以供其他研究者使用。然而，由于基因数据的复杂性，公共数据库中的遗传信息范围从粗略到精致一概都有。过去，这些基因数据常被归类为“草图”和“成品”两大类，给基因数据的准确性留下了太多的不确定性。

　　钱恩表示，在过去几年里，基因测序技术已取得重大进步，公众可获得的基因数据已呈爆炸性增长，每天产生的碱基对序列数据量要比过去几年产生的数据量还要多几十亿次。不同的测序技术具有不同的精确度。一个序列中的高度不确定性可能会引导研究人员走向一条耗时长达一年甚至数年的错误道路。因此，有必要建立一个标准，为研究人员提供对遗传测序数据质量的明确评估。

　　钱恩联合了大大小小的数个基因组测序中心，如美国能源部联合基因组研究所、桑格研究所、人类微生物群系项目Jumpstart联盟测序中心、密歇根州立大学以及安大略省癌症研究所等，共同提议将现有的测序数据分类从两大类充实为6大类。这6个标准涵盖了从代表公众提交最低要求的“标准草图序列”到代表最高标准的“完成序列”，而“完成序列”的验收标准是每10万个碱基对中最多只能包含一个错误。

　　LANL基因科学小组负责人、联合基因组研究所LANL研究中心主任克里斯•戴特表示，该项研究的目的是为了让所有主要的基因组中心和基因组研究小组都能用上符合其需要的分类基因组测序数据。而为了尽可能保证基因组序列的完整性，一些较小的研究中心也可采用这个分类等级来建立和提交其研究成果，以帮助其他科学家了解既已完成的工作。（冯卫东）

相关栏目：『生物医学』

斯坦福大学：如何开始冥想? （5分钟方法、神经科学原理）	2026-06-17	[166]
45%缓解率、32个月生存期、70%客观缓解——希望之城携硬核数据亮相2026 ASCO	2026-05-28	[681]
为什么时隔6年，才公布新冠病毒真实死亡2210万？	2026-05-28	[763]
激素如何硬控女性的一生，看完这一篇就明白了	2026-05-20	[993]
里程碑！全球首个体内基因编辑疗法III期研究成功	2026-05-05	[1501]
东京大学与理研开发出细胞与组织的高压瞬间冷冻法，有望助力器官保存等再生医疗	2026-05-05	[1439]
马拉松纪录破2小时大关，15年前神预言成真后，人类极限在哪里？	2026-05-05	[1482]
AACR-26 \| 肿瘤界的“超级碗”开战！AACR 2026三大重磅看点：KRAS成突破口，DAC能否取代ADC？	2026-04-19	[2095]
京都大学与广岛大学成功制备出倭黑猩猩和长臂猿的iPS细胞，诱导出 “四肢的起源” 细胞——旨在保护濒危物种与生物多样性	2026-04-19	[1862]
《细胞》：生酮强化CAR-T！科学家发现，生酮诱导的代谢物BHB可以增强CAR-T功能，BHB或可用于辅助免疫治疗丨科学大发现	2026-04-07	[2246]