一个著名的“基因黑客”创建了可能是迄今为止最大的家谱。
图片来源:Andrew Bret Wallis/Getty Images
利用来自在线家谱网站的数据,一个著名的“基因黑客”创建了可能是迄今为止最大的家谱。这一团队如今计划利用这些数据——包括一个能够回溯到15世纪的由1300万名个体构成的超级谱系——分析复杂基因特质的遗传,例如寿命和面部特征。
除了为全世界最大的家庭团聚提供邀请名单之外,由计算生物学家Yaniv Erlich在于波士顿召开的美国人类遗传学会年会上公布的这一研究成果,还能够为了解基因对于某种特质的贡献到达了何种程度提供一件新工具。其他研究人员将能够使用这一谱系,但Erlich及其马萨诸塞州剑桥市白头研究所的团队为了保护隐私,已将这些数据的“名字”抹去。
并未参与该项研究的芝加哥大学人类遗传学家Nancy Cox指出,家谱本身的结构能够提供关于人口统计学和人口扩张的有趣信息。但她认为,更有趣的可能性是,随着更多的人拥有了自己的基因组序列并将这些信息存放于公共数据库,这样的数据有朝一日能够与医疗信息或DNA序列数据联系起来。
“对于这些谱系能够告诉我们什么,科学家事实上刚刚知道些皮毛。”Cox说。
家谱能够提供有关基因遗传的线索。例如,通过将个体与家谱中的远亲进行比较,一个给定特质(例如生育能力)的频率变化便可以显示出这一特质在多大程度上起源于遗传学。它还能够提供其他一些线索,例如一些特质是由具有较大影响的较少基因控制,还是由具有较小影响的许多基因所掌握。
然而Erlich在此次会议上表示,仅仅是几千人的家谱也需要数年的时间用于组装谱系数据。在过去,研究人员精心从教堂记录和个人志愿者那里收集这些数据。而Erlich及其研究团队决定从家谱网站geni.com上超过4300万个个人档案中采集数据,从而使这一过程合理化。这些档案通常包括生卒日期,以及居所,偶尔会有用户上传的照片。
该研究团队将规模从几千人到1300万人的数据导入家谱。Erlich表示,之前可供遗传研究使用的谱系最好的也就包含有几十万个家庭成员。
盐湖城犹他大学的遗传学家Lisa Cannon-Albright敦促要谨慎使用自我报告的谱系数据。她曾广泛地参与一家关联了一些医疗信息的大型犹他州谱系数据库的工作。“每个人都想将自己的家庭回溯至皇室。”她说,“对于那些大型的谱系,我们只是不相信它们能够超越某一个时间节点。”Cannon-Albright说,她将自己的数据从1500年切断。
Cannon-Albright强调,最终,一个谱系的价值在于你能够利用到的信息。在本次会议上,Cannon-Albright提交的一份来自犹他数据库的数据表明,只能由父亲传给儿子的Y染色体能够携带前列腺癌的危险因素。她最近还发起了一个新的项目,将谱系数据与来自联邦退伍军人健康管理局的医疗记录联系起来。
迄今为止,尚不清楚由Erlich及其团队建立的巨大家谱到底能产生多大的作用。一些科学家在此次会议上对该项目表示出极大的热情,但苦于无法拿出一个使用这些数据的特定试验。
但冰岛雷克雅未克市遗传学公司deCODE的创始人Kári Stefánsson却坚信家谱分析在未来的遗传学研究中将扮演一个重要的角色。“人们将越来越愿意贡献他们的数据和医疗记录。”他说,“这是一个令人兴奋的可能性。”