用户名:  密码:   
网站首页即时通讯活动公告最新消息科技前沿学人动向两岸三地人在海外历届活动关于我们联系我们申请加入
栏目导航 — 美国华裔教授专家网科技动向生物医学
关键字  范围   
 
《Nature子刊》: 22种肿瘤作为原发性肿瘤模型的综合转录组学分析
《Nature子刊》: 22种肿瘤作为原发性肿瘤模型的综合转录组学分析
作者:编译:西西 | 8/14/2019 12:48:18 AM | 浏览:171 | 评论:0

《Nature子刊》: 22种肿瘤作为原发性肿瘤模型的综合转录组学分析

加州大学旧金山分校巴卡尔计算健康科学研究所T. Goldstein1团队于201988日在Nature Communications 上发表了题名为Comprehensive transcriptomic analysis of cell lines as models of primary tumors across 22 tumor types》的文章。该研究利用RNA测序分析TCGACCLE数据库中重叠的22种肿瘤类型,以胰腺癌为例,通过分析细胞系与原发肿瘤间的相关性,找出相关系数最高的细胞系作为研究相应原发肿瘤的体外模型。并推荐了TCGA-110-CL,一个综合性的泛癌细胞系板,该研究为肿瘤研究提供更合适的细胞模型,帮助群众更好了解癌生物学,同时使得体外研究更多转化到临床研究中。

摘要

肿瘤细胞株是肿瘤研究的基石,但既往的研究表明,不是所有的细胞株的模拟原发肿瘤的能力都是相同的。这里,我们借助从The Cancer Genome Atlas(TCGA)The Cancer Cell Line Encyclopedia(CCLE)数据库中获得的转录组结构数据对泛癌做综合性分析,来评价常作为肿瘤模型的22种肿瘤细胞。我们做了相关性分析和基因富集分析比较了细胞株和原发肿瘤的不同点。并且,我们在9种肿瘤中将细胞株划分成肿瘤亚型。我以胰腺癌的分析结果为例,发现最常用的细胞株MIA PaCa-2在转录水平上并不是典型的胰腺癌。最近,我们建议将新的细胞系panelTCGA-110-CL用作泛癌研究。本研究为肿瘤研究者们挑选出最具有代表性的细胞株模型提供资源。

文中重要图片说明


《Nature子刊》: 22种肿瘤作为原发性肿瘤模型的综合转录组学分析

1 | 细胞系和匹配的原发肿瘤样本的泛癌分析。a. 研究设计。转录组测序数据由Google Cloud Pilot下载,转录组测序数据集是CCLETCGA数据库中重叠的22种肿瘤类型数据集。数据在分析过程中标准化,分批更正,调整以提高肿瘤浓度。b. CCLETCGA数据的相关性分析。小提琴图中的每一个样本通过可变度最大的5000个基因对应一个细胞系和一个原发肿瘤样本的的斯皮尔曼相关系数。覆盖在其上的箱式图中,红色的中心线代表中位数,箱子的界限代表上/下四分位数,须状代表1.5倍四分位点内距。c. CCLETCGA中所有肿瘤类型中值相关性热图。


《Nature子刊》: 22种肿瘤作为原发性肿瘤模型的综合转录组学分析

2 | 原发肿瘤样本/细胞株中肿瘤纯度的相关性。a.单边Wilcoxon检验发现15/20种肿瘤类型中,细胞系与高肿瘤纯度的原发肿瘤样本(红色)的相关性显著大于细胞系和低肿瘤纯度的原发肿瘤样本(青绿色)。小提琴图上的P值用相应的符号表示,“ns”表示p > 0.05,一颗星表示p<=0.05,两颗星表示p<=0.01,三颗星表示p<=0.001,四颗星表示p<=0.0001。相关系数中位数由小提琴图中黑色水平线描述。b. STRING分析了本研究中20个肿瘤类型中,95个在原发肿瘤中高表达的基因间的蛋白互作PPI富集p< 1.0e-16)。线的粗细代表相互作用的可信度,只有可信度高的互作才会展示出来。PPI网络在免疫应答通路基因富集错误检出率=5.51e-06)c. 通过分子标签数据库MSigDB)的标记基因对原发肿瘤样本和细胞系的基因富集分析(GSEA)FDR5%的通路标记为NES。蓝色格子表示细胞系的富集,红色格子表示原发肿瘤样本的富集。在研究的肿瘤类型中,和细胞周期发展相关的基因集富集在细胞系,免疫通路富集在原发肿瘤中。d.癌通路中的标记基因的富集分析。在所有肿瘤类型中,基因组不稳定在细胞系中富集,促癌的炎症富集在原发肿瘤中。


《Nature子刊》: 22种肿瘤作为原发性肿瘤模型的综合转录组学分析

3 | 细胞系肿瘤亚型预测。a. 本研究中肿瘤亚型预测方法概览。同其他肿瘤亚型相比(LFC > 1, FDR < 0.01)TCGA中肿瘤被分为训练集(80%来发现在每种肿瘤亚型中该表达的基因。亚型模板就会将细胞系LFC2和在至少2种细胞系种不稳定表达的基因过滤掉,以产生符合亚型模板的细胞系。这些TCGA检验集的亚型20%可以通过最近模板预测方法预测,如果分类的准确度大于80%,这个基因模板将会使用于CCLE细胞系以预测细胞系亚型。b.TCGA 和预测的CCLE细胞系的肿瘤亚型比例,预测准确度高于80%。标记为红色肿瘤类型(BRCA, LUAD, SKCM)说明TCGA亚型和CCLE预测亚型具有显著差异。


《Nature子刊》: 22种肿瘤作为原发性肿瘤模型的综合转录组学分析

4 | 胰腺癌中肿瘤样本和细胞系的相关性分析。a. 通过5000个差异最显著的基因联系原发胰腺癌样本和所有CCLE细胞系斯皮尔曼相关系数的小提琴图。相关系数由细胞系组织来源分隔x。覆盖的箱式图上,红色中心线代表中位数,箱子的界限代表上/下四分位数,须状代表1.5倍四分位点内距IQR。胰腺原发肿瘤样本和细胞系的相关性最强,其次是胆管。b. 胰腺癌细胞系和胰腺癌样本的斯皮尔曼相关系数小提琴图,由细胞系分割开x。由红线标出的相关系数中位数为0.670.49。在重叠的箱式图上,箱子的界限代表上/下四分位数,须状代表1.5IQRc.胰腺癌细胞系x和胰腺原发肿瘤样本y斯皮尔曼相关性热图。Y轴上的颜色条表示TCGA原发肿瘤样本亚型。d. 热图展示了胰基础的经典的胰腺导管腺癌亚型中,腺癌模板基因的表达水平。上面的图表示TCGA胰腺癌检验集,有注释的颜色条表示实际的亚型,预测的亚型以及亚型预测的FDR值。下面的图表示胰腺癌细胞系,有注释的颜色条表示预测的亚型以及亚型预测的FDR值。


《Nature子刊》: 22种肿瘤作为原发性肿瘤模型的综合转录组学分析

5 | TCGA-110-CL:一种改良的整合了TCGACCLE数据的细胞系板。a. NCI-60板中的细胞系和原发肿瘤数据相关性的热图。在NCI-60板和CCLE中只有36和细胞系被分享出来。每种细胞的肿瘤类型在热图的左侧有注释条注明。b. 改良胡的NCI-60热图。改良后的板和原始的NCI-60板有相同数量的细胞系和肿瘤类型,但是和与之匹配的相关系数最高的细胞系才被选中。c. 箱式图表明改良的NCI-板和与之匹配的原发肿瘤样本有更高的相关系数双边Wilcoxon检验p= 7.6e-07)。箱式图的中心线表示中位数,箱子的界限代表上/下四分位数,须状代表1.5倍四分位点内距IQRd. 推荐的TCGA-110-CL板。一个改良的含有5种在22种肿瘤种与原发肿瘤相匹配相关系数最高的细胞系的细胞系板。对于肿瘤亚型的预测,在每种亚型种相关系数最高的亚型被挑选展现在板中。


相关栏目:『生物医学
英国惠康桑格研究所:人体内的微生物与出生方式有关 2019-09-19 [30]
老年人喝水,这几点要格外注意 2019-09-18 [81]
BBC:素食与纯素食者中风风险或许更高 2019-09-18 [53]
牛津大学科学家首次识别出与左撇子相关的基因区域 2019-09-17 [36]
加州理工学院研究发现:信息编码神经元越多 形成记忆越持久 2019-09-11 [122]
医药发展近期动向 2019-09-11 [151]
牛津大学AI技术可提前5年预测心脏病发作风险 2019-09-05 [227]
借助光声断层成像技术让纳米机器人实现药物递送,或进行智能微手术 2019-09-04 [131]
全球近期肠道菌群研究动向 2019-09-04 [318]
FDA:Recently Approved Devices 2019-09-04 [125]
相关栏目更多文章
最新图文:
:UCLA CCS 2019 Fall Quarter Lecture Series Overview :美国参众两院新排华法案强行闯关失败,全体华人须警惕法案卷土重来 谭晶晶:新华综述:美国科技界高度关注中国科技创新进展 :推荐:2019年底前中国高校重要学术论坛(10月 - 12 月) :黄奇帆:今后10年,中国经济将发生5个历史性变化 :为了在外太空住,人们都设计过怎样的房子? :USCI:Making Sense of the Turmoil in Hong Kong(9/26) :小布热津斯基:时刻牢记中美之间相互依存是经济稳定的基石
更多最新图文
更多《即时通讯》>>
 
打印本文章
 
您的名字:
电子邮件:
留言内容:
注意: 留言内容不要超过4000字,否则会被截断。
未 审 核:  是
  
关于我们联系我们申请加入后台管理设为主页加入收藏
美国华裔教授专家网版权所有,谢绝拷贝。如欲选登或发表,请与美国华裔教授专家网联系。
Copyright © 2019 ScholarsUpdate.com. All Rights Reserved.