用户名:  密码:   
网站首页即时通讯活动公告最新消息科技前沿学人动向两岸三地人在海外历届活动关于我们联系我们申请加入
栏目导航 — 美国华裔教授专家网科技动向学人动向
关键字  范围   
 
AI+组合化学,李博文团队与Vector 人工智能研究院开发AGILE平台,高效实现新型LNP的定制开发,大幅增速核酸药物商业化
来源:RNAScript | 2023/6/10 7:49:10 | 浏览:1896 | 评论:0

可电离脂质纳米颗粒(LNP)在mRNA药物的临床应用中得到了广泛使用,药物的临床应用中得到了广泛验证,特别是在SARS-CoV-2 mRNA疫苗开发中大放异彩。由于mRNA疗法所具有的多功能性,使其在后疫情时代的应用潜力不断被发掘,肿瘤免疫疗法、蛋白质替代疗法、细胞工程及基因编辑等重要领域越来越多的采用到mRNA技术。不过,在这些不同组织、不同机制的多样化应用场景之下,mRNA药物面对的第一道难关便是对其递送系统的挑战。如何增加递送效率、提高组织靶向性、保证递送安全性,无一不在对递送系统的开发和优化提出更高的挑战。

当然,目前已有诸多研究性论文提供了一些关于如何合理设计可电离脂质以提高LNP递送mRNA性能的见解,但这些方法通常只涵盖了有限的结构空间,可能忽视了一些有前途的脂质设计。并且,传统的LNP开发过程,劳动密集、成本高昂且效率低下,严重依赖于试错。即使是莫德纳公司,10多年的开发中也仅仅验证了2000多种脂质。

基于此,为了更高效、更有针对性地加速LNP的发现与优化,加拿大核酸疫苗与治疗研究主任(Canada Research Chair),多伦多大学药学院助理教授李博文团队与加拿大Vector 人工智能研究院(Victor Institute for AI)合作开发了AI-Guided Ionizable Lipid Engineering(AGILE)平台,首次利用深度学习和组合化学的协同来探索可离子化脂质分子搜索空间。相关论文近日已于bioRxiv上公开 ,题目为“AGILE Platform:A Deep Learning-Powered Approach to Accelerate LNP Development for mRNA Delivery”[1]。

AGILE平台通过预训练的深度学习神经网络学习大量小分子化合物的结构知识,并利用自我监督的方法学习对脂质结构的辨别和区分。经过微调和高通量筛选,AGILE能够准确识别具有较高mRNA转染效力的新型脂质结构。

简单而言,AGILE简化了可电离脂质的迭代开发,并具有三个重要优势:

1)高效设计和合成组合脂质库,使用深度神经网络进行全面的计算机辅助脂质筛选,以适应多种细胞系。

2)使用AGILE,研究者能够从超过10,000个候选者中快速选择、合成和评估适用于肌肉和免疫细胞中mRNA递送的新型可电离脂质结构。

3)AGILE揭示了细胞特异性的可电离脂质偏好,表明需要不同的尾长和头基团以实现对不同细胞类型的最佳递送。

该研究首次证明AI深度学习在加速和定制化LNP开发方面的潜力,通过把AI与组合化学的优势相结合,AGILE平台可灵活有效地解决临床实践中mRNA递送的复杂需求,从而扩大mRNA疗法的范围和效果,并有望大幅增速核酸药物商业化落地。

AGILE平台

最近,利用多组分反应的组合化学已经被用来实现脂质库的高通量合成。例如,李博文团队曾发表的一个基于Michael加成的的多组分反应系统,被用来生成超过700个可电离脂质的库[2],从而发现了一种特别适合于有效递送mRNA到肺上皮细胞的靶向性脂质。虽然多组分反应的组合化学已经被展示出可以促进新的可电离脂质的合成,但构建和测试一个结构更广泛且数量庞大的脂质库,可能需要数十万种化合物。检验这些化合物在不同的细胞目标中的mRNA转染仍然是一个艰巨、耗时且昂贵的任务。这个挑战因此限制了设计和测试更多样化和创新结构的努力。因此需要新的策略来加快发现和优化可电离脂质,以实现在特定目标细胞中的mRNA理想转染。

推荐阅读:李博文等开发新型LNP载体,吸入后可实现对肺部的高效mRNA递送及基因编辑

本研究通过将深度学习方法与基于组合化学的脂质合成相结合,创造了一个名为AGILE的平台,旨在加速新型可电离脂质的发现。AGILE平台包含一个深度学习算法模型,可以有效地捕捉可电离脂质分子结构的内在特性和化学属性,其实施过程主要通过三个关键阶段:

1)创建虚拟库并进行自我监督模型训练:利用实验库获取实验证据数据,通过有监督的微调提高预训练模型的准确性。采用优化的深度学习算法对候选库中的可电离脂质进行硅谷分析。AGILE平台能够预测可电离脂质在LNP配方中对mRNA的转染能力,并方便特定靶细胞的LNP设计。

AI+组合化学,李博文团队与Vector 人工智能研究院开发AGILE平台,高效实现新型LNP的定制开发,大幅增速核酸药物商业化

图1.AGILE平台设计

a.工作流程示意图;b.应用多组分反应来设计虚拟库;c.合理筛选候选脂质的过程示意图;d.全面分析最终候选脂质的排名与甄选方法

2)AGILE模型预测和优化转染效能:经过整个虚拟库的预训练后,通过有监督的微调对转染效能进行预测和模型的优化。研究人员开发了一种基于一锅法多组分反应的自动高通量合成平台,可以在24小时内合成大批量(1,200种)的可电离脂质。通过该平台,研究人员合成了一批候选脂质,并评估了它们在目标细胞系中的转染潜力。大部分脂质表现出提高的mRNA转染潜力,并且不同脂质之间的效力差异显著。

AI+组合化学,李博文团队与Vector 人工智能研究院开发AGILE平台,高效实现新型LNP的定制开发,大幅增速核酸药物商业化

图2. 高通量脂质合成与筛选平台

a.脂质高通量合成方法示意图;b.组合类脂质库由三种特征组分结构组成;c.用于mRNA包封的LNPs组分示意图;d. 用于脂质合成、LNPs包封及荧光素酶测定的基于液体处理机器人;e. 用于微调的数据描述,该图涉及用于 Fluc mRNA (mLuc) 递送的 1200 个 LNPs 并测量 Hela 细胞中的相对荧光素酶表达;f. 训练集和验证集相对于微调步骤的损失值;g. 基于1200种脂质实验库计算的精密矩阵,预测和实际转染效力分为六个相等的百分比;h.实验文库的UMAP(统一流形近邻插值)图,可视化预测结果 ,根据转染效力着色

3)筛选有效脂质并进行实验验证:利用模型预测的转染效能,研究人员从候选库中筛选出适用于肌肉注射的潜在脂质。通过实验设计方法对优选脂质的LNPs配方进行优化,并与传统的可电离脂质(MC3)进行比较。其中一种名为H9的脂质在肌肉注射后表现出与ALC-0315 (辉瑞/BioNTech的新冠疫苗中使用的可电离脂质)相当的mRNA转染效能,远高于MC3(Alnylam公司的siRNA药物ONPATTRO®中使用的可电离脂)的体内转染能力。研究人员还发现,H9 LNPs有很好的肌肉靶向性,相较于ALC-0315和MC3,极大降低了在肝脏组织中的泄露表达,这一特性有利于降低mRNA疫苗在非靶向组织中表达所引起的潜在安全性风险。这些发现表明AGILE平台能够辅助设计和优化具有高转染效能的可电离脂质,为开发更有效的mRNA递送系统提供了新的可能性。

AI+组合化学,李博文团队与Vector 人工智能研究院开发AGILE平台,高效实现新型LNP的定制开发,大幅增速核酸药物商业化

图3. 使用性能最佳的 mRNA-LNP 进行模型预测和基因编辑潜力验证

(a) 预测分子反式效力的UMAP图;Hela细胞中的(b)头基分类和(c)尾基分类;(d) 验证 Hela 细胞的 15 种脂质候选物;(e) 在优化Hela的H9 LNPs时使用的性能最好的配方参数;(f) 在Hela细胞中转染mFFL LNP;(g)将负载mFluc的LNP肌内(IM)注射到小鼠与IVIS成像示意图;(h,i) 将Fluc-mRNA LNP肌内注射到小鼠体内;(j) IM注射Fluc-mRNA LNP后肝脏的IVIS成像;(k)IM注射后小鼠肝脏Fluc-mRNA LNP的转染;(l)删除STOP盒并激活GFP小鼠报告基因的Cre重组酶示意图;(M)通过IM注射注射Cre-mRNA负载LNP后mTmG小鼠组织学肌肉和肝脏切片中tdTomato和GFP表达的代表性共聚焦显微镜图像和定量

基于AGILE平台开发可用于巨噬细胞

mRNA递送的可电离脂质

为了证明AGILE的灵活性,研究者还将AGILE平台用于开发可用于巨噬细胞mRNA递送的可电离脂质。常规的腺相关病毒载体(AAV)在转染先天免疫细胞方面存在困难,因此非病毒mRNA递送系统变得重要。为了测试AGILE鉴定出的可电离脂质在巨噬细胞中的转染能力,研究团队对1,200种脂质在RAW 264.7细胞(巨噬细胞系)中进行了测试。结果显示,不同细胞系的转染效力差异很大,即使相同批次的脂质在不同细胞系中的效果也完全不同。

通过对RAW 264.7细胞特定数据集进行微调后,团队再次进行了模型预测,并使用UMAP可视化了对RAW 264.7细胞的预测转染效力。根据预测效力和其他规则,团队选择了前15个候选物,并在RAW 264.7细胞中进行了初步筛选。结果显示,其中11个脂质的转染效力较MC3有所提高。在进一步实验和配方优化后,R6被选为效果最好的脂质,并在RAW 264.7和Hela细胞中进行了性能比较。结果显示,相比Hela细胞,R6在RAW 264.7细胞中具有更高的转染效力,而H9的转染效力在Hela细胞中增加了2倍以上。这表明为特定细胞类型和组织定制LNPs的重要性。

 

AI+组合化学,李博文团队与Vector 人工智能研究院开发AGILE平台,高效实现新型LNP的定制开发,大幅增速核酸药物商业化

图4. 基于AGILE平台开发可用于巨噬细胞mRNA递送的可电离脂质

(a) 预测分子反式效力的UMAP图;(b) RAW 5.3 中的前 2 个头基组分布和 (c) 前 264 个和后 7 个尾基组合分布;(d) 验证 RAW 15.264 (n=7) 的 2 种候选脂质;(e) 在RAW 6.264中优化R7 LNP时采用的性能最佳的配方参数;(f)比较不同LNP在RAW 264.7细胞中的Fluc-mRNA转染效力(n = 6);(g) 比较LNP(H9 LNPs和R6 LNP)在Hela细胞中的功效(n = 3);(h) 用 MC264 LNP、H7 LNP 和 H3 LNP 处理后 RAW 9.6 上 GFP 阳性细胞的百分比, RAW 264.7 细胞流式细胞术数据的定量分析(n = 3);(i)由GFP-mRNA LNP转染的RAW 264.7细胞的共聚焦图像,绿色代表GFP,蓝色代表细胞核(DAPI)

AGILE 深度学习模型的解释

AGILE通过两种机制阐明其模型的解释:(1)使用基于梯度的模型解释方法识别有影响力的分子描述符,(2)确定所选脂质中的关键特征。我们将基于梯度的解释方法应用于813个选择的分子描述符,评估其对模型预测的贡献。如图5a和5b所示,我们可视化了对Hela细胞系和RAW 264.7细胞系的前20个显著描述符。

对于Hela细胞系,VSA_EState3和SssNH是预测效力中最有影响力的分子特征。VSA_EState3是一种用于量化分子在特定范围内的表面积的电子和空间特性的描述符,而SssNH代表了三级胺,与专家对于头基团带有三级胺的重要性的理解一致。值得注意的是,这些描述符与结构中的酰胺键有很强的关联,这是多组分反应3CR  Markush母核结构中的一个重要连接。这种连接使得各种功能基团可以附着到脂质样物质上,影响着生物系统中这些类似脂质物质的总体电荷和物理化学特性。有趣的是,该模型不倾向于产生酰胺键,这可能是由于酰胺键对脂质的整体物理化学特性(如pKa)的影响。

在RAW 264.7中,SpDiam_Dzi和VR3_D被确定为最有影响力的描述符(图5b)。VSA_EState出现为第三个最有影响力的描述符,说明其在决定对RAW 264.7的传递效力中起着重要作用,类似于Hela细胞。有趣的是,在Hela细胞中表现较差的头基团(A5、A17)在RAW 264.7中表现出较好的效果,SsNH2和NsNH2仍然是最关键的特征。在Hela细胞中,环化头基团在转染效力方面优于线性头基团。然而,在RAW 264.7细胞中观察到相反的趋势。这些观察结果强调了为不同的细胞靶向设计具体的LNPs的必要性。随后的分析阐明了与R2的碳链长度在预测转染效力中的重要性,特别是对于RAW 264.7细胞而言。图5g展示了基于R2的碳链长度的预测效力的分布,其中的脂质来自效果最好的头基团A5。从10到12的R2碳链长度增加时,预测效力明显提高。有趣的是,进一步延长R2的长度反而对预测效力产生负面影响。此外,R2较短的碳链长度(C≤12)与预测效力的变异性相比较小。这种趋势不仅限于效果最好的头基团,也适用于其他头基团(附图S14),皮尔逊相关系数为-0.58。对候选物集合中所有脂质的分布图进行检查(图5h)发现,R2的碳链长度与预测效力之间存在类似的模式,尽管皮尔逊相关系数略为降低(-0.39)。值得注意的是,在较短的R2链长度(C≤12)中变异性较小。有趣的是,碳链长度的重要性在两个不同的尾部之间存在非对称性。如图5i所示,与R2碳链长度相比,R3碳链长度与预测效力的相关性明显较低(-0.15 vs -0.39)。这些关于尾部长度的发现特定适用于在RAW 264.7中的转染。如图5j所示,在Hela细胞系中,这种模式不太明确,皮尔逊相关系数为-0.22。综上所述,这些见解对于指导专门为RAW 264.7定制的LNPs的设计具有重要意义。

AI+组合化学,李博文团队与Vector 人工智能研究院开发AGILE平台,高效实现新型LNP的定制开发,大幅增速核酸药物商业化

图5. 模型特征说明及查找

(a,b) 该模型鉴定的前 20 个最重要的分子描述符分别针对 Hela 和 RAW 264.7 细胞系进行了微调;(c,d)分别是H9和R6+结构的3D可视化,突出显示了突出区域;(e, f)Hela和RAW 264.7细胞系中15个最优脂质候选物的相似性网络,每个候选细胞与其四个最近的邻居相关联;(g) 小提琴图,说明了不同 R2 尾长度上预测效力的分布,来自 RAW 264.7 细胞系表现最佳的头部组 A5 的 LNP;(h) 与(g)类似的小提琴图,但侧重于整个LNP候选集;(i) 与(h)类似的小提琴图,但侧重于R3尾部长度;(j)与(h)类似的小提琴图,但侧重于Hela细胞系的整个LNP候选集;(k, l)该模型确定的是针对Hela 和 RAW 264.7 细胞系进行了微调的,对于每个头基组的前 2 个最重要的分子描述符

总结

在这项研究中,作者介绍了AGILE平台,该平台经过训练使用综合的虚拟库和实验室库,能够在数据有限的情况下预测不同细胞系的LNP效力。通过在训练过程中接触大量的分子描述符,AGILE中的深度学习组件获得了对LNP设计复杂动态的基本洞察力,以完全自我监督的方式结合了电子、立体特性和碳链长度等特征。

其中一个重要发现是分子描述符VSA_EState3和SssNH对Hela细胞系的效力预测具有影响力。这些描述符分别表示分子表面积的电子和立体特性以及三级胺,与当前对脂质设计的专业理解相吻合。这些分子特性与其对传递效力的影响之间的联系,展示了深度学习在阐明微妙分子特征方面的能力。专业知识和模型解释之间的这种关联验证了AGILE的预测能力的有效性,并为未来对其他细胞系的研究奠定了基础。相反,对于RAW 264.7细胞系,SpDiam_Dzi和VR3_D被确定为最具影响力的描述符,突显了不同细胞类型所偏好的不同物理化学特性。这些影响力描述符的差异强调了需要针对特定细胞类型进行LNP设计的必要性,强调了将一种尺寸适应所有细胞系的方法在LNP设计中的局限性。

对于Hela细胞系中最有效的LNP,分子解释进一步证实了头基团的重要性,这是在LNP设计中已经广泛存在的知识。另一方面,对于RAW 264.7,高效的LNPs共享相同的尾部结构,暗示了尾部结构在巨噬细胞转染中的潜在作用。这些尾部结构是不可降解的,这也意味着脂质稳定性在LNP效力中的重要性。这样的发现,如果没有AGILE,将是难以获得的,它阐明了为个体细胞类型定制LNP所涉及的内在复杂性。

此外,作者们还发现碳链长度对转染效力具有重要影响,特别是对于RAW 264.7。这个结果引起了人们对链长度中的微妙平衡的关注,以实现最佳的转染效果,进一步增加了LNP设计过程的复杂性。对于不同尾部(R2和R3)的碳链长度与预测效力之间的相关性的变异,以及两个尾部之间的不对称重要性,进一步强调了LNP设计是一个涉及许多因素和依赖关系的微妙过程。

此外,我们发现AGILE的预测能力随着对更大和更多样化数据集的训练而不断提高,这与自然语言理解、计算机视觉和数学问题解决等领域的观察结果相一致。在训练过程中接触广泛数据集似乎也增强了AGILE对LNP设计中涉及的各种因素和依赖关系的鲁棒性。这些发现表明,随着我们不断扩大数据集,未来在更大规模上预训练的模型可能在任务特定数据越来越有限的难题中产生更精确的预测。例如,除了使用AGILE来发现用于mRNA传递的LNP以前未探索的组织和细胞类型,还有机会将细胞培养中的体外转染数据扩展到动物研究的体内数据和人类组织的体外数据。这有可能提高AGILE发现的LNP在人体内mRNA传递中的效率和可靠性,从而支持mRNA LNP产品的临床开发。此外,结合更多多样化的组合化学方法和全面的实验室数据,还可以进一步增强AGILE模型训练的化学多样性。这可以使AGILE能够识别具有特定功能的可电离脂质,例如对mRNA疫苗传递和癌症免疫疗法至关重要的免疫刺激性性。此外,AGILE可以采用最新的生成模型,如扩散网络,为特定应用生成全新的脂质分子。

总体而言,AGILE平台充分发挥了组合化学和深度学习的优势,阐明了LNP设计的动态复杂性,并使这些见解适用于众多下游应用。AGILE能够识别和解释有影响力的分子描述符,代表了纳米医学领域,特别是脂质设计方面的重大进步。它对多种细胞系中LNPs的转染效力的预测能力,包括具有挑战性的巨噬细胞,它不仅为改进mRNA的递送,而且在指导CAR细胞疗法和其他免疫治疗策略上带来了希望。它有可能加速强效LNP的发现,并为mRNA量身定制的可电离脂质的设计促进递送,从而为实现mRNA基因治疗的持续发展和在临床环境中的应用做出重大贡献。

参考资料

[1] Yue Xu, Shihao Ma, Haotian Cui, et al. AGILE Platform:A Deep Learning-Powered Approach to Accelerate LNP Development for mRNA Delivery. bioRxiv 2023.06.01.543345; doi:https://doi.org/10.1101/2023.06.01.543345

[2]Li B, Manan RS, Liang SQ, et al. Combinatorial design of nanoparticles for pulmonary mRNA delivery and genome editing. Nat Biotechnol. 2023;10.1038/s41587-023-01679-x.

相关栏目:『学人动向
10余年,辗转多地读博,终于迎来高光时刻!她用2张图,发了一篇Nature! 2024-04-28 [11]
一个历史学教授的感悟是:我们所说的历史,多半靠不住 2024-04-28 [16]
托马斯·奥格登:对崩溃的恐惧和没有活过的人生(Fear of Breakdown and the Unlived Life) 2024-04-26 [84]
海伦·文德勒逝世丨批评家是如何炼成的? 2024-04-26 [73]
丹尼特:哲学是认知科学的一部分 2024-04-26 [76]
许倬云:一百年左右的时间,逐渐一步步往下走,真是吊诡的现象 2024-04-24 [145]
杨祖保教授:在跌宕的分离世界中提纯的高科技 2024-04-24 [104]
沈志华教授应邀主讲“对冷战起源的再思考” 2024-04-24 [154]
康德诞辰三百年|苏珊·奈曼:为什么这个世界仍需要伊曼纽尔·康德 2024-04-23 [119]
两个老头儿写的神奇算法,统治了全世界! 2024-04-23 [180]
相关栏目更多文章
最新图文:
:天安门广场喜迎“十一”花团锦簇的美丽景象 马亮:做院长就能够发更多论文?论文发表是不是一场“权力的游戏”? :印裔人才在美碾压华裔:我们可以从印度教育中学到什么? :北京452万人将从北京迁至雄安(附部分央企名单) :《2019全球肿瘤趋势报告》 :阿尔茨海默病预防与干预核心讯息图解 :引力波天文台或有助搜寻暗物质粒子 :Sail Through the Mist - SoCal Innovation Forum 2019(10/5)
更多最新图文
更多《即时通讯》>>
 
打印本文章
 
您的名字:
电子邮件:
留言内容:
注意: 留言内容不要超过4000字,否则会被截断。
未 审 核:  是
  
关于我们联系我们申请加入后台管理设为主页加入收藏
美国华裔教授专家网版权所有,谢绝拷贝。如欲选登或发表,请与美国华裔教授专家网联系。
Copyright © 2024 ScholarsUpdate.com. All Rights Reserved.