中文

English

利来国际助力人工智能推进酶稳定性快速进化新突破

发布时间:2025-03-02   信息来源:许凡炎

引言

利来国际在人工智能辅助的生物医药技术领域取得了显著突破。我公司创始人兼CTO,上海交通大学生命科学技术学院的杨广宇教授团队,携手上海交通大学自然科学研究院的洪亮教授团队,利用Pro-PRIME蛋白语言大模型和高效模型定向精调,仅用两轮实现了生物医药蛋白的稳定性显著提升,并成功获取了100%的复合突变增益。

利来国际助力人工智能推进酶稳定性快速进化新突破

概述

优化生物医药领域中的酶热稳定性对于蛋白质科学和工业应用至关重要。现有的(半)理性设计和随机诱变方法可以有效设计出多个增强酶热稳定性的突变。但当多个突变组合时,常常会遭遇复杂的上位效应,导致组合突变体完全失效。因此,优化酶通常需要经过多轮设计,以逐步引入每个突变位点,这样的过程非常耗时。

最近,我公司创始人兼CTO的杨广宇教授团队的研究成果《结合多点突变的蛋白质语言模型优化酶的热稳定性》在《mLife》上正式发表,洪亮教授为共同通讯作者。本研究提出了一种人工智能辅助的酶热稳定性工程策略,可以高效组合多种单点突变。在肌酸酶的进化案例中,仅经过两轮设计,便获得了50个具有卓越热稳定性的组合突变体,设计成功率高达100%。

主要内容

在这项研究中,作者采用了一种人工智能辅助的酶热稳定性工程策略,通过少量实验数据来微调Pro-PRIME模型,以预测组合突变体的稳定性和活性。Pro-PRIME模型基于数千万种宿主细菌菌株的最佳生长温度数据进行训练,在设计高温酶方面表现优异。微调所采用的初始数据集包含73个来自肌酸酶的低阶突变体的热稳定性与活性数据。

研究的主要目标是寻找在保持至少60%的相对活性的同时,显著增强热稳定性的突变体。整个研究过程分为四个步骤:(1)收集数据;(2)进行蛋白质语言模型的微调;(3)在组合序列空间中预测所有突变体;(4)验证所选择的突变体。为进一步提升预测精度,研究团队将第一轮的实验结果整合到数据集中,并进行了第二轮的微调与预测。两轮的微调和预测过程仅耗时两周,成功设计了50个组合突变体,实现了100%的热稳定性设计成功率。

其中,最佳突变体13M4包含13个突变位点,其活性基本保持不变,同时Tm值提升了1019°C,58°C下的半衰期增加了约655倍。研究还发现,即便某些突变远隔在空间上,依然存在复杂的高阶上位性效应,例如,单点突变K351E在组合突变体中表现出阳性突变的效应。

主要亮点

利来国际提出的人工智能辅助酶热稳定性工程策略,可以高效组合多种有益的单点突变。通过两轮设计,成功表征了50个组合突变体,稳定性设计成功率达到100%。与野生型相比,最佳突变体13M4的Tm提升了1019°C,58°C半衰期增加655倍,同时催化活性保持不变。

通过利用少量高质量的实验数据对模型进行微调,微调后的Pro-PRIME模型能够准确捕捉原始数据集中的上位效应,显著提升了对高阶组合突变体的预测性能。此外,动态相关矩阵分析揭示了长程上位效应的机制,显示了远距离突变之间的动力学相关性,影响了突变体的稳定性。

采用这一策略,研究团队仅通过两轮设计,探索了超过26万种可能的组合突变体,显著缩短了传统方法所需的进化过程,提升了蛋白质工程效率。此项研究强调了将生物医药数据与先进人工智能模型相结合,能够进一步提升模型的预测性能,从而在不同关键酶分子的进化任务中推广应用。