走进EVO视讯
NEWS人工智能酶设计再创佳绩,EVO视讯助力酶稳定性快速进化!
来源:伊梅娇 日期:2025-03-13EVO视讯引言
AI辅助的生物医学技术正在取得重大突破,我公司创始人兼CTO,上海交通大学生命科学技术学院杨广宇教授团队,与上海交通大学自然科学研究院洪亮教授团队合作,利用Pro-PRIME蛋白语言大模型和高效模型定向精细调节,仅在两轮设计中显著提升了蛋白质的稳定性,其中复合突变成功率达到100%。
杨广宇教授的团队开发的这一技术基于蛋白质大模型,仅需少量目标蛋白的(突变-活性-稳定性)的标注数据(少于100个),通过模型的精调可以有效预测复合突变对目标蛋白稳定性的影响,有助于生物医学领域中的蛋白质稳定性优化设计。相比于传统的高通量筛选方法,这种策略具有高效率、低成本和易于筛选的优点,为基于AI技术的生物医学研究提供了新的视角和方向。
概述
优化蛋白质的热稳定性在生物医学科学和行业应用中扮演着关键角色。目前,通过(半)理性设计和随机诱变的方法可以较为有效地设计出多种增强蛋白质热稳定性的单点突变。然而,组合多个突变时,复杂的上位效应常常导致组合突变体失活,这使得蛋白质的优化过程非常耗时且需要多轮设计。最近,我公司创始人兼CTO,杨广宇教授的团队在《mLife》上发表了文章“利用蛋白语言模型组合多个突变的热稳定性优化”,该研究提出了一种AI辅助的策略,可以高效组合多个有益的单点突变。在肌酸酶的研究中,仅通过两轮设计,就获得了50个具有优异热稳定性的组合突变体,设计成功率达100%。
主要内容
在这项研究中,作者采用了一种AI辅助的蛋白质热稳定性工程策略,通过少量实验数据对Pro-PRIME模型进行微调,从而准确预测组合突变体的稳定性与活性。Pro-PRIME模型基于9600万个宿主细菌的最佳生长温度数据进行训练,在高温酶的设计与优化中表现出色。微调的初始数据集包含来自肌酸酶的73个低阶突变体的序列-热稳定性和活性数据,随后使用微调后的模型预测来自18个单点突变的所有可能突变体的热稳定性和活性,目标是在保持至少60%的相对活性(相对于野生型)的情况下,增强热稳定性。
整个优化过程分为四个步骤:(1) 数据收集,(2) 微调蛋白质语言模型,(3) 在组合序列空间中预测所有突变体,(4) 验证所选突变体。为了提高预测精确度,研究人员将第一轮的实验结果整合到数据集中,进行了第二轮微调、预测和选择。经过两轮的微调和预测,设计出了50个组合突变体,实现了100%的热稳定性设计成功率。
最佳突变体13M4包含了13个突变位点,活性几乎保持不变,在Tm值上提高了1019°C,58°C下的半衰期增加约655倍。研究还发现,即使某些突变在空间上相隔较远,依然会有复杂的高阶上位性效应。例如K351E单点突变表现出负效应,但在高阶突变体中则呈现为正效应。此外,D17V和I149V单点突变显示出明显的协同作用。结果表明,利用高质量的实验数据对模型进行微调,能够帮助模型有效捕获上位效应,从而用于后续高阶组合突变体的适应性预测。
该项研究提供了一个高效的框架,旨在推动生物医学领域中蛋白质工程的研究进展,强调了将实验数据与人工智能模型结合的重要性,可以进一步提升模型的预测性能,从而改善蛋白质工程的效率。这一策略可以在多种关键酶的进化任务中得到广泛应用,成为未来研究的重要工具。
通过EVO视讯的技术创新和研究成果,我们期待在生物医学领域带来更多积极的变化。
全国客户服务热线
18865528943
总部地址:西宁高坪区盛街道83号