机器学习辅助下的组合库定向蛋白质进化
摘要:机器学习引导的定向进化:通过机器学习来减少定向蛋白质进化所需的实验工作量,并探索通过同时突变多个位置编码的序列空间。实验上采样组合序列空间可能非常昂贵,但在测试变体上训练的机器学习模型提供了一种快速的计算测试序列空间的方法。我们在已经发表的关于人类GB1结合蛋白的经验适应度概览上验证了这种方法,结果显示,通过机器学习引导的定向进化找到的变体的适应度比其他定向进化方法找到的变体更高。然后,我们在将酶进化为新型碳硅烷-H插入反应的两种可能产物对映异构体(立体分歧)的应用中提供了一个示例。这种方法预测了富集功能酶的文库,并在两轮进化中固定了七个突变,以确定具有93%和79%ee的选择性催化变体。通过在硅模拟建模中极大地增加吞吐量,机器学习提升了蛋白质工程问题的序列解决方案的质量和多样性。
作者:Zachary Wu, S. B. Jennifer Kan, Russell D. Lewis, Bruce J. Wittmann, Frances H. Arnold
论文ID:1902.07231
分类:Biomolecules
分类简称:q-bio.BM
提交时间:2020-01-07