AlphaFold 3简直要全知全能了。
2018年,AlphaFold甫一出现就震惊世界,它的进化版AlphaFold 2更是在2020年的CASP中取得了92.4的华丽高分。
根据其母公司DeepMind公布的数据,迄今为止,已经有数百万研究者使用AlphaFold 2在疟疾疫苗、癌症治疗和酶设计领域取得了进展。AlphaFold引用已超过2万次,拿下了包括生命科学突破奖在内的多项科学大奖。
但AlphaFold 2的功能还仅限于对蛋白质结构的预测,可我们都清楚,蛋白质并不是静态的,它会因结构修饰发生功能变化,也会与DNA、RNA及其他物质产生相互作用。这些是AlphaFold 2无法看穿的。
这一问题在今天得到了解决。
DeepMind推出的全新预测模型AlphaFold 3,可以前所未有的精度预测所有生命分子的结构和相互作用,与现有技术相比,精度提升了至少50%,个别类别精度翻倍。研究论文发表在《自然》杂志上。
已经深度试用过AlphaFold 3的弗朗西斯·克里克研究所生化学家Frank Uhlmann对其大加赞赏,认为AlphaFold 3会革命性地改变结构生物学研究,大大降低研究门槛。
AlphaFold 3仍是基于AlphaFold 2的,但做出了两个重要的更新。一是通过用更简单的Pairformer模型取代了Evoformer模型,减少了多重序列比对(MSA)处理的数量;二是应用了最近普遍应用于图像生成AI的扩散模型(Diffusion Module),取代了AlphaFold 2中基于特定氨基酸框架和侧链扭转角的结构模型,这大大增加了AlphaFold能够“看到”的化学结构。
AlphaFold 3相当“聪明”,学习速度很快,从下图可以看出,针对所有指标,20k步数就可以将预测性能提升到最大值的97%。
至于随着训练步数的增加,部分指标表现出的性能不稳定,研究者认为主要是由于样本数不足导致的过拟合。
在与其他预测模型的对比中,在不输入任何结构数据的情况下,AlphaFold 3显著优于Vina等经典对接工具,相比盲对接工具RoseTTAFold All-Atom也是优势超大。
RoseTTAFold All-Atom的研发者华盛顿大学计算生物物理学大牛David Baker也坦然承认,AlphaFold 3的预测性能要更优秀。
不过AlphaFold 3也并非完美无缺,例如在手性结构上它就还有点迷糊,调整后仍有4.4%的错误率。
此外的一个关键限制是,AlphaFold 3能想到的还主要限制于蛋白质结构库(PDB)中的静态结构,对蛋白构象变化的模拟仍有不足。
至少目前来说,AlphaFold 3已经展现出了前所未有的高精度预测能力,足以成为改变行业的重量级工具。
与AlphaFold 2不同,AlphaFold 3将不会完全开源,科学家可以使用AlphaFold 3服务器每天完成十次预测,根据Uhlmann反馈,现在使用体验相当不错,上传数据十分钟立等可取,真是又好又快。
不过预测结果不提供可能成药的蛋白质结构,考虑到DeepMind已经成立了利用AlphaFold 3开发药物的新子公司Isomorphic Labs,这部分功能应该是付费可见了。
参考资料:
[1]https://www.nature.com/articles/s41586-024-07487-w
[2]https://www.nature.com/articles/d41586-024-01383-z
[3]https://www.isomorphiclabs.com/articles/alphafold-3-predicts-the-structure-and-interactions-of-all-of-lifes-molecules
文章来源:奇点网