Nature子刊:百图生科宋乐团队开发新型蛋白质结构预测工具,不依赖多序列对比,效率更高 |
来源:生物世界 2023-10-17 14:07
与基于MSA的的主流蛋白质结构预测工具AlphaFold2和RoseTTAFold方法相比,HelixFold-Single在预测效率上具有很大优势,耗时要少得多,可以应用于需要大量预测的蛋白质相关任百图生科宋乐博士联合百度自然语言处理部的研究人员,在ure子刊Nature Machine Intelligence上发表了题为:A method for multiple-sequence-alignment-free protein structure prediction using a protein language model的研究论文。
该研究开发了一种名为HelixFold-Single的端到端的蛋白质结构预测方法,该方法结合了大规模蛋白质语言模型(PLM)和AlphaFold2优越的几何学习能力,不依赖多序列比对(MSA),仅从初级结构(氨基酸序列)预测原子三维坐标,从而实现对蛋白质结构的准确预测。此外,HelixFold-Single比目前基于MSA的主流蛋白质结构预测工具(AlphaFold2和RoseTTAFold)耗时少得多,在治疗性蛋白(多肽、抗体和纳米抗体)设计中具有很大的应用潜力。
研究团队认为,大规模的蛋白质语言模型(PLM)可以作为多序列比对(MSA)的替代方案,以学习不依赖MSA的预测的协同进化知识。
基于MSA的方法利用信息检索技术从蛋白质序列数据库中明确捕获目标蛋白质的协同进化信息,而基于PLM的方法在训练过程中将协同进化信息嵌入到大规模模型参数中,并通过模型推理进行隐式检索,其中PLM可视为蛋白质知识库。相比MSA,基于PLM的方法在信息检索方面效率更高。
在过去的几年里,大语言模型(LLM)在自然语言处理领域取得了巨大成功,例如现在爆火的ChatGPT。而现在,已经有一些研究尝试将蛋白质语言模型(PLM)应用于蛋白质结构预测,但预测效果还不尽如人意。
受蛋白质语言模型(PLM)和AlphaFold2进展的启发,研究团队提出了一个端到端不依赖MSA的蛋白质结构预测工具 HelixFold-Single。
HelixFold-Single中使用的模型由两个主要组件组成 作为基础的大规模蛋白质语言模型(PLM)和来自AlphaFold2的用于蛋白折叠的基本组件。PLM可以将主结构编码为单表征和对表征来学习领域知识。然后集成AlphaFold2中的Evoformer和Structure模块来处理表征,学习几何知识,然后预测原子坐标。这两个组件连接起来,给出一个端到端的可微模型(Differentiable Model)。
HelixFold-Single包含两个训练阶段,在第一阶段,通过掩码语言预测任务,用数百万个未标记的单序列训练大规模PLM。在第二阶段,使用由实验解析和AlphaFold2生成的增强结构组成的蛋白质结构来训练整个模型。
接下来,研究团队将HelixFold-Single与两款主流蛋白质结构预测工具AlphaFold2(由DeepMind公司开发)和RoseTTAFold(由华盛顿大学David Baker实验室开发)在CASP14和CAMEO数据集上进行比较。
HelixFold-Single在具有足够数量的同源序列的蛋白质上实现了与AlphaFold2和RoseTTAFold相当的准确性。研究团队还分析了HelixFold-Single在具有不同数量同源序列的靶标上的性能:HelixFold-Single能够对大多数靶标,特别是具有大同源家族的靶标提供准确的结构预测。
此外,与基于MSA的的主流蛋白质结构预测工具AlphaFold2和RoseTTAFold方法相比,HelixFold-Single在预测效率上具有很大优势,耗时要少得多,可以应用于需要大量预测的蛋白质相关任务。
具体来说,研究团队探索了HelixFold-Single在各种类型的代表性蛋白质(包括多肽、抗体和纳米抗体)上的预测精度,以评估其在治疗性蛋白质设计中的应用潜力。结果表明,HelixFold-Single在预测这些蛋白质的柔性区域方面表现良好,突出了其在此类应用中的优势。
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载-> 医药网新闻- 相关报道
-
- Science:新研究开发出一种用于智能细胞构建的工具 (2025-01-22)
- 从死亡边缘拯救大脑?Pharmaceutics:揭秘原始和工程化细胞外囊泡在分子靶向治疗人类缺血性中风中的关键作用 (2025-01-22)
- 我们大脑中的“双面卫士”Neuron:阿尔兹海默病的进展或与压力诱导的小胶质细胞的脂质释放有关 (2025-01-22)
- Nature Medicine:全面揭示“减肥神药”司美格鲁肽的健康益处和风险,降低42种疾病风险,增加19种疾病风险 (2025-01-22)
- 心理疗法的数字程序加快缓解焦虑抑郁患者的症状 (2025-01-22)
- Cancer Res:科学家识别出一种有望开发出新型胰腺癌疗法的特殊酶类靶点 (2025-01-21)
- Nat Rev Mol Cell Biol:综述文章阐释如何利用类器官来模拟人类大脑的发育和疾病发生过程 (2025-01-21)
- 天天熬夜,人真的会“变傻”吗?研究证实:熬夜损伤大脑!睡眠压力会促使神经元突触减少、影响大脑“排毒”,增加痴呆风险 (2025-01-21)
- Nature:利用人工智能设计的新型蛋白可有效中和蛇毒中的毒素 (2025-01-21)
- Nature子刊:西湖大学王寿文/李莉开发了首个基于表观突变、无需基因编辑的谱系追踪工具! (2025-01-21)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040