Nature子刊:百图生科宋乐团队开发新型蛋白质结构预测工具,不依赖多序列对比,效率更高 |
![]() |
来源:生物世界 2023-10-17 14:07
与基于MSA的的主流蛋白质结构预测工具AlphaFold2和RoseTTAFold方法相比,HelixFold-Single在预测效率上具有很大优势,耗时要少得多,可以应用于需要大量预测的蛋白质相关任百图生科宋乐博士联合百度自然语言处理部的研究人员,在ure子刊Nature Machine Intelligence上发表了题为:A method for multiple-sequence-alignment-free protein structure prediction using a protein language model的研究论文。
该研究开发了一种名为HelixFold-Single的端到端的蛋白质结构预测方法,该方法结合了大规模蛋白质语言模型(PLM)和AlphaFold2优越的几何学习能力,不依赖多序列比对(MSA),仅从初级结构(氨基酸序列)预测原子三维坐标,从而实现对蛋白质结构的准确预测。此外,HelixFold-Single比目前基于MSA的主流蛋白质结构预测工具(AlphaFold2和RoseTTAFold)耗时少得多,在治疗性蛋白(多肽、抗体和纳米抗体)设计中具有很大的应用潜力。
研究团队认为,大规模的蛋白质语言模型(PLM)可以作为多序列比对(MSA)的替代方案,以学习不依赖MSA的预测的协同进化知识。
基于MSA的方法利用信息检索技术从蛋白质序列数据库中明确捕获目标蛋白质的协同进化信息,而基于PLM的方法在训练过程中将协同进化信息嵌入到大规模模型参数中,并通过模型推理进行隐式检索,其中PLM可视为蛋白质知识库。相比MSA,基于PLM的方法在信息检索方面效率更高。
在过去的几年里,大语言模型(LLM)在自然语言处理领域取得了巨大成功,例如现在爆火的ChatGPT。而现在,已经有一些研究尝试将蛋白质语言模型(PLM)应用于蛋白质结构预测,但预测效果还不尽如人意。
受蛋白质语言模型(PLM)和AlphaFold2进展的启发,研究团队提出了一个端到端不依赖MSA的蛋白质结构预测工具 HelixFold-Single。
HelixFold-Single中使用的模型由两个主要组件组成 作为基础的大规模蛋白质语言模型(PLM)和来自AlphaFold2的用于蛋白折叠的基本组件。PLM可以将主结构编码为单表征和对表征来学习领域知识。然后集成AlphaFold2中的Evoformer和Structure模块来处理表征,学习几何知识,然后预测原子坐标。这两个组件连接起来,给出一个端到端的可微模型(Differentiable Model)。
HelixFold-Single包含两个训练阶段,在第一阶段,通过掩码语言预测任务,用数百万个未标记的单序列训练大规模PLM。在第二阶段,使用由实验解析和AlphaFold2生成的增强结构组成的蛋白质结构来训练整个模型。
接下来,研究团队将HelixFold-Single与两款主流蛋白质结构预测工具AlphaFold2(由DeepMind公司开发)和RoseTTAFold(由华盛顿大学David Baker实验室开发)在CASP14和CAMEO数据集上进行比较。
HelixFold-Single在具有足够数量的同源序列的蛋白质上实现了与AlphaFold2和RoseTTAFold相当的准确性。研究团队还分析了HelixFold-Single在具有不同数量同源序列的靶标上的性能:HelixFold-Single能够对大多数靶标,特别是具有大同源家族的靶标提供准确的结构预测。
此外,与基于MSA的的主流蛋白质结构预测工具AlphaFold2和RoseTTAFold方法相比,HelixFold-Single在预测效率上具有很大优势,耗时要少得多,可以应用于需要大量预测的蛋白质相关任务。
具体来说,研究团队探索了HelixFold-Single在各种类型的代表性蛋白质(包括多肽、抗体和纳米抗体)上的预测精度,以评估其在治疗性蛋白质设计中的应用潜力。结果表明,HelixFold-Single在预测这些蛋白质的柔性区域方面表现良好,突出了其在此类应用中的优势。
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->

- 相关报道
-
- 两篇《自然》:肺癌私联神经元!科学家首次发现小细胞肺癌细胞会在脑内与神经元形成突触,借助电信号促进肿瘤生长 (2025-09-16)
- Sci Adv:新型双特异性抗体有望成为抗击巨细胞病毒的“免疫特种兵” (2025-09-16)
- 《神经病学》:代糖或伤认知!8年随访发现,摄入较多代糖与记忆力、语言流畅性和整体认知能力下降速度提升32%、173%和62%相关 (2025-09-16)
- Nature子刊:超越ADC,中国博后发明ABC药物,重拳出击,精准靶向 (2025-09-16)
- Cell子刊:“滴血验癌”新突破,王延博/张硕等利用细胞外囊泡,精准检测10多种癌症 (2025-09-16)
- 47亿!派林生物易主中国生物,血液制品行业格局将重塑 (2025-09-15)
- 【9月16日直播预告】从样本到洞察:蛋白质组学智能实验室的自动化流程与AI高效赋能 (2025-09-15)
- 聚焦靶向蛋白降解、小核酸、多肽、细胞治疗等热点议题,与60+行业领袖共探生物医药未来。10月16-17日,深圳,期待您的加入! (2025-09-15)
- Nature子刊:个性化定制碱基编辑器,治疗致命血管疾病 (2025-09-15)
- 智力出现障碍的罪魁祸首!Cell Rep:两种“染色质管家”联手失控,神经元“身份混乱”致认知受损 (2025-09-15)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040