您的位置:医药网首页 > 医药资讯 > 医药营销 > 自然机器智能:基于变压器的多肽的发现

自然机器智能:基于变压器的多肽的发现

来源:上海交通大学2022-03-25 11:27

最近,国际知名期刊《Nature Machine Intelligence》在上海交通大学生命科学与技术学院在线发表了魏团队的研究论文《基于变压器的模型预测肽HLA类结合并优化针对V的突变肽》。

近日,国际知名期刊《Nature Machine Intelligence》在线发表了上海交通大学生命科学与技术学院魏团队的研究论文《A transformer-based model to predict peptideHLA class I binding and optimize mutated peptides for vaccine design》。生命科学与技术学院2017级博士生褚和港大深圳医院博士是本文的共同第一作者。魏教授和生命科学技术学院熊毅副研究员是本文的合著者。

计算预测人类白细胞抗原(HLA)和肽(pHLA)之间的相互作用可以加速表位筛选和疫苗。在这项研究中,开发了转化框架,包括用于PHLA结合预测的TransPHLA和用于突变肽优化的AOMP程序。它可以扩展到生物分子的任何结合和突变任务(图1)。

TranspHLA设计了变压器导数模型来预测pHLA的结合。TransPHLA在PHLA结合预测、新抗原识别、HPV疫苗识别等方面优于现有的14种方法。基于TransPHLA开发的AOMP程序可用于疫苗设计,它能自动优化突变肽,寻找与目标HLA亲和力更高、与源肽同源性更高的突变肽。在3660个未结合的pHLA中,3630个源肽被成功突变。其中94%经IEDB推荐方法验证,88%与源肽同源性高于80%。

1.数据集

本研究包含112种HLA,肽段长度从8到14不等,共有366种HLA-肽段长度组合。详情参见图2和图3。

2.TransPHLA模型

TransPHLA的核心思想是自我注意机制的应用。TransPHLA由以下四个模块组成(图4):首先使用嵌入块在氨基酸嵌入中加入位置嵌入生成序列嵌入,然后应用dropout技术增强鲁棒性。嵌入块和TransPHLA分别生成肽和HLA的嵌入。接下来,这些嵌入将分别被用作编码器块的输入。编码器模块包括掩蔽多头自关注机制和特征优化模块。特征优化块是首先上升然后下降的所有连接层的组合。该模块使得注意机制的特征表征更加完善。然后,将输出的肽与HLA的特征性表达连接,作为pHLA的嵌入。在pHLA的嵌入通过编码器块之后,使用投影块来预测pHLA的结合分数。

3.TranspHLA模型解释了pHLA结合的模式。

TransPHLA的注意机制提供了生物学的可解释性。证据表明,肽的C端、N端和锚定锚定点对结合HLA非常重要,它们通常位于肽序列的第一、最后和第二位。TransPHLA的关注度评分也印证了这一点,如图5a所示。

此外,我们分析了阳性和阴性样品上的氨基酸类型对不同肽位置的结合和非结合的影响(图5b)。可以发现,pHLA的结合和非结合受肽的不同组分的影响。因此,我们分析了不同肽位置的20个氨基酸对所有366种HLA-肽长度组合的结合或非结合的影响。这些结果不仅有助于人们理解pHLA结合的机制,而且在AOMP计划的疫苗设计中起到关键作用。

因为注意力得分代表pHLA结合的模式,这意味着肽序列上的关键氨基酸位点对于结合或不结合靶HLA非常重要。我们设想了五种HLA结合模式(图5c)。正如所料,TransPHLA在不同的肽位置发现了与先前研究相似的氨基酸类型模式。对于HLA-A * 11: 01,TransPHLA识别第9位带有K(Lys)的肽的锚定残基。对于HLA-B * 40: 01,TransPHLA成功识别出重要的残基,即第二位的E(Glu)和第九位的L(Leu)。对于HLA-B * 57: 03,疏水残基通常形成一个结合口袋,由TransPHLA的第九个L、第九个F(Phe)和第九个W(Trp)决定。对于HLA-A * 68: 01,4HWZ55证明该肽的第九个K和第九个R(Arg)残基对结合有显著贡献。对于HLA-B * 44: 02,第二个e的重要性已经被1M6O56证明了。所有这些结果都得到了先前研究的支持,证明了我们方法的有效性。

4.AOMP程序

基于TransPHLA获得的注意机制,AOMP程序(图6)被开发用于肽疫苗设计。当用户提供一对源肽和目标HLA时,AOMP程序可以搜索与目标HLA亲和力更高且突变位点不超过4个的突变肽。这个程序既保证了突变肽与靶HLA的亲和力,又保证了突变肽与源肽的同源性,从而触发交叉免疫。

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040