Nature子刊:腾讯AI Lab提出蛋白质相互作用研究AI模型 |
![]() |
过去的十年,为了高效且低成本地绘制出人类蛋白质相互作用组,研究领域越来越多地使用计算方法来自动预测 PPI,其中就包括深度学习的引入。但是,此前尚未出现用于模拟自然 PPI 层次结构的模型。
在 HIGH-PPI 模型中,腾讯 AI Lab 研究团队创建了一种层次图,包含蛋白质外顶视图和蛋白质内底视图。顶视图描述蛋白质之间的相互作用,每种蛋白质就是一个节点,蛋白质之间的相互作用就是图的边;而底视图描述每种蛋白质内部的信息,关键氨基酸或残基组合就是图的节点,物理位置相邻的残基以边相连。
图1:蛋白质结构和网络结构都对PPI的准确预测至关重要。(a)蛋白质序列通常能提供关于PPI的细节信息,但它也可能导致PPI的预测准确性降低,例如不具备序列相似性的两个蛋白质(SERPINA1、3)可能和同一蛋白质(ELANE)在相同作用界面发生PPI;(b)包含网络结构信息的PPI,将蛋白质区分为不同的社区,社区内的蛋白质之间存在密集的交互,而社区之间通常只有微弱的连结;(c)HIGH-PPI具备双视图层次,顶视图包含网络结构信息,底视图包含蛋白质结构信息。
此前,业内学者大多关注 PPI 的外部层次(交互作用组学)或内部层次(蛋白质组学),并未考虑 PPI 本身的层次结构。
HIGH-PPI 模型受到生物学家研究方法的启发,使用两个图神经网络(GNN), 从两个视角分别进行学习。通过具体案例和实验,研究发现在端到端模型中,两个层次之间存在相互增益关系,缺失任一层次的结构信息都将损害机器学习模型的性能。
图2:将HIGH-PPI(红色)与四种主流模型 GNN-PPI、PIPR、DrugVQA和RF-PPI对比。(a)PPI预测精确率-召回率曲线;(b)PPI网络扰动下模型鲁棒性测试;(c)分布外场景下模型泛化性测试;(d)各PPI类别下精度测试。
据介绍,模型的架构设计主要有两个层面的考虑:
首先,在蛋白质组学层面,蛋白质序列信息通常能提供关于PPI的细节信息,但是在预测PPI方面准确率较低。例如,两种蛋白 SERPINA1、SERPINA3 分别与 ELANE 蛋白在同一局部位置发生相互作用,SERPINA1、3之间结构相似性较高,但是序列相似性较低(见图1a)。在这种情况下,结构信息对预测PPI很重要,仅依靠序列信息难以让模型作出准确的预测。
其次,在交互作用组学层面,模型关注 PPI 网络结构,倾向于将蛋白质划分为不同的社区,社区内的蛋白质之间存在密集的交互,而社区之间通常只有微弱的连结(见图1b)。先前研究已经证明,PPI网络的结构属性能够预测缺失的链接,发现未知的PPI。
图3:蛋白内视图带来增益。(a)引入蛋白质3D信息显著提升预测性能,且在保证输入信息相同的前提下,图结构(Graph)相对循环神经网络(RNN)和卷积神经网络(CNN)具有明显优势;(b)和基线(蓝色点虚线)对比,采用相同的输入信息训练后,图结构数据对蛋白结构误差表现出高容忍度;此外,图结构数据还具备较高的可解释性,例如(c)精确识别蛋白中对接位点和(d)对残基的属性重要性打分。
图4:交互作用组学信息的应用。(a)PPI网络节点度(左)和社区属性(右)分别与PPI预测结果F1分数的高相关性;(b)不同链路预测方法的F1分数,有效的链路预测方法都倾向于高度还原PPI网络的结构属性;(c)PPI网络示意图,每个节点的面积代表它的度值,只有两条外部的边连接检测到的两个社区(左),真实计算结果显示其他链路预测方法会产生错误的链路,这可能会破坏社区的划分(中),并且在恢复节点度方面存在缺陷(右)。
预测准确率、可解释性大幅提升 医药网新闻
- 相关报道
-
- 百奥赛图与百济神州达成抗体分子许可协议,加速创新药物开发 (2025-07-10)
- Nature Biotechnology:基因编辑的“瑞士军刀”!16种序列特异性编辑器诞生,实现对DNA的“按需编程” (2025-07-10)
- STTT:膳食脂肪酸调教T细胞!港大团队发现,棕榈酸会削弱γδ-T细胞的抗肿瘤作用,而油酸可逆转 (2025-07-10)
- 《神经病学》:重大人生打击,与阿尔茨海默病相关病理发展和大脑结构的变化有关! (2025-07-10)
- J Hematol Oncol:突破T细胞白血病治疗瓶颈——双靶点CAR-T细胞有望带来新希望 (2025-07-09)
- 《自然·医学》:世卫组织最新预警!全球08-17年出生的人,或有1560万会患胃癌,76%归因与幽门螺杆菌感染,2/3发生在亚洲 (2025-07-09)
- 精鼎医药宣布两位 FDA 权威专家加入我司咨询团队,进一步增强监管事务、医学及 AI 领域专业实力 (2025-07-08)
- Mater Today Bio:干细胞球联手纳米颗粒水凝胶精准改善糖尿病创面环境,加速伤口愈合新突破 (2025-07-08)
- J Anim Sci Biotechnol研究揭秘美味密码:益生菌联手重塑肠道菌群,经肠-肌轴提升猪肉鲜味与品质 (2025-07-08)
- Science:告别序列依赖,为你的染色体“扫码”——每条染色体竟自带独一无二的“条形码 (2025-07-07)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040