Nature Methods:从“猜”到“预见”——AI模型PUPS揭示单细胞蛋白质定位的秘密 |
![]() |
蛋白质(proteins)在细胞(cells)内拥有各自特定的 地址 (subcellular localization),这对它们的正常功能至关重要。一旦定位错误(mislocalization),往往与众多疾病(diseases)直接相关。因此,绘制精确的蛋白质亚细胞 地图 是生命科学的核心任务。
尽管人类蛋白质图谱(Human Protein Atlas, HPA)等大规模项目已描绘了上万种蛋白质在部分细胞系(cell lines)中的定位,但这份地图远非完整。HPA覆盖了约13,147个基因(占已知人类基因的65%),但每个蛋白质最多仅在数据集总共37个细胞系中的三株中测量过,实验手段也限制了单次可标记的蛋白质数量。这意味着蛋白质与细胞系的绝大多数组合仍然未知。
更具挑战的是,蛋白质定位并非静态,它在不同细胞系间存在差异,甚至在同一细胞系内的单个细胞(single cells)间也有显著变异性(variability),例如受细胞周期影响。这种动态性难以通过现有有限数据捕捉。
计算模型被寄予厚望以填补空白。纯粹基于蛋白质序列(protein sequences)的模型虽能泛化到未见蛋白质,却忽视了细胞环境特异性。而基于细胞图像(cellular images)的模型虽能捕捉单细胞变异性,却依赖实际图像输入,无法预测新蛋白质或未测量细胞中的定位。亟需一个模型,能跨越蛋白质和细胞系的界限,预测未知定位,并揭示单细胞变异性。
5月13日《Nature Methods》的研究报道 Prediction of protein subcellular localization in single cells ,提出PUPS(Prediction of Unseen Proteins Subcellular localization)方法,创新性地结合了蛋白质语言模型(protein language model)和图像修补模型(image inpainting model)。它利用蛋白质序列实现对未知蛋白质的泛化,借助细胞标志物图像(landmark stains)捕捉单细胞变异性并泛化到未知细胞系。实验验证表明,PUPS能在训练数据之外的全新实验中准确预测蛋白质定位,其预测的变异性与实际观察一致。这为理解蛋白质在活细胞内的动态行为提供了一个强大的计算工具。
医药网新闻
- 相关报道
-
- 47亿!派林生物易主中国生物,血液制品行业格局将重塑 (2025-09-15)
- 【9月16日直播预告】从样本到洞察:蛋白质组学智能实验室的自动化流程与AI高效赋能 (2025-09-15)
- 聚焦靶向蛋白降解、小核酸、多肽、细胞治疗等热点议题,与60+行业领袖共探生物医药未来。10月16-17日,深圳,期待您的加入! (2025-09-15)
- Nature子刊:个性化定制碱基编辑器,治疗致命血管疾病 (2025-09-15)
- 智力出现障碍的罪魁祸首!Cell Rep:两种“染色质管家”联手失控,神经元“身份混乱”致认知受损 (2025-09-15)
- Nature系列综述:刘光慧等全面概述人类和非人灵长类衰老标志物 (2025-09-15)
- Cell Syst:肠道微生物的“抗癌奇兵”!科学家阐明2-甲基异柠檬酸的抗癌新发现 (2025-09-15)
- Cell Rep:“逃避”还是“面对”?梅林团队发现了大脑“逃避开关”的秘密,还为焦虑及抑郁等疾病的研究提供新思路 (2025-09-14)
- 明眸皓齿打一生肖,原创解析解答落实 (2025-09-13)
- “诺奖风向标”拉斯克奖出炉,相分离研究先驱获奖,他们阐明了低复杂度结构域的结构和功能 (2025-09-13)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040