David Baker创立的AI制药公司扔出重磅炸弹:最大规模单细胞扰动测序数据集,支持虚拟细胞研究 |
![]() |
来源:生物世界 2025-06-19 09:53
Xaira Therapeutics 的研究人员证明,sgRNA 的丰度在每个细胞中能被检测到并表达数百个拷贝,这在单细胞检测中极为罕见,并且为基因被抑制的程度提供了一个可靠的替代指标。2024 年 4 月,一家名为Xaira Therapeutics的人工智能(AI)药物研发公司成立,并同时宣布获得了令人瞠目结舌的10 亿美元种子轮融资。该公司致力于通过新兴 AI 技术的端到端应用,帮助重新设计药物的发现和开发之旅。
该公司拥有一个星光熠熠的创始和领导团队,包括 AI 蛋白质设计先驱、2024 年诺贝尔化学奖得主David Baker教授,以及 2022 年诺贝尔化学奖得主Carolyn Bertozzi教授、美国 前局长Scott Gottlieb、强生公司前 CEOAlex Gorsky,以及斯坦福大学前校长Marc Tessier-Lavigne等。因此,整个 AI 药物研发领域都在热切期待着该公司取得令人瞩目的科学成果。
David Baker教授
现在,这家 AI 独角兽企业不负众望,在其成立的第一年就为虚拟细胞(Virtual Cell)研究领域送上了一份厚礼 发布了目前最大的公开可用的Perturb-seq数据集,名为X-Atlas/Orion,为虚拟细胞研究提供支持,该数据集可用于 AI 模型训练,并能检测剂量依赖性遗传效应,从而增强药物发现的预测能力。
该数据集于 2025 年 6 月 16 日发表在预印本平台 bioRxiv,论文题为:X-Atlas/Orion: Genome-wide Perturb-seq Datasets via a Scalable Fix-Cryopreserve Platform for Training Dose-Dependent Biological Foundation Models。
根据论文中的介绍,X-Atlas/Orion包含了 8000000 个细胞,涵盖了人类所有编码蛋白质的基因,单细胞的深度测序超过 16000 个独特分子标识符(UMI)。
Perturb-seq是基于单细胞转录组测序(scRNA-seq)、以汇集的形式同时读出单细胞的 CRISPR sgRNA 遗传扰动和转录组的方法。过去,研究人员一直将 Perturb-seq 基因敲低视为一种 开 或 关 的开关,而X-Atlas/Orion通过检测剂量依赖性遗传效应取得了进步,从而揭示了基因活性如何随着特定干预措施的强度而变化,例如,可应用于确定对药物靶点的抑制百分比达到多少时会产生预期治疗效果。
大规模平行测序技术的迅猛发展催生了基础模型开发生态,这类模型可通过解析海量生物数据揭示全新生物学发现。然而,尽管AI 驱动的虚拟细胞模型具备加速科学发现的革命性潜力,其发展始终受限于高质量扰动数据的规模性短缺 这一困境源于数据生成过程的可扩展性瓶颈与实验方法变异性的双重制约。
该研究推出了创新性的 固定-冻存-单细胞测序 (Fix-Cryopreserve-scRNAseq, FiCS)Perturb-seq平台,该工业化解决方案实现了扰动测序数据的规模生产。
实验验证表明,FiCS平台展现出卓越的检测灵敏度与微弱的批次效应,能捕捉基因扰动引发的转录组变化,准确重现经典生物学通路与蛋白复合体特征。作为技术示范,Xaira Therapeutics正式发布当前全球最大规模的公共扰动数据库 X-Atlas/Orion。该数据集源自两项针对人类全部蛋白质编码基因的全基因组 FiCS Perturb-seq 实验,包含 8000000 个深度测序细胞,单细胞独特分子标识符(UMI)超 16000 个,为领域研究树立新标杆。
该研究还揭示,sgRNA 丰度可作为基因敲低效能的有效表征。通过深度测序与每次扰动条件下充足细胞量的技术优势,证实基于 sgRNA 表达的剂量分层可解析遗传效应的浓度依赖性特征。
工业化 Perturb-seq 平台工作流
综合来看,FiCS Perturb-seq 成功打造了高效、可扩展的高通量扰动测序平台。通过 X-Atlas/Orion 数据集的发布,不仅为解决数据生成中的规模化和标准化难题提供关键方案,更将推动融合基因剂量效应的新一代基础模型开发,为加速生命科学发现注入强劲动力。
为促进虚拟细胞研究领域的开放协作,X-Atlas/Orion 数据集将以非商业使用许可向生物技术界开放共享。对于有意开展商业合作的公司,Xaira Therapeutics 表示愿意就数据授权与应用开发等合作模式进行商谈。
对于传统的早期药物研发,通常仅限于从文献中挑选少数几个基因进行尝试,但高性能的虚拟细胞(Virtual Cell)模型却有可能在研发流程中不良生物学效应出现之前就将其排除。
许多虚拟细胞模型是基于观察数据训练的,例如 CZ CELLxGENE,其单细胞数据主要来自健康的人类捐赠者,虽然观察数据对于某些生物学研究任务(例如细胞类型注释)非常有用,但在预测细胞对扰动(例如药物治疗)的响应方面却存在不足。
在 Perturb-seq 中,由于单细胞数据集的随机性和稀疏性,测量基因敲低效率一直颇具挑战性。为解决这一难题,Xaira Therapeutics 的研究人员证明,sgRNA 的丰度在每个细胞中能被检测到并表达数百个拷贝,这在单细胞检测中极为罕见,并且为基因被抑制的程度提供了一个可靠的替代指标。
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->

- 相关报道
-
- Nature:NINJ1——细胞膜上的“致命开关”,决定细胞在暴力拉扯下何时“粉身碎骨” (2025-06-19)
- 你讨厌吃有苦味的食物吗?EJN:苦味基因TAS2R38不仅能决定苦味感知,还可能通过饮食行为和生理机制影响健康 (2025-06-19)
- Nature:科学家揭开性激素与癌症转移的神秘面纱——GRPR或成新靶点! (2025-06-19)
- Nature子刊:我国学者开发新型蛋白靶向降解技术——FRTAC,高效降解膜蛋白 (2025-06-19)
- Sci Rep:肠道修护新发现!硫化氢通过修饰核糖体蛋白,为结肠炎肠屏障修复撑起"保护伞" (2025-06-19)
- 全国紫苏产业科技发展大会通知(第一轮) (2025-06-19)
- David Baker创立的AI制药公司扔出重磅炸弹:最大规模单细胞扰动测序数据集,支持虚拟细胞研究 (2025-06-19)
- Cell重磅:付巧妹团队通过牙结石古DNA证实,哈尔滨古人类“龙人”并非全新人类,而是丹尼索瓦人 (2025-06-19)
- Cell Stem Cell:北京大学王凯团队等开发快速生成功能性血管类器官的新方法 (2025-06-18)
- Nature头条:华人学者利用类器官技术,让小鼠体内长出人类细胞 (2025-06-18)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040