Nature Communications:研究发表单细胞转录组数据检索新方法和参考数据库 |
![]() |
作为细胞异质性研究的重要工具,单细胞转录组测序技术近年来蓬勃发展,并积累了大量研究数据。若能有效利用现有的单细胞数据进行检索与推断,研究者便能更好地进行新测序单细胞的注释,以及综合多数据集的研究。然而,精确的单细胞转录组数据检索和注释需要克服两个挑战:一、数据集之间的批次效应(batch effect)会显着影响细胞检索的可靠性;二、目前缺少跨物种和平台、具有高质量注释的单细胞转录组数据库。
日前,北京大学生物医学前沿创新中心(BIOPIC)、北京未来基因高精尖创新中心(ICG)、北京大学生命科学学院生物信息中心(CBI)、蛋白质与植物基因研究国家重点实验室的高歌课题组,在期刊Nature Communications上发表了题为“Searching large-scale scRNA-seq databases via unbiased cell embedding with Cell BLAST”的论文,发布了基于深度学习模型的单细胞转录组数据检索和注释的新方法Cell BLAST,以及具备高质量注释的单细胞转录组参考数据库ACA,为有效利用现有数据进行细胞注释和跨数据集研究提供了新的工具和资源。
Cell BLAST使用对抗自编码器(Adversarial Autoencoder)进行转录组数据降维,利用对抗学习策略来消除数据集间的批次效应,取得了优于当前其他同类工具的效果。此外作者基于该模型提出了一个新的、更为准确的细胞相似性度量用于细胞检索,在设计上考虑了单细胞转录组观测本身所具有的不确定性。
除了可以用于细胞类型鉴定,Cell BLAST能灵敏地发现参考数据集中不存在的、未知的细胞类型(图 a-c);此外,作者用一系列造血分化的数据集验证了Cell BLAST还能用于注释连续细胞状态(图 d-f)。
通过收集大量已发表的单细胞转录组数据,作者建立了一个涵盖2,989,582个单细胞、8个物种、27个不同的组织器官的数据库,称为Animal Cell Atlas (ACA)(图 g-h)。作者对ACA中的细胞注释进行了详细的整理,并使用Cell Ontology构建了一套结构化的细胞类型标注,用于统一不同数据集中的标注以及支持细胞类型的推断。
Cell BLAST的应用和ACA数据库
该课题提供了在线检索平台,用户可以直接上传待注释的单细胞转录组数据,用ACA中的参考数据集进行细胞检索和自动注释;同时也提供了Python包Cell BLAST,用户可以使用包在自定义的参考数据集上进行模型训练、检索和定制化分析。(100yiyao.com)
医药网新闻
- 相关报道
-
- Environ Sci Technol:污水处理厂排出的“隐形杀手”——纤维与碎片微塑料成抗生素耐药基因载体,加剧水环境健康风险 (2025-07-10)
- 不抽烟,为什么会得肺癌?Nature:科学家揭秘空气污染如何促进非吸烟人群肺癌的发生 (2025-07-10)
- 江南大学发表最新Cell子刊论文 (2025-07-10)
- 赛多利斯推出 iQue® 5 高通量流式细胞分析仪:快速、灵活、智能,重构高通量筛选体验 (2025-07-09)
- STTT:上中医/北中医团队最新成果证实,天然产物乙酰缬草三酯通过双重铁死亡机制,抑制肠癌的生长、转移和耐药 (2025-07-09)
- Nature系列综述:CAR-T在自身免疫疾病中异军突起,将面临哪些挑战? (2025-07-09)
- Cell Rep Med:癌症诊断新突破!细胞外囊泡“巨无霸”成为液体活检的黄金标记物 (2025-07-09)
- Fertil Steril:定制完美宝宝?基因编辑前夜的抉择——一文读懂PGT-M技术的是与非 (2025-07-09)
- Nat Cancer:科学家破解乳腺癌耐药新机制——γδ T细胞与巨噬细胞的“共谋” (2025-07-09)
- 无需植入支架!血管闭塞患者有了新选择 (2025-07-09)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040