您的位置:医药网首页 > 医药资讯 > 医药行业分析 > 清华大学张团队开发SCALEX 单细胞测序数据在线集成算法

清华大学张团队开发SCALEX 单细胞测序数据在线集成算法

来源:生物世界2022-10-21 09336021

SCALEX有一个特别的优势,那就是它高度通用的编码器。该编码器可以投影单细胞测序数据,生成一个批次无关的统一低维细胞嵌入空间。

随着单细胞测序技术的发展,单细胞科学的研究不断深入,规模越来越大,研究对象越来越复杂。整合不同来源的单细胞测序数据,消除批量效应,进行综合挖掘和分析,是单细胞测序数据分析的基础和核心环节。

目前,单细胞测序数据整合面临以下困难:

1.不同的实验样本、实验平台、建库方式甚至操作造成的批量效应,会在单细胞测序数据中引入非生物噪声,干扰细胞间生物差异的提取和分析;

2.单细胞研究的规模不断扩大,百万细胞的数据对整合算法的效率提出了更高的要求。

3.单细胞测序样本的种类也越来越多,不同的单细胞测序数据集通常包含高度异质性的细胞亚群;

4.最后,如何充分重用大量已有数据的旧知识来发掘和分析新数据。目前,单细胞测序数据整合算法大多基于不同批次数据之间的细胞相似性来校正批次效应,存在过整合(尤其是细胞异质性差异较大的数据集的整合)、可扩展性差、无法将现有模型直接应用于新数据集等缺点。

2022年10月17日,清华大学生命科学学院/北京生物结构前沿研究中心张教授研究组在Nature Communications journal上发表了题为:通过将异构数据集投影到一个公共细胞中实现在线单细胞数据集成——ember Online。dding space(通过将异构数据集投影到统一的细胞嵌入空间,在线整合单细胞测序数据)的研究论文。

研究团队开发了基于variable auto encoder深度学习框架的人工智能算法SCALEX,可以在线整合单细胞测序数据。

SCALEX采用非对称自编码器结构,由一个批次无关的编码器和一个批次特定的解码器组成,经过大量学习,得到一个高度通用的编码器。通过将高维单细胞测序数据投影到低维细胞嵌入空间,编码器可以消除批量效应,同时保留生物差异。

SCALEX模型框架

SCALEX有以下四个主要特性:

1.与现有的单细胞测序数据整合方法相比,SCALEX在整合精度上具有明显优势;

2.SACLEX即使面对百万级单细胞数据也依然保持较高的计算效率,适用于超高通量单细胞测序数据的整合与分析;

3.SCALEX有效避免了单细胞测序数据整合中的过校正情况,适用于高度异质性和复杂样本的整合;

4.支持多组学数据整合,如单细胞RNA-seq、单细胞ATAC-seq等。这些特性使得SCALEX适合构建单细胞图。研究人员整合了多个研究和组织的单细胞数据集,构建了小鼠、人类和其他人的三组大规模单细胞地图。

SCALEX有一个特别的优势,那就是它高度通用的编码器。该编码器可以投影单细胞测序数据,生成一个批次无关的统一低维细胞嵌入空间。对于新生成的数据,SCALEX可以将新数据投影到这个统一的低维单元嵌入空间中,而无需重新训练编码器。这种集成称为在线集成。

在线集成带来了一个巨大的优势,就是可以方便地将新数据与单细胞图谱等原始基础数据(需要SCALEX数据集成生成)进行对比分析,从而从基础数据中获得生物学知识的启发和指导,直接支持数据标注、规律验证等分析任务。此外,原始单细胞图谱的细胞内涵在不断添加新数据的过程中得到丰富和扩展,能够实现新的生物学发现。

综上所述,研究开发了SCALEX单细胞测序数据人工智能分析工具,可以将不同批次细胞的基因表达谱映射到批次无关的统一低维细胞嵌入空间,有效消除数据中的批次效应,保持细胞间固有的生物学差异,实现不同批次数据的有效整合。SCALEX适用于图谱水平的单细胞测序数据集成,将为整个生命科学和生物医学领域正在进行的超大规模单细胞图谱等研究项目提供基础支持。

版权声明

本网站所有标注“来源:100医学网”或“来源:bioon”的文字、图片及音视频资料,版权归100医学网网站所有。未经授权,任何媒体、网站、个人不得转载,否则将追究法律责任。获得书面授权转载时,必须注明“来源:100医学网”。其他来源的文章均为转载文章。本网站所有转载文章都是为了传递更多信息。转载内容不代表本站立场。不想被转载的媒体或个人可以联系我们,我们会立即删除。

87%的用户都在使用100医疗网APP随时阅读、评论、分享。请扫描二维码下载-

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040