您的位置:医药网首页 > 医药资讯 > 医药营销 > 《自然》子刊:腾讯AI实验室发布scBERT模型 攻克单细胞测序数据分析痛点

《自然》子刊:腾讯AI实验室发布scBERT模型 攻克单细胞测序数据分析痛点

来源:腾讯AI实验室2022-09-28 11:44

本研究创新性地提出了单细胞标注的scBERT算法模型,实现了具有高解释性、通用性和稳定性的单细胞类型标注技术。这一研究成果对未来单细胞转录组测序数据分析领域的研究具有深远的意义。

单细胞测序技术是生命科学领域的一项革命性技术。它可以以精细的粒度观察和描绘各种物种的组织、器官和生物中的单个细胞的分子图谱(细胞表达),便于更好地了解肿瘤微环境,从而达到精细分析病因、匹配治疗方案的效果。对于“精准医疗”具有极高的应用价值。

受数据样本量小、人工干预过多、过度依赖标记基因(已报道的特定基因)等因素影响,单细胞测序细胞类型标注技术一直面临着泛化能力、可解释性和稳定性不高的问题,现有算法难以得到更广泛的应用。

2022年9月27日,腾讯AILab的姚建华等人在Nature Machine Intelligence发表了题为:Scbert作为单细胞RNA-seq数据的细胞类型标注的大规模预训练深度语言模型(基于大规模预训练语言模型的单细胞转录组细胞类型标注算法)的研究论文。

本研究创新性地提出了单细胞标注的scBERT算法模型,实现了具有高解释性、通用性和稳定性的单细胞类型标注技术。这一研究成果对未来单细胞转录组测序数据分析领域的研究具有深远的意义。

《自然智能》是计算机科学和人工智能领域(IF=25.898)最高的顶级期刊,只关注对该领域有重要影响的科研成果。由于其严格的评价标准,平均每年收集的论文数量只有60篇左右。

本文首次提出了基于大规模预训练语言模型的单细胞转录组细胞类型标注算法,即scBERT模型,并首次将transformer(自然语言处理算法的经典计算单元)应用于单细胞转录组测序数据分析领域。该模型基于BERT范式,将细胞中的基因表达信息转化为计算机能够理解和学习的“语言”,并对细胞进行精确标记。

为了保证基因在整个基因组中的可解释性,“scBERT”没有对预训练数据做任何降维或筛选,最大程度地保留了数据本身的特征和信息。此外,该模型复用了大规模公共数据集,包括不同实验来源、批次和组织类型的单细胞数据,以确保模型能够学习更多的一般知识,准确捕捉单个基因的表达信息以及两个基因之间的关系。

由此,“scBERT”模型实现了单细胞类型的标注技术,具有很高的解释性、通用性和稳定性。截至目前,已通过9个独立数据集、超过50万个细胞、覆盖17个人体主要器官和一个由主流测序技术组成的大规模标杆测试数据集,验证了算法模型的优越性。其中,在具有挑战性的外周血细胞亚型细分任务中,现有优化方法70%的准确率提高了7%。

在应用价值层面,该技术可以为一个细胞中的每个基因打印一张专属的“身份证”,用于临床单细胞测序数据,帮助医生描述准确的肿瘤微环境,检测少量癌细胞,从而实现个性化治疗方案或早期癌症筛查。同时,它在疾病发病机理分析、耐药性、药物靶点发现、预后分析、治疗方案设计等领域发挥着极其重要的作用。

腾讯AI Lab是腾讯的企业AI实验室,于2016年4月在深圳成立。重视实验室研究和应用的发展。基础研究侧重于机器学习、计算机视觉、语音技术和自然语言处理。技术的应用主要集中在游戏、数字人、内容和社交四个领域,探讨AI在工业、农业、医疗、医学、生命科学等领域的研究和应用。

此前,腾讯AI Lab团队的研究成果已经发表在Nature Communications、ACL-IJCNLP等国际权威学术期刊上。未来,腾讯将基于自身先进AI技术的积累,继续与下游临床、医药、生命科学基础研究领域紧密合作,为行业贡献更多价值。

版权声明

本网站所有标注“来源:100医学网”或“来源:bioon”的文字、图片及音视频资料,版权归100医学网网站所有。未经授权,任何媒体、网站、个人不得转载,否则将追究法律责任。获得书面授权转载时,必须注明“来源:100医学网”。其他来源的文章均为转载文章。本网站所有转载文章都是为了传递更多信息。转载内容不代表本站立场。不想被转载的媒体或个人可以联系我们,我们会立即删除。

87%的用户都在使用100医疗网APP随时阅读、评论、分享、交流。请扫描二维码下载-

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040