基因组生物学:基于零扩展概率主成分分析模型mbDenoise的微生物组数据去噪新方法 |
![]() |
来源:上海交通大学2022-04-29 09336007
本研究提出了基于零扩展概率主成分分析的统计模型和变分逼近算法对微生物组数据进行去噪,这对揭示微生物组数据中潜在的生物信号具有重要意义。
近日,国际权威期刊《Genome Biology》在线发表了上海交通大学生命科学与技术学院王涛团队利用零感染概率主成分分析进行MBdenoise 3360微生物数据去噪的研究成果。本研究提出了基于零扩展概率主成分分析和变分逼近算法的模型对微生物组数据进行去噪,这对揭示微生物组数据中潜在的生物信号具有重要意义。生命科学与技术学院博士生曾燕燕为第一作者,生命科学与技术学院王涛教授、耶鲁大学赵红宇教授为通讯作者,生命科学与技术学院李静教授、魏朝春教授为合作者。
微生物学是一门新兴的边缘学科,它综合研究生活在一定生态系统中的微生物群落,依靠其丰富的遗传和代谢功能,在特定环境中与其他生命体或环境因子产生互利或互斥的作用。微生物学研究积累了大量的测序数据,正面临着从量到质、从结构到功能研究的关键转变过程。然而,微生物组数据分析仍然面临许多技术挑战。一个主要的挑战是物种或基因特征表包含大量的零,其中一些是生物零,而另一些是非生物零。此外,微生物组数据也存在一些问题,如测序深度不均匀、过度分散和数据冗余。这些干扰因素会引入大量噪声,如果不解决会直接影响下游数据分析的准确性。
为了解决微生物组数据中的干扰因素,提取真实的生物信号,提出了一种去除微生物组数据噪声的隐变量建模方法MB降噪。该方法基于一种概率生成模型,借用样本与物种或基因之间的信息,从而实现生物信号与技术噪声的分离(图1)。或者物种基因多度数据由零展开负二项式模型生成,用于克服数据过度分散和稀疏的问题,区分生物零和非生物零。在此基础上,引入负二项分布,减少测序深度差异带来的技术偏差。进一步假设生物信号对应嵌入高维特征空间的低维潜在表征,既刻画了微生物组数据的冗余性,又克服了高维特征与特征之间的复杂关系。在本研究中,上述生成模型被称为零扩展概率主成分分析(ZIPPCA)。MbDenoise通过变分逼近算法拟合模型,然后通过后验均值恢复真实丰度矩阵,从而达到数据去噪的目的。
在本研究中,大量的模拟实验和真实数据被用来广泛评估MB去噪的性能。总体而言,mbDenoise在参数估计、潜在变量预测和微生物群落组成估计方面具有较高的精度。同时,MB去噪法在下游分析中优于多样性分析和差异丰度分析等其他方法。这项研究提供的R包可以在。
图一。1 . MB降噪及其噪声模型综述
A.mbDenoise区分生物零和非生物零,假设生物信号对应嵌入高维特征空间的低维电位表示,从而反映微生物组数据的冗余性。该方法基于零扩展概率主成分分析(ZIPPCA)模型,考虑了微生物群落物种或基因丰度数据的成分性、稀疏性和过度分散性的特点。b .假设输入数据(即丰度矩阵或特征表)是来自ZIPPCA模型的样本。MB降噪符合模型b
上海交通大学王涛团队的研究方向是生物统计学和高维数据的统计推断。在过去的五年里,已经发表了10多篇关于微生物组数据挖掘和统计分析的方法学论文,包括《美国统计协会杂志》(2022,2017),《应用统计年鉴》(2017),《生物统计学》(2020,2019,2017),《生物信息学简报》(2022),《生物信息学》(2022,2021)。研究成果主要涉及微生物组的数据预处理、数据降维与可视化、多元统计建模与分析、相关性分析、集成进化树结构的预测建模与分析等。
版权声明
本网站所有标注“来源:100医学网”或“来源:bioon”的文字、图片及音视频资料,版权归100医学网网站所有。未经授权,任何媒体、网站、个人不得转载,否则将追究法律责任。获得书面授权转载时,必须注明“来源:100医学网”。其他来源的文章均为转载文章。本网站所有转载文章都是为了传递更多信息。转载内容不代表本站立场。不想被转载的媒体或个人可以联系我们,我们会立即删除。
87%的用户都在使用100医疗网APP随时阅读、评论、分享、交流。请扫描二维码下载-

- 相关报道
-
- JAMA Netw Open:肥胖研究新视角!科学家揭秘腰围和腰臀比与结直肠癌的惊人关联 (2025-06-17)
- 湘雅团队最新研究发现,腺苷有望成为银环蛇咬伤急救新选择 (2025-06-17)
- 修改教科书的发现:北京协和医学院黄波发表最新Cell子刊论文 (2025-06-17)
- 你试过「一天正常吃,一天吃半饱」吗?多项研究:隔日断食法能减肥且不损肌肉、护肝降脂、延缓认知衰退,还能缓解女性经前综合征 (2025-06-17)
- 所以说,孕期和青少年时期不要馋糖和奶茶!Nature破解早期果糖危害大脑之谜 (2025-06-17)
- 橄榄油也不是完美的油?!Cell Rep:橄榄油中富含的单不饱和脂肪酸——油酸或比其他类型的脂肪更易引发肥胖 (2025-06-17)
- JAMA子刊:“减肥神药”司美格鲁肽或增加这种可导致失明的视网膜疾病风险 (2025-06-17)
- Nature子刊:邹强/李靖华/李霞/崔心刚团队揭示新型细胞死亡形式双硫死亡与抗肿瘤免疫的关联 (2025-06-16)
- 强强联合!国内跨学科团队研制“眼脑轴”基座模型,实现无症状脑梗及卒中精准筛查与预警 (2025-06-16)
- 从渐进到飞跃!论制药巨头如何引领癌症治疗实现根本性的突破 (2025-06-16)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040