您的位置:医药网首页 > 医药资讯 > 医药行业分析 > STM:天塌了!25癌种5734个样本分析结果显示,瘤内微生物远低于既往报道,癌症与微生物组的关系或被动摇

STM:天塌了!25癌种5734个样本分析结果显示,瘤内微生物远低于既往报道,癌症与微生物组的关系或被动摇

TCGA是大量癌症研究的参考数据来源。虽然这是一项以探究人类遗传变异为目的的测序项目,但在测序实验中,肿瘤中存在各种微生物也被检测到并纳入记录。

在这一过程中,确定具体的物种要与已知微生物基因组序列进行比对,如果微生物基因组数据库是被污染的,关于肿瘤微生物组的结论完全有可能谬之千里。

微生物基因组数据库中,人类污染最常见的来源是各种高拷贝的重复序列,如Alu序列、长/短散在重复序列。在这种情况下,数万乃至数十万个reads错误匹配到某个微生物基因组并不罕见。

此外,测序过程中使用的特定载体或接头序列也可能被错误地引入基因组数据库,那么使用相同载体测序的样本就会出现大量假阳性匹配。

研究者此次对TCGA数据库中截止2023年底可用的全部5734个WGS样本进行了再次分析。此次分析中,研究者比对已知的参考人类基因组数据库GRch38和CHM13,从TCGA数据中去除了人类来源的序列,剩余序列reads普遍较少,平均每样本约240万个reads(占总数0.35%)。

在所有原发瘤样本中,过滤两次剩余65亿个reads,研究者鉴定出其中3.23亿属于人类来源,9.86亿属于载体污染。

这样看似乎不是很直观。研究者接下来对比了2篇已经发表的知名论文,也就是我们文章开头所提到的《自然》和《细胞》两篇论文。

对TCGA中近两万个样本数据进行了分析,并通过机器学习算法构建了基于细菌/古细菌/病毒特征的32种癌症的鉴别诊断模型,准确率可达95%以上。

但本次研究分析结果显示,《自然》论文报告的reads计数远远高过实际,中位比率为56,也就是说至少有一半的reads计数比当前研究高出至少56倍。

《自然》研究报告的丰度最高的三个微生物属,链球菌属(Streptococcus)、分枝杆菌属(Mycobacterium)和葡萄球菌属(Staphylococcus),每个样本的平均reads计数为1780000、1400000、922000,当前研究的结果则是1129、31、39,误差达1500到45000倍。

则对肿瘤中的真菌进行了分析,发现35种癌症中大多数都存在独特的真菌特征,甚至可以用于预测患者预后。

类似的,《细胞》论文报告的丰度前四的真菌物种reads最大计数分别为2013180、656503、101344、54641,当前研究对同一样本进行了再次分析,得到的reads计数为332、4622、266、4,误差达142到13660倍。

研究者还对这些误读的reads进行了进一步的比对分析,确定了污染物的具体来源,记录在论文和补充材料中,感兴趣的读者可以自行寻找阅读。

总结一下,根据本研究的结论,肿瘤中微生物的存在远少于此前研究报道,TCGA数据集中已确定的很多物种可能根本不存在。约翰 霍普金斯大学官方发布的报道标题中,使用 few links 来描述癌症和微生物组之间的关系。

或许,我们要重新审视 肿瘤微生物组 这一概念了。

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040