您的位置:医药网首页 > 医药资讯 > 医疗器械行业 > 细胞:开发一种更好的方法从大量序列中寻找RNA病毒

细胞:开发一种更好的方法从大量序列中寻找RNA病毒

来源:100医疗网原创2022-10-12 16:54

在一项新的研究中,研究人员描述了一种可以特异性扫描RNA病毒序列的计算管道。利用这一工作流程,他们梳理了来自全球不同环境样本的5000多个RNA序列数据集(宏转录组),使RNA病毒的多样性增加了5倍。

一个动物园曾经在冬天提供了一本彩色的北极熊画册,里面有各种色调的白色蜡笔。对于在大型数据集中寻找RNA病毒序列的科学家来说,他们的工作可能类似于在那本书的彩色页面上寻找一片雪花。

在一项新的研究中,来自以色列特拉维夫大学、美国国家生物技术信息中心(NCBI)和美国能源部联合基因组研究所(JGI)的研究人员描述了一种可以特异性扫描RNA病毒序列的计算管道。利用这一工作流程,他们梳理了来自全球不同环境样本的5000多个RNA序列数据集(宏转录组),使RNA病毒的多样性增加了5倍。相关研究成果于2022年9月28日在线发表在《细胞》杂志上,题目是《全球RNA病毒体的扩展揭示了细菌的多样类别》。

谈到发现的病毒的多样性,论文合著者、NCBI高级研究员尤金库宁(Eugene Koonin)表示,我们周围的病毒世界是巨大的,我们现在有办法探索它。虽然这种规模的数据分析面临的技术挑战非常艰巨。

过滤序列的计算筛

地球上的微生物比屈指可数的土壤中的颗粒还要多,病毒的数量也远远超过微生物。测序技术和计算工具的进步发现了病毒的多样性。这些病毒不仅会感染农作物、动物和人类,还会感染微生物。它们的存在与否会影响地球的养分循环。

虽然大多数生物的遗传信息都编码在DNA中,RNA将DNA中的指令传递给细胞,但RNA病毒将它们的遗传信息存储在RNA中,而不是DNA中。该论文的合著者、JGI科学家西蒙鲁(Simon Roux)说,我认为在全球范围内,RNA病毒甚至比DNA病毒更不为人所知。但与DNA病毒一样,RNA病毒会感染世界各地的微生物,并在感染过程中导致细胞死亡和/或细胞生理的深刻变化。

虽然所有RNA病毒都有一个编码RNA聚合酶(RDRP)的基因,这是RNA基因组复制所必需的,但检测它始终是一个挑战。要在海量的基因组数据中发现RNA病毒,需要开发一种特殊的计算筛,过滤掉不太可能含有RdRP序列的序列。

特拉维夫大学的Uri Neri是该论文的第一作者和共同作者,他回忆说,这项新研究是2019年开始的三方合作的结果。特拉维夫大学的研究团队和NCBI团队的成员一起合作分析原核病毒(噬菌体)。他们从JGI的Nikos Kyrpides那里了解到,Kyrpides的微生物组数据科学小组也致力于分析RNA病毒。在这三个团队的几次会议之后,很明显,在实现更高质量的结果方面,更大的合作努力比更小的个人努力要有效得多。

图片来自cell,2022,doi :10.1016/j . cell . 2022 . 08 . 023

这些作者使用了JGI整合微生物基因组和微生物学(IMG/M)系统中所有已发表的宏转录组数据集。Neri说,然后我们研究了更多的样本,并改进了我们的方法。我们的团队在成长,我们的项目范围也在扩大。出于这个原因,Kyrpides强调,许多JGI科学用户在收集和提交他们的微生物组样本用于JGI测序方面的贡献怎么强调都不为过。他说,他们的合作和支持,在某些情况下,他们允许使用未发表的序列数据,对于这项新研究的成功绝对至关重要,因为他们的贡献得到了认可。

Roux和Koonin都指出,大量RNA病毒序列的发现极大地改变了对全球病毒多样性的看法,尽管它不在更高水平的病毒群(门)分类中。此外,RNA病毒在世界各地的分布似乎并不均匀。

扩大的病毒群是与细菌相关的病毒;到目前为止,大多数已知的RNA病毒都与真核生物有关。Roux指出,伴随着与细菌相关的RNA病毒的扩张,发现少数细菌使用CRISPR来防御RNA,尽管尚不清楚为什么很少检测到这种情况。

开发真正大数据的方法

对于这些作者来说,导致发现大量RNA病毒的计算工作只是开始。Neri说,我经常说仅仅确定一个序列是病毒性的还不到故事的一半。我们在发现后投入大量精力进行分析——我们尽力描述每种病毒携带的蛋白质结构域,以及它们可能的宿主是谁。我们已经将所有这些信息完全免费并向更广泛的科学界公开。

特拉维夫大学的Koonin和Uri Gophna都指出,其他平行研究报告了全球RNA病毒组的

类似 急剧扩张 。Koonin说, 我们如今需要比较和协调这些发现,提出一个单一的、非冗余的数据集。希望在相对较短的时间内,我们将能够估计出RNA病毒组(RNA virome)的实际规模。然而,这如今是真正的大数据,我们正在处理数十亿个序列,很快就会有数万亿个序列。开发高效、自动化的方法来分析和分类这种规模的序列数据是至关重要的。 ( 100yiyao.com)

参考资料:

1. Uri Neri et al. . Cell, 2022, doi:10.1016/j.cell.2022.08.023.

2. A better way to find RNA virus needles in database haystacks

https://phys.org/news/2022-10-rna-virus-needles-database-haystacks.html

版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载->

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040