美国提出基因测序数据分类新标准 |
日前,一套旨在阐明可公开获取的基因测序数据信息的质量标准由美国洛斯阿拉莫斯国家实验室(LANL)的一个遗传学小组和一国际财团联合提出。新标准最终可有助于公共健康部门或安全人员更迅速地应对潜在的公共卫生突发事件。
近日,LANL遗传学家帕特里克?钱恩和他的同事提出了6个基因组测序数据标签,可将基因测序数据按其完整性、准确性以及由此带来的可靠性进行归类。这些标签可在公共数据库中获取,而目前使用的标签仅为两个。此项成果的重要性在于,研究人员必须每天使用这样的数据,以对未知遗传数据和已知生物体的遗传数据进行相互参照,而有了这样的新的分类标准,数据的获取与对比工作的效率将大大提高。
每个生物体的细胞内都有DNA,由4个分子构建模块(或称碱基对)组成,碱基对排成特定序列时就可构成基因。这些基因序列可包含对生物体有益或有害的遗传指令。基因组研究人员编目了数以千计的基因数据,并将其放在公众数据库中以供其他研究者使用。然而,由于基因数据的复杂性,公共数据库中的遗传信息范围从粗略到精致一概都有。
在过去几年里,基因测序技术已取得重大进步,公众可获得的基因数据已呈爆炸性增长,每天产生的碱基对序列数据量要比过去几年产生的数据量还要多几十亿次。不同的测序技术具有不同的精确度。一个序列中的高度不确定性可能会引导研究人员走向一条耗时长达一年甚至数年的错误道路。
钱恩联合了大大小小的数个基因组测序中心,如美国能源部联合基因组研究所、桑格研究所、人类微生物群系项目Jumpstart联盟测序中心、密歇根州立大学以及安大略省癌症研究所等,共同提议将现有的测序数据分类从两大类充实为6大类。这6个标准涵盖了从代表公众提交最低要求的“标准草图序列”到代表最高标准的“完成序列”,而“完成序列”的验收标准是每10万个碱基对中最多只能包含一个错误。
据了解,该项研究的目的是为了让所有主要的基因组中心和基因组研究小组都能用上符合其需要的分类基因测序数据。而为了尽可能保证基因组序列的完整性,一些较小的研究中心也可采用这个分类等级来建立和提交其研究成果,来帮助其他科学家了解既已完成的工作。
- 相关报道
-
- 河南大学最新Nature Catalysis论文,优化“液体黄金”提取工艺 (2025-01-22)
- Nature Methods:PF555——突破活细胞成像的光漂白瓶颈,开启长时程追踪新纪元 (2025-01-22)
- 湖南提升医疗保证质量 群众看病负担无效加重 (2025-01-22)
- Adv Sci:低剂量的大气压低温等离子体疗法或有望有效减缓机体肿瘤的生长 (2025-01-22)
- Nature Medicine:脑机接口,让瘫痪者也能玩电子游戏 (2025-01-22)
- 瑞金医院普外科/上海消化外科研究所于颖彦教授发表类器官活库的标准化建设与挑战综述 (2025-01-22)
- 什么时候更适合安装假肢?湖南国安一招告诉你! (2025-01-22)
- JAMA子刊:太极拳与rTMS联手出击,改善老年人睡眠和认知功能的新希望! (2025-01-21)
- 重磅!国家杰青/优青项目没了!避免“帽子化” (2025-01-21)
- Front Cell Neurosci:科学家深入探讨如何利用大脑类器官技术来揭示进行性多发性硬化症的发病机制 (2025-01-21)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040