微生物学领域数据库和分析系统建设的研究进展 |
![]() |
中国科学院计算机网络信息中心大数据技术与应用开发部、微生物研究所等。在微生物学领域的数据库和分析系统建设方面取得了新的进展,提出了利用语义网技术构建知识图谱的方法,可以将冠状病毒相关的毒株、基因组、蛋白质序列、蛋白质结构、抗体、文献、专利等多源异构数据映射到资源描述框架(RDF),构建基于语义网框架的gcCov知识图谱数据库。GcCov包含超过6000万个语义三元组。通过多源异构数据的语义集成,GCCOV支持大规模数据驱动的知识发现。具有分析基因、结构、抗体等数据相关性的能力,有助于推动未来病毒基础机制研究和药物、疫苗设计。相关研究成果发表在mLife上。
近几十年来,冠状病毒持续威胁全球公共健康。对新型冠状病毒的研究非常广泛,相关出版物的数量也迅速增加。海量的科研数据推动不同类型的研究整合成一个可搜索的语义互联数据集,这是相当具有挑战性的。目前可用的冠状病毒数据库主要集中在基因组分析领域(如CovDB1和ViPR2)或发表领域(如LitCovid3)。然而,这些数据库没有建立基因组数据与其他类型信息(如论文、专利和抗体)之间的关联,这阻碍了进一步的知识发现。
语义网可以将分布式网络资源整合到共享本体的知识库中,研究对象之间的潜在关系是生物医学数据集成的有效解决方案。为了分析海量数据之间的关系,提出了一套管道方法,将不同来源的数据整合到语义web框架中。在此基础上,本研究构建了gcCov数据库,并利用LinkOpen数据提供了冠状病毒的广泛信息和关系。GcCov是首个也是唯一一个利用关联开放数据基于语义web框架发布的冠状病毒数据库,帮助科学家检测关联数据之间的联系,发现隐藏在海量数据中的新知识。GcCov为当前和治疗策略提供线索,是满足冠状病毒研究日益增长的信息需求的重要工具。
数据处理管道示意图
医药网新闻
- 相关报道
-
- 民泰医药全面升级:2025年搬迁新址,打造中药智能化生产新标杆 (2025-07-11)
- 第一次为爱鼓掌要做好准备!快男备好爱廷玖盐酸达泊西汀 (2025-07-11)
- 《Science》刊发上海六院与复旦大学脑科学转化研究院联合成果:揭示造血干细胞移植治疗致死性遗传性脑白质病的有效性及其核心机制 (2025-07-11)
- 青海首批外乡产3D打印医疗东西获批上市 (2025-07-11)
- 全国药品运营监管任务会暨“清源”行为推动会召开 (2025-07-11)
- 软骨发育不全等86个常见病病种诊疗指南宣布 (2025-07-11)
- 700亿美元并购风暴,制药巨头狂砸CNS赛道的背后 (2025-07-11)
- 乳酸菌竟是心梗救治的隐形卫士?BMC Med研究揭秘:通过多重机制减轻心肌缺血再灌注损伤 (2025-07-11)
- 中国科学院发表最新Cell论文 (2025-07-11)
- 《自然》:“扭断”Tau纤维!UCLA团队发明可自组装短肽,与Tau纤维结合后会释放结构应力,让Tau纤维断裂成无毒碎片 (2025-07-11)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040