您的位置:医药网首页 > 医药资讯 > 医药行业分析 > 微生物学领域数据库和分析系统建设的研究进展

微生物学领域数据库和分析系统建设的研究进展

中国科学院计算机网络信息中心大数据技术与应用开发部、微生物研究所等。在微生物学领域的数据库和分析系统建设方面取得了新的进展,提出了利用语义网技术构建知识图谱的方法,可以将冠状病毒相关的毒株、基因组、蛋白质序列、蛋白质结构、抗体、文献、专利等多源异构数据映射到资源描述框架(RDF),构建基于语义网框架的gcCov知识图谱数据库。GcCov包含超过6000万个语义三元组。通过多源异构数据的语义集成,GCCOV支持大规模数据驱动的知识发现。具有分析基因、结构、抗体等数据相关性的能力,有助于推动未来病毒基础机制研究和药物、疫苗设计。相关研究成果发表在mLife上。

近几十年来,冠状病毒持续威胁全球公共健康。对新型冠状病毒的研究非常广泛,相关出版物的数量也迅速增加。海量的科研数据推动不同类型的研究整合成一个可搜索的语义互联数据集,这是相当具有挑战性的。目前可用的冠状病毒数据库主要集中在基因组分析领域(如CovDB1和ViPR2)或发表领域(如LitCovid3)。然而,这些数据库没有建立基因组数据与其他类型信息(如论文、专利和抗体)之间的关联,这阻碍了进一步的知识发现。

语义网可以将分布式网络资源整合到共享本体的知识库中,研究对象之间的潜在关系是生物医学数据集成的有效解决方案。为了分析海量数据之间的关系,提出了一套管道方法,将不同来源的数据整合到语义web框架中。在此基础上,本研究构建了gcCov数据库,并利用LinkOpen数据提供了冠状病毒的广泛信息和关系。GcCov是首个也是唯一一个利用关联开放数据基于语义web框架发布的冠状病毒数据库,帮助科学家检测关联数据之间的联系,发现隐藏在海量数据中的新知识。GcCov为当前和治疗策略提供线索,是满足冠状病毒研究日益增长的信息需求的重要工具。

数据处理管道示意图

医药网新闻
返回顶部】【打印】【关闭
扫描100医药网微信二维码
视频新闻
图片新闻
医药网免责声明:
  • 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
  • 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040