Nature Methods:GPT |
![]() |
近年来,随着组学技术(omics technologies)的迅猛发展,研究人员能够以前所未有的深度和广度揭示基因、蛋白质以及代谢物在不同生物学过程中的作用。然而,这些高通量技术所产生的大量数据也带来了前所未有的分析挑战。如何从这些复杂数据中识别出具有生物学意义的基因集功能,成为现代基因组学研究的重要课题之一。
传统的基因功能富集分析(functional enrichment analysis)是基因集的主流方法,依赖于如Gene Ontology (GO)、KEGG和Reactome等人工整理的数据库。这些数据库为基因的生物学功能分类提供了重要依据,但其局限性也日益显现。首先,这些数据库往往不完整,对新发现的基因或功能的覆盖不足;其次,对于尚未深入研究的基因簇,即使显著性结果明显,实际生物学关联仍可能不强。在这种背景下,研究人员需要借助文献和其他数据集,通过费时费力的方式推断基因集的潜在功能。
最近,生成式人工智能(Generative AI)的兴起为基因功能分析带来了全新的解决方案。大语言模型(Large Language Models, LLMs)作为生成式人工智能的核心技术,具备从庞大文献数据中学习复杂模式的能力,能够生成具有逻辑性的文本。研究者们已经开始探索利用LLMs提取基因组学数据中隐藏的信息,生成可能的功能假设,并验证其合理性。
11月28日Nature Methods的研究报道Evaluation of large language models for discovery of gene set function,首次系统性评估了五种前沿LLMs(包括GPT-4、Gemini Pro和Mixtral等)在基因功能发现中的表现。通过两项任务:文献整理基因功能的能力及组学数据中基因簇功能的探索,研究验证了LLMs在生物学功能分析中的潜力,并指出了其局限性。研究发现,LLMs不仅能够提供与现有数据库一致的基因功能描述,还在某些情况下提出了更广泛且合理的生物学解释。这一发现为LLMs在基因组学中的应用开辟了新的可能性,也为未来的智能化科学研究奠定了基础。
医药网新闻
- 相关报道
-
- Nature:DNA的“俄罗斯套娃”——PADIT-seq揭示了一个颠覆教科书的转录因子结合新模型 (2025-09-07)
- 南昌大学最新Cell子刊论文:这款国产降糖药,可发挥多种抗衰老作用 (2025-09-07)
- 《科学》:PM2.5,让毒蛋白更毒!超5600万人分析发现,PM2.5会增强病理蛋白致病性,与路易体痴呆风险升高有关 (2025-09-07)
- 《癌细胞》:CAR-NK有望升级!科学家开发NK细胞全基因组筛选平台,找到三个可增强CAR-NK细胞抗肿瘤能力的关键调控因子 (2025-09-06)
- Nature:从基因组伤痕到转录组静默——单细胞多组学揭示大脑衰老的因果链条 (2025-09-06)
- 糖尿病治愈新希望:CRISPR基因编辑细胞在人体内分泌胰岛素,且无需使用免疫抑制药物 (2025-09-06)
- 巴基斯坦首款 | 迈威生物地舒单抗注射液海外首次获得上市许可 (2025-09-05)
- 领跑GLP-1月制剂赛道,质肽生物佐维格鲁肽重磅Ⅱ期数据即将亮相EASD (2025-09-05)
- 普通感冒竟能“防新冠”?!最新研究:感染鼻病毒后 30 天内,新冠感染风险能降低近一半 (2025-09-05)
- 癌症和自身免疫病有救了?Nat Biomed Eng:特殊的定制化蛋白或能帮助机体移除有害细胞,攻克癌症与自身免疫病有新招 (2025-09-05)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040