对化学家来说,AI革命尚未发生 |
来源:医药魔方 2023-05-23 14:49
AI大佬Geoffrey Hinton近期辞去了谷歌职务,离职原因十分明确:畅所欲言地谈论AI的风险。AI大佬Geoffrey Hinton近期辞去了谷歌职务,离职原因十分明确:畅所欲言地谈论AI的风险。
许多人担心AI走得太远,会有风险。但与这些宏观的担忧相反,在许多科学领域,有另一种观点:AI目前走得还不够远,其中一个代表性领域就是化学。机器学习工具有望在发现、合成新化合物上掀起一场革命,但现实是大规模的革命尚未发生,因为缺乏可用的数据来训练AI系统。
AI系统的好坏取决于它所接受的训练数据。如果化学家想要充分利用生成式AI工具的潜力,就需要建立庞大、可靠且无偏见的训练数据集,要有实验数据和模拟数据,还要有历史数据和来自不成功实验的数据。
以进行逆合成分析的AI工具为例,从终产物开始,然后倒推出最佳起始材料和反应步骤顺序,2018年,上海大学Mark P. Waller教授团队设计的3N-MCTS训练模型可以实现AI对于药物逆合成路线设计,化学界的AlphaGo由此诞生,引起了国内外制药领域高度关注。
为了做出准确的化学预测,AI系统需要对不同反应所涉及的特定化学结构有足够的了解。发现新反应的化学家通常会发表研究结果,但这些结果往往并不详尽。如果AI系统没有非常系统全面的知识,就可能会合成出不正确的产物。
与OpenAI开发的ChatGPT类似,如果AI要在逆向设计中超越现有的计算工具,就需要有足够的化学结构和性质相关的训练数据,需要数十万甚至数百万个数据点。
AlphaFold蛋白质结构预测工具可以说是最成功的化学AI应用了,其创建者在一个强大的数据集上对其进行了训练,这个数据集就是蛋白质数据库(Protein Data Bank,PDB)中的信息,PDB目前包含超过20万个结构。AlphaFold的例子说明AI在提供足够的高质量数据时可以拥有强大的力量。
那么,其他AI系统如何创建或访问更多更好的化学数据呢?一个可能的解决方案是建立一个系统,从已发表的研究论文和现有的数据库中提取数据,比如英国剑桥大学的研究人员创造的一种将化学名称转换为结构的算法,这种方法加速了AI在有机化学中的应用。
另一种可能方法是自动化实验室系统,如用来制造和测量化合物的机器人材料处理系统,以测试AI模型的输出。但目前这种能力相对有限,因为与人类化学家相比,这些机器人系统只能进行相对狭窄类别的化学反应。
还有一个显而易见的解决方案:AI工具需要开放数据。人们发表论文的方式必须进化,以使数据更容易获取。这也是Nature杂志要求作者将他们的代码和数据存放在开放存储库中的原因之一。
但即便如此,也不足以让AI工具充分发挥其潜力。好的训练集还应该包括负面结果的数据,比如没有产生所需物质的反应条件。另外,数据还要以一致的格式记录。只有采取措施收集和共享数据,才有可能让计算机模型比最好的人类科学家做得更好。
版权声明 本网站所有注明“来源:100医药网”或“来源:bioon”的文字、图片和音视频资料,版权均属于100医药网网站所有。非经授权,任何媒体、网站或个人不得转载,否则将追究法律责任。取得书面授权转载时,须注明“来源:100医药网”。其它来源的文章系转载文章,本网所有转载文章系出于传递更多信息之目的,转载内容不代表本站立场。不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。 87%用户都在用100医药网APP 随时阅读、评论、分享交流 请扫描二维码下载-> 医药网新闻- 相关报道
-
- Cell:王晓群/吴倩/张旭团队构建人类背根神经节类器官,为人类痛痒感觉研究建立新平台 (2024-11-23)
- Cell子刊:复旦大学迟喻丹团队等破解胶质瘤引发癫痫的隐秘链路 (2024-11-23)
- 《自然·神经科学》:贝勒医学院团队发现tau蛋白磷酸化和聚集的新机制! (2024-11-23)
- 诺华7.45亿美元合作开发SSTR2靶向核药 (2024-11-23)
- 吃得咸易痴呆?Genes Nutr研究从因果层面证实了高盐摄入对总体痴呆风险的作用 (2024-11-22)
- 大蒜——对抗酒精性肝病(ALD)的良药!Genes Nutr:大蒜素能够降低炎症因子和TLR4的表达,并提升酒精脱氢酶水平 (2024-11-22)
- Nature Genetics :肥胖与致癌基因突变的复杂关联带来对癌症预防和治疗的新启示 (2024-11-22)
- 进步下层安康科普才能,让群众心暖、身健、有奔头 (2024-11-22)
- 沈阳医保来岁将新增148个(组)药品和10类医用耗材集中带量推销 (2024-11-22)
- 你喝对果汁了吗?Food Sci. Hum. Wellness揭秘不同加工程度的果汁对健康的影响 (2024-11-22)
- 视频新闻
-
- 图片新闻
-
医药网免责声明:
- 本公司对医药网上刊登之所有信息不声明或保证其内容之正确性或可靠性;您于此接受并承认信赖任何信息所生之风险应自行承担。本公司,有权但无此义务,改善或更正所刊登信息任何部分之错误或疏失。
- 凡本网注明"来源:XXX(非医药网)"的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。本网转载其他媒体之稿件,意在为公众提供免费服务。如稿件版权单位或个人不想在本网发布,可与本网联系,本网视情况可立即将其撤除。联系QQ:896150040