AI驱动的大型语言模型在化学空间探索中的应用:精准导航过渡金属配合物的HOMO-LUMO能隙,进化优化算法助力目标分子发现

现代化学探索的革命:LLM-EO助力高效化学空间优化

在现代科学研究中,化学空间的探索一直是化学发现和材料科学的核心挑战之一。特别是在过渡金属配合物(TMCs)的设计中,庞大的化学空间使得多目标优化变得异常困难。为了解决这一难题,「深度原理」(Deep Principle)和康奈尔大学的研究团队共同开发了一种名为LLM-EO(Large Language Model for Evolutionary Optimization)的新型工作流程算法,该算法充分利用了大型语言模型(LLM)的生成和预测能力,显著提升了化学空间探索的效率。

LLM-EO的工作原理

LLM-EO是一种创新的优化框架,将大型语言模型的生成能力与进化优化算法相结合,专门用于高效优化化学空间。其工作原理基于LLM在预训练过程中积累的丰富化学知识和生成能力。每次迭代时,LLM会根据自然语言描述的设计目标和约束条件生成新的过渡金属配合物(TMCs)。这些生成的TMCs被整合到提示中,作为下一次迭代的知识基础,从而实现进化优化。

与传统的进化优化算法(如遗传算法)相比,LLM-EO具有三大优势:
1. 灵活的目标控制:LLM-EO允许使用自然语言表达更灵活和细致的优化目标,无需复杂的数学公式。这种灵活性使得研究人员能够快速调整优化策略,以适应不同的研究需求。
2. 优化效率的提升:LLM中嵌入的丰富化学知识和其从少量样本中学习的能力显著提高了优化效率。通过利用LLM的强大推理能力,LLM-EO能够在较少的实验次数下获得更优的结果。
3. 新化学结构的生成设计:LLM的生成能力使LLM-EO不仅能够高效地搜索预定义的化学空间,还能创造性地生成新的TMCs。LLM-EO能够提出具有创新性的化学结构,突破传统设计的限制。

实验结果与性能分析

LLM-EO在化学空间中的高效探索

LLM-EO利用其丰富的化学知识,成功识别出具有大HOMO-LUMO能隙的化合物,表现优于传统基准算法。Claude-3.5-sonnet和o1-preview模型在有效性和独特性指标上也表现出色。尤其在提供少量初始TMCs的情况下,这两个模型展现了在复杂化学空间中识别高潜力化合物的能力。相比之下,o1-mini和GPT-4o在所有评估指标上表现较差,这可能是由于基础模型规模较小或其推理能力不足。

LLM-EO在优化关键属性时的表现

在优化HOMO-LUMO能隙这一关键属性时,LLM-EO凭借其高效的迭代搜索能力,不仅能够更快地识别关键化合物,还能充分利用历史数据。在仅评估200个TMCs的情况下,LLM-EO成功识别出了前20个HOMO-LUMO能隙最大的TMCs中的8个,占1.37M设计空间的0.015%。这充分展示了LLM-EO在大规模化学空间中的探索能力。

LLM-EO提供的灵活多目标优化能力

通过自然语言提示工程,研究人员可以在不依赖复杂数学公式的情况下,灵活地调整优化目标。例如,在优化HOMO-LUMO能隙和极化率时,LLM-EO能够同时考虑这两个性质,根据提示词的不同,进行不同目标的双性质优化。这种灵活性使得LLM-EO在实验室环境中实现闭环优化成为可能。

LLM-EO生成新的配体结构

利用LLM的生成能力,LLM-EO可以提出具有独特化学性质的新配体和TMCs,大大加速了优化过程。我们在单性质优化和多性质优化的场景下进行了测试,结果表明LLM-EO有能力生成原化学空间之外的配体化合物结构,这种能力突破了传统化学直觉定义的化学空间,开启了创新化合物设计的无限可能。

未来展望

随着大型语言模型的不断发展,LLM-EO的能力将持续提升。「深度原理」的创始人兼CTO段辰儒表示:“在化学方面,LLM初步展示出人类平均的智能水平。但平均水平在前沿科学探索是完全不够的。我们旨在使用外接的工作流程激发LLM的潜能,助使其完成一系列顶尖科学家才有可能做到的事情。” 「深度原理」的机器学习带头人陆婕妤补充道:“我们相信,LLM-EO不仅为化学空间的探索提供了一种全新的视角,还将在未来的药物设计和材料发现中发挥重要作用。通过不断优化和扩展LLM-EO的应用,我们期待在科学研究的多个领域实现更高效、更智能的化学设计。”

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...