西湖大学推出「AI科学家」Nova大模型,大幅提升科研效率与跨学科创新能力,效果超越SOTA竞品2.5倍

科学创新与AI的碰撞

伟大的科学研究往往源于一个小小的灵感或创意。长期以来,科学创新与研究能力被认为是人类在人工智能时代中保持的独特优势。然而,西湖大学深度学习实验室的一篇论文在科学界引起了巨大反响。该论文介绍了一种全新的方法——利用大型语言模型来生成大量具有突破性的科学构想。只需一篇前沿的学术文章作为起点,该模型就能激发出数百个有创意且高质量的科研想法。

AI能否取代人类科学家?

西湖大学蓝振忠团队联合浙江大学、电子科技大学等多所高校,共同研发了“Nova大模型”。该模型能够生成大量突破性的科研想法,在创新性、价值性和可行性等方面可以媲美甚至超过人类科学家。论文链接:https://arxiv.org/abs/2410.14255

研究成果展示

研究团队提出的方法显著提升了高质量想法的生成能力。通过对最近170篇与大语言模型相关的论文(来自ACL、ICLR、CVPR等顶级会议)进行测试,Nova模型生成的高质量想法数量(根据Si等人在2024年提出的瑞士制排名赛评分来衡量)至少比全球顶尖机构(如斯坦福、微软)现有模型多2.5倍。

Nova模型的工作原理

模型之所以能够有效提升高质量想法的生成数量,是因为研究团队引入了一种增强的规划和搜索方法。该方法能够帮助模型检索外部知识,逐步丰富想法,使其包含更广泛和深入的见解。

实际应用案例

例1:癌症治疗

假设你是一位致力于癌症治疗研究的科学家,正试图寻找一种新的治疗手段。你将一篇关于免疫疗法的论文输入Nova系统作为种子。Nova随即生成了一些初步的想法,如“结合CRISPR基因编辑技术和CAR-T细胞疗法,针对肿瘤微环境中的特定免疫抑制因子。”接下来,Nova通过迭代规划和检索机制,进一步细化和完善这些初步的概念,最终形成一个详细且创新的研究计划。

例2:人工智能教育技术

假设你是一位专注于人工智能教育技术的研发者,希望开发一种能够个性化教学的人工智能系统。你将一篇关于自适应学习算法的论文输入Nova系统作为种子。Nova随即生成了一些初步的想法,如“结合情感计算与自适应学习算法,开发一种能够感知学生情绪状态并相应调整教学策略的人工智能系统。”通过迭代过程,最终形成一个既具有创新性又可行的研究方案。

例3:环境科学

假设你是一位环境科学研究员,致力于开发新的可持续能源解决方案。你将一篇关于太阳能电池效率提升的论文输入Nova系统作为种子。Nova随即生成了一些初步的想法,如“利用石墨烯增强太阳能电池的光电转换效率。”通过检索最新的材料科学文献,进一步细化和完善这些初步的概念,最终形成一个既有科学依据又具有实用性的研究计划。

研发初衷

蓝振忠表示,科研工作虽然前沿且具探索性,但实际组织方式却非常传统,甚至像手工作坊。科研工作者的一天通常从阅读论文开始,记录新想法,查阅相关资料,深度阅读几篇论文,参加组会讨论,进行头脑风暴。这样的工作模式难以跟上有价值的论文产生速度,且跨学科创新受限于科学家的学科背景和经验。如果有一个AI模型能够帮助科学家提升效率,科研进展将会突飞猛进。

训练难点

训练Nova模型需要克服许多困难。研究团队借鉴了生物进化的原理,将人类的创新方法论融入模型的推理过程中。模型通过迭代规划和搜索不断产生新的想法,这是一种持续“探索-学习-进步”的自我进化算法原理。

评估与验证

研究团队在质量、多样性和新颖性三个方面对Nova模型进行了全面的自动化评估。结果显示,Nova模型在所有方面都显著优于其他基线方法。此外,研究团队还进行了人工评估,邀请了10位专家(包括博士、博士后和资深教授)对生成的想法进行全面评估,Nova模型在整体质量和新颖性方面均获得了最高分。

未来展望

蓝振忠和他的团队为Nova模型制定了明确的发展路径。从单个学科的创新开始,逐步扩展到多学科领域,最终实现模型的自驱科学探索和商业创新,推动人类的科学突破与产业提升。

本文来源: 机器之心【阅读原文】
© 版权声明

相关文章

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...