分论坛十一:大模型与科学智能

分论坛日程

时间 报告人 单位 报告题目
08:30 - 09:00 荣钰 阿里巴巴达摩院 科学多模态大模型: 从物质科学到精准医疗
09:00 - 09:30 陆子恒 北京中关村学院 大规模机器学习驱动材料设计
09:30 - 10:00 魏颖 浙江大学 逆合成预测模型的泛化能力优化
10:00 - 10:10 场间休息
10:10 - 10:40 周浩 清华大学 AI Scientists: Scaling the Steep Summit of AGI
10:40 - 11:10 吴泰霖 西湖大学 生成模型统一框架:从多任务统一到自主智能体
11:10 - 11:40 马雷 北京大学 构建数字生命模型的一个尝试-从线虫谈起

主席简介

sub-forum-invited

黄文炳(中国人民大学)

个人简介:黄文炳,中国人民大学高瓴人工智能学院副教授,国家高层次青年人才、北京科技新星。中国人工智能学会组织工作委员会副秘书长。主要研究几何深度学习、空间智能、具身智能体等,并探索AI在医疗健康、能源材料等交叉领域的应用。主持国家级与企业项目10多项。在Nature Communications、Nature Biomedical Engineering、人工智能领域顶级会议上发表论文60余篇,谷歌学术引用1万多次,获ICLR 2023 杰出论文提名奖。担任NeurIPS、ICML、ICLR等会议领域主席,TMLR执行编辑,Nature Machine Intelligence等期刊审稿人。

讲者简介

01 构建数字生命模型的一个尝试-从线虫谈起

sub-forum-invited

马雷(北京大学未来技术学院)

个人简介:北京大学国家生物医学成像科学中心研究员、北京市杰出青年项目基金、北京大学博古睿研究中心-博古睿学者、北京智源研究院-智源学者、国家重大科技基础设施多模态跨尺度生物医学成像设施装置四负责人。研究方向为人工智能与数字生命。共计发表学术论文近72篇。近三年以第一或通讯在Nature Computational Science(2024、封面文章)、Cell Research2024、封面文章)、National Science Review(2025)、MIA(2024)、Nature Communications(2023)、ACM/IEEE汇刊等国际期刊及CVPR、NIPS、ECCV等人工智能会议发表35篇论文,代表工作包括数据驱动秀丽线虫“天宝”、精细神经元动力学快速求解算法、SCN神经元集群时间编码模型、神经形态相机等。

演讲概要:生命科学正步入数字化、智能化、系统化的新时代。数字生命研究致力于通过高精度计算模拟生命体的复杂动态,揭示生物系统在多尺度、多模态下的运行机制。本次报告将围绕数据驱动的数字生命建模,特别介绍我团队近期开发的整合“脑、身体与环境”的数据驱动秀丽线虫模拟模型(BAAIWorm),利用高精度生物神经网络仿真和物理环境的闭环建模,重现秀丽线虫的觅食行为,为神经系统的机制研究提供了新思路。此外,将简要介绍多模态跨尺度生物医学成像设施的基本情况和相关进展。

02 科学多模态大模型: 从物质科学到精准医疗

sub-forum-invited

荣钰(阿里巴巴达摩院)

个人简介:荣钰博士,IEEE Senior Member, 深圳市政府认定海外高层次人才,鹏城优才, 国际电信联盟“人工智能向善技术咨询委员会”专家委员。荣钰博士在2016年于香港中文大学获得系统工程与工程管理博士学位。2024年6月加入达摩院,任职资深技术专家,负责科学多模态方向模型研究,专注于结构数据的高效建模、跨模态智能系统构建及其在药物、医疗、材料等科学任务中的应用。 谷歌学术引用11000次,H-index 42。两篇文章入选PaperDigest最具影响力论文。 入选斯坦福大学世界Top 2%科学家。获得WAIC 2025云帆“璀璨明星”奖提名。领导研发达摩院医疗多模态大模型“灵枢”,实现在多模态医疗问答方向对GPT-4等模型的性能超越。

演讲概要:近年来,随着大模型技术的发展,人工智能正以前所未有的速度重塑科学研究和医疗实践领域。本次分享将围绕科学多模态大模型,介绍我们在物质基础模型和精准医疗领域的最新进展。具体的,ElementZero 是一个面向物质科学的统一基础模型,能够同时表征分子与晶体体系,实现跨尺度的结构—性质—功能建模。LingShu 是一个面向医疗多模态的通用大模型,融合影像、检验、病理及临床文本等多源信息。在基础医学任务中表现出卓越性能。最后,本次分享将展望科学多模态大模型的未来方向,探讨基础模型如何成为未来科学发现和精准医疗的新范式。

03 大规模机器学习驱动材料设计

sub-forum-invited

陆子恒(北京中关村学院、中关村人工智能研究院)

个人简介:陆子恒,北京中关村学院研究员,中关村人工智能研究院首席材料科学家,AI物质方向负责任人。主要研究大规模深度学习与其在材料设计领域的应用。于2018年从香港科技大学获得博士学位。曾在包括耶鲁大学、中国科学院、英国法拉第研究所、剑桥大学、微软研究院等从事研究工作。主要工作包括:开发全空间材料大模型MatterSim,在MatBench、MatBench Discovery等材料设计任务上取得榜首;开发IDEAL主动学习算法,取得了百万量级原子的在线化学精度模拟;参与开发了DiG、MatterGen等主流材料生成模型。在Nat. Mach. Intell.、 Nat. Comm.、Chem. Rev.、Angew. Chem. Int. Ed.、Adv. Energy Mater. 等杂志上发表了50多篇同行评审文章。担任多本期刊的副编辑、客座编辑,以及包括Nature和Joule等在内的10多个期刊的审稿人。

演讲概要:数字化转型正在彻底改变材料科学领域,其中深度学习处于这一范式转变的最前沿。本次报告深入探讨大规模机器学习工具的最新进展及其在材料设计领域的变革性应用。我们将重点介绍深度图学习、主动学习和生成模型在构建先进的AI模拟器中的可能性,以及如何使用AI模拟器来模拟、生成和设计新材料。我们将探讨这些由AI驱动的策略如何应用于现实世界的材料挑战,展示其在各个领域催化突破的潜力,并讨论将深度学习融入材料科学的持续努力和未来方向,以促进跨学科合作并推动这一动态且关键领域的进一步进展。

04 逆合成预测模型的泛化能力优化

sub-forum-invited

魏颖(浙江大学)

个人简介:魏颖系浙江大学计算机科学与技术学院“百人计划”研究员,国家高层次青年人才。曾任新加坡南洋理工大学“南洋”助理教授与香港城市大学助理教授。主要研究方向为机器学习及其在科学计算中的应用。在ICML、NeurIPS、ICLR等机器学习顶级会议、SCI一区期刊上共发表论文70余篇。曾获机器学习顶级会议ICLR 2024年最佳论文奖提名、数据挖掘顶级会议ACM SIGKDD 2014年最佳论文奖提名。担任机器学习顶级期刊TMLR的执行编辑、机器学习顶级会议ICML、NeurIPS、ICLR的领域主席等。

演讲概要:药物逆合成设计旨在利用计算方法预测化合物的合成路径,以指导药物研发。本报告将探讨解决在真实场景应用基于人工智能的药物逆合成算法时分布外泛化这一突出研究挑战的四个思路。首先,本报告将介绍我们提出的基于能量模型的反应增广算法,从数据层面提升泛化;其次,将介绍面向化学合成的多模态垂直领域基础模型,从学习范式层面提升泛化;最后,将介绍基于强化学习和主动学习技术的路线规划算法,从应用范式层面提升泛化。

05 AI Scientists: Scaling the Steep Summit of AGI

sub-forum-invited

周浩(清华大学智能产业研究院)

个人简介:周浩,1990年生,博士,清华大学智能产业研究院副研究员。研究方向是面向复杂符号系统的生成式人工智能,主要的应用包括超大规模语言模型,分子生成,蛋白质设计。曾任字节跳动研究科学家和副总监,领导搭建了字节跳动的文本生成中台和AI辅助药物设计两个方向的研发团队。他长期担任ICML、NeurIPS,ICLR,ACL等人工智能顶级会议的领域主席,在人工智能顶级国际会议上发表论文100余篇。他作为中心主任牵头清华AIR-字节跳动可拓展大模型智能联合研究中心,研究工业级的下一代大语言模型。曾获2019年度中国人工智能学会优秀博士论文奖、自然语言处理领域顶级国际会议ACL 2021最佳论文奖 (1/3350)、中国计算机学会NLPCC青年新锐学者奖、北京市科技新星等荣誉。

演讲概要:The development of AI over the past decade is there for all to see. In particular, the success of Large Language Models (LLMs) has turned many once-unimaginable things into reality, and the industry has set its sights on Artificial General Intelligence (AGI). However, AGI is a relatively vague concept—only with a concrete target can we accelerate its realization. In this talk, we attempt to sort out AGI’s objectives from a “End-Game” perspective, propose the concept of an “Loop of Intelligent” and argue that the AI Scientist is not only the best practice for this Loop of Intelligent, but also an intersecting closed loop of two cutting-edge directions: advanced LLMs and AI for Science (AI4S), thus holding significant research value. Finally, starting from the AI Scientist, we outline the roadmap for our recent research and present a series of our latest work, including: (1) DAPO, the most powerful open-source reinforcement learning algorithm for LLMs; (2) MemAgent, a memory technology that enables models to have unlimited context; (3) Seed-Diffusion, the world’s fastest large language model outperforming Google’s Gemini Diffusion; (4) the BFN series of models we developed for scientific modalities; and (5) AMix—the world’s first protein foundation model with test-time scaling capabilities, built on BFN.

06 生成模型统一框架:从多任务统一到自主智能体

sub-forum-invited

吴泰霖(西湖大学)

个人简介:吴泰霖,西湖大学工学院人工智能系特聘研究员,博士生导师。主要研究领域为开发机器学习方法用于大规模科学仿真、控制、设计和发现,并在能源、流体、机械等领域应用。在人工智能顶级会议和物理学顶级期刊等发表文章30余篇,其中4篇被评为热点论文。主持国家自然科学基金海外优青项目、基金委重大研究计划培育项目等。也是PNAS、Nature Machine Intelligence、Nature Computational Science等综合期刊的审稿人。

演讲概要:在科学与工程中,仿真、设计、控制和逆问题是普适并且极具挑战的任务,传统方法需开发专用模型,成本高且冗余。我们提出基于扩散模型的统一生成框架,将四类任务集成于单一模型。在流固耦合验证中,该框架不仅全面超越专用基线,还展现出优秀的泛化能力与实验数据适应性。接下来,我将介绍我们在多智能体方向的最新探索:AI工程师能在仿真环境中,根据一句话的最终目标设计并建造通用的机械结构,包括汽车、火箭与桥梁。