分论坛十四:大模型记忆与持续学习

分论坛日程

时间 报告人 单位 报告题目
08:30 - 09:00 陈旭 中国人民大学 大模型智能体记忆机制及其应用
09:00 - 09:30 李志宇 记忆张量 大模型记忆操作系统框架设计与研究挑战
09:30 - 10:00 李鹏 清华大学 AIM:AI数学家系统
10:00 - 10:30 场间休息
10:30 - 11:00 吴乐 合肥工业大学 个性化推荐大模型前沿进展
11:00-11:30 雷文强 四川大学 智能体的革命:聚焦核心要素与能力演进
11:30-12:00 周杰 华东师范大学 从数据驱动到经验驱动的终身学习

主席简介

sub-forum-invited

王昊奋(同济大学)

个人简介:王昊奋,同济大学百人计划特聘研究员、博导,研究知识图谱、自然语言处理与知识增强大模型。OpenKG轮值主席、AGI‑Eval发起人、AI‑Ceping主理人,著有《自然语言处理实践》《知识图谱方法、实践与应用》。曾在WAIC、IJCAI、VLDB做演讲,长期任NeurIPS、AAAI、WWW等顶会程序委员。主持10余项国家级项目,发表百余篇论文,多次获最佳论文。获上海市优秀博士、徐汇区学科带头人、中交协科技进步一等奖。构建全球首个可交互养成的虚拟偶像“琥珀.虚颜”,领导研制的电商智能客户机器人累计服务用户数超10亿人次。

讲者简介

01 大模型智能体记忆机制及其应用

sub-forum-invited

陈旭(中国人民大学)

个人简介:陈旭,中国人民大学高瓴人工智能学院预聘副教授,博士生导师,。主要研究方向为大语言模型、强化学习、信息检索和因果推断等,发表高水平论文80余篇,谷歌引用1万余次。带领团队撰写大模型智能体领域的早期综述《A Survey on Large Language Model based Autonomous Agents》,构建“大模型+社会科学”模拟仿真平台“玉兰-万象”(见https://ruc-gsai.github.io/YuLan-OneSim/)。荣获多项著名国际会议的最佳论文奖或提名(TheWebConf 2018,CIKM 2022 Resource,SIGIR-AP 2023, MM Asia 2024, AIRS 2017),荣获 CCF 自然科学二等奖,CIPS 钱伟长青年创新奖,ACM-北京新星奖等荣誉。长期担任NeurIPS、ICLR等会议领域主席,担任期刊ACM Transactions on Recommender Systems的编委。

演讲概要:随着大语言模型(LLM)的快速发展,基于大模型的智能体(AI Agents)在社会模拟、人机交互与自动决策等任务中展现出广阔潜力。智能体的核心挑战之一在于如何实现 长期、动态且可控的记忆机制,以支持其在复杂环境中的连续推理与适应能力。本报告聚焦大模型智能体的个性化记忆机制及其在社会模拟中的应用。通过引入短期、长期与情境记忆的结合,智能体能够在复杂交互中保持连续性与个体差异,支持更真实的人类行为建模。我们展示了记忆机制在群体协作、社会行为演化及治理实验平台中的应用,验证其在提升智能体一致性、个性化响应与社会模拟可信度方面的价值。

02 大模型记忆操作系统框架设计与研究挑战

sub-forum-invited

李志宇(记忆张量(上海)科技有限公司)

个人简介:李志宇,博士,记忆张量(上海)科技有限公司联合创始人兼 CTO、上海算法创新研究院大模型中心研究员。长期从事预训练和大模型方向的研发技术攻关,主要研究方向包括大模型记忆增强与高效评估。曾在阿里巴巴、小红书等头部科技企业带队承担多个核心算法项目,技术成果服务双十一、社交营销广告等超大规模业务场景,累计带来数十亿营收。近期联合多个学术/产业机构提出业内首个大模型记忆操作系统( MemOS )并开源,两个月左右获得2500+ Github Stars,为大模型的记忆增强落地提供了可行的探索路径。相关技术成果已在中国银行、招商证券、中国电信、新华社等多家国央企落地应用。当前已在 Patterns(Cell Press)、ICLR、ACL、TKDE等国际会议期刊发表论文40余篇、引用近千次、授权专利 10 余项,现任中国中文信息学会信息检索专委会委员、大模型与生成专委会委员,相关研究工作入选《麻省理工科技评论》封面报道。

演讲概要:随着大模型在产业中的加速应用,记忆机制已成为国际主流研究机构与产业界的重要关注方向。然而,当前模型在短时遗忘、知识碎片化与跨任务信息留存方面仍存在不足,这在一定程度上限制了其个性化适配、复杂推理与持续演化能力。本报告将系统讨论基于记忆操作系统框架的关键工程化技术,包括记忆分层管理、多粒度调度与记忆评估方法,并从实践角度讨论记忆框架所面临的难点研究问题。报告旨在为研究者与开发者提供构建记忆增强型人工智能的技术参考,并探讨其在未来大模型智能化演进中的潜在价值。

03 AIM:AI数学家系统

sub-forum-invited

李鹏(清华大学)

个人简介:李鹏,清华大学智能产业研究院副研究员,主要研究兴趣包括大模型、智能体、AI4Math等,在人工智能重要国际会议与期刊发表论文90余篇,曾获ACL 2023杰出论文奖,曾在多个国际上深具影响力的榜单上超过Google Research、OpenAI等团队获得第一名,主持科技创新2030重大项目课题、国家自然科学基金面上项目等科技项目,曾任ACL、EMNLP、NAACL等重要国际会议领域主席等。研究成果在百度、腾讯微信等千万级日活产品中获得应用并取得显著成效,获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖。

演讲概要:数学作为科学进步的重要基石,长期支撑着各学科的发展与突破。近年来,人工智能(AI)的迅猛发展正推动科学研究范式发生深刻变革,也为数学研究带来了前所未有的机遇与挑战。那么,当AI遇见数学会迸发出怎样的“化学反应”呢?本报告将回顾AI在数学发展中的作用与影响,探讨在数学研究中引入AI所面临的核心挑战,并重点介绍本团队研发的面向研究级数学问题的AI数学家系统AIM。最后,报告将展望AI技术在助力数学发现、定理证明等方面的应用前景,探讨AI与数学深度融合对未来科学创新生态可能产生的深远影响。

04 个性化推荐大模型前沿进展

sub-forum-invited

吴乐(合肥工业大学)

个人简介:吴乐,合肥工业大学计算机与信息学院教授,博士生导师。主要研究领域包括数据挖掘、个性化推荐、因果推断应用研究等。近五年在知名国际期刊及国际会议发表论文七十余篇。主持科技部新一代人工智能国家科技重大专项、国自然基金重点项目、国家级青年人才项目等国家级、省部级及应用合作项目数十项。研究成果获得了华为火花奖,入选了安徽省新时代青年先锋、全球华人AI学者榜单、中国科协青年人才托举工程,获得了吴文俊人工智能优秀青年奖、中国人工智能学会优秀博士论文奖等。担任了IEEE Trans. on Big Data, AI OPEN期刊编委,及多个顶级国际会议组委会成员或者程序委员会委员。

演讲概要:传统个性化推荐多基于单领域数据设计模型,精确度与通用性较差。近年来,随着大模型技术发展,研究人员尝试融合多领域用户数据设计推荐大模型。如何将大模型通用知识迁移到个性化推荐实现个性化推荐领域适配?如何融合多个推荐领域数据避免个性化推荐负迁移现象?如何设计推荐大模型高效更新方法以适用用户兴趣演化?本报告中,将介绍课题组近期在上述几个问题中的思考与进展,并进一步探讨个性化推荐大模型发展对研究领域带来的机会与挑战。

05 智能体的革命:聚焦核心要素与能力演进

sub-forum-invited

雷文强(四川大学)

个人简介:雷文强,四川大学教授、博导、计算机学院院长助理、国家级青年人才。博士毕业于新加坡国立大学,主要研究人工智能、自然语言处理、大模型技术。在CCF-A类期刊/会议上发表论文数十篇,多篇论文短时间内引用上百,成为国际主流参考文献,获得国际多媒体领域最高会议ACM MM 2020最佳论文奖,国际自然语言处理领域最高会议ACL 2024领域主席奖。担任各大国际顶会(资深)领域主席近十次。主持国家重点研发计划课题等,研发技术成功应用于湖南省高级人民法院、国家电网、QQ音乐、蚂蚁金服等政府部门、央国企、一线互联网大企业的实际业务中,服务千万级以上用户,日均访问量达亿级。

演讲概要:大模型为Agent的能力发展带来了前所未有的机遇,智能体也被誉为大模型落地的一个非常有希望的场景。本报告拟从知识推理与交互两大核心能力展开,分别分析大模型在两方面能力的进展,并且提出一些可以进步的方向。

06 从数据驱动到经验驱动的终身学习

sub-forum-invited

周杰(华东师范大学)

个人简介:周杰,华东师范大学青年研究员(紫江青年学者),博士生导师,主要研究方向为自然语言处理、持续学习、大模型等,在 AAAI、ACL、ACM Computing Survey 等重要国际会议和学术期刊上发表了论文50余篇,以项目负责人主持国家自然科学基金面上项目、上海市经信委人工智能专项等科研项目多项。Google学术引用2000余次,获得 COLING 2022杰出论文奖,中国工程院院刊 FITEE封面论文,上海市科技进步二等奖,上海市扬帆计划等荣誉。

演讲概要:正如强化学习之父 Richard Sutton 所言:“人类的数据红利正逼近极限,人工智能正迈入以持续学习为核心的‘经验时代’。”在这一范式转变下,如何让智能体像人类一样“边工作边学习”,在真实环境中不断积累经验、提炼知识,并实现 模型的自进化,从而成长为一名具备持续成长能力的“AI员工”,已成为智能体研究的关键命题。本报告聚焦“经验驱动的终身学习”这一前沿方向,系统构建涵盖经验探索、长期记忆、技能学习与知识内化四大核心能力的智能体学习框架。同时,报告全面梳理当前经验驱动终身学习领域的评估基准和典型挑战,为构建具备人类式学习能力的下一代智能体提供理论支撑与实践路径。