分论坛三:大模型搜索与推荐

分论坛日程

时间 报告人 单位 报告题目
14:30 - 15:00 窦志成 中国人民大学 推理模型驱动的深度搜索智能体
15:00 - 15:30 卢暾 复旦大学 基于大模型Agent的人智协同推荐生态系统模拟
15:30 - 16:00 王翔 中国科学技术大学 基于大模型智能体的自主检索与推荐
16:00 - 16:30 庞亮 中国科学院计算技术研究所 大模型时代信息检索的偏差与不公平
16:30 - 17:00 钱泓锦 北京智源人工智能研究院 基于智能体的复杂信息获取系统优化
17:00-17:30 陈犇 快手 OneSearch: 电商搜索端到端生成式建模初探
17:30-18:00 罗欣晨 快手 OneRec: 以生成式技术重构推荐系统

主席简介

sub-forum-invited

赵鑫(中国人民大学)

个人简介:赵鑫,中国人民大学高瓴人工智能学院教授。2014年7月于北京大学获得博士学位,随后进入中国人民大学工作至今。研究领域为信息检索与自然语言处理,共计发表论文200余篇,谷歌学术引用3.9万余次,曾主导研发了玉兰系列大语言模型,组织编写了大语言模型综述论文《A Survey of Large Language Models》(预印版文章)以及《大语言模型》中文书(高等教育出版社出版)。曾荣获2020年吴文俊人工智能优秀青年奖、ECIR 2021时间检验奖,CCF-IEEE CS青年科学家奖。

sub-forum-invited

张骁(中国人民大学)

个人简介:张骁,中国人民大学高瓴人工智能学院准聘副教授,中国人民大学杰出学者青年学者。研究方向为:在线学习与强化学习、可信机器学习、大模型赋能的信息检索。已在本领域相关的国内外学术期刊和会议上发表论文六十余篇,获得SIGIR 2024最佳短文提名奖、VLDB 2024最佳论文提名奖、WWW 2023最佳论文提名奖,主持科技部人工智能重大专项子课题、国自然面上等科研项目十余项。

sub-forum-invited

刘沛羽(对外经济贸易大学)

个人简介:刘沛羽,对外经济贸易大学信息学院助理教授。研究方向为大规模预训练模型的存储与计算优化、参数高效表示、轻量化微调及推理优化。已在 NeurIPS、ACL、EMNLP 等国际顶级学术会议发表十余篇论文,并曾获 ACL 最佳论文提名。

讲者简介

01 推理模型驱动的深度搜索智能体

sub-forum-invited

窦志成(中国人民大学)

个人简介:窦志成,教授,博士生导师,中国人民大学高瓴人工智能学院副院长,中国计算机学会大数据专家委员会秘书长,中国中文信息学会理事,信息检索专委会副主任,CCF大模型论坛常务委员,中文信息学会大模型专家委员会委员。主要研究方向为信息检索、大模型、AI搜索、智能体、司法智能等,在国际知名学术会议和期刊上发表论文200余篇,主持开源大模型检索增强工具包FlashRAG、深度搜索模型Search-o1、WebThinker等获得星标5000余枚。曾获教育部自然科学奖一等奖、国际信息检索大会最佳论文提名奖,国际万维网大会亮点论文奖,亚洲信息检索大会最佳论文奖,全国信息检索学术会议最佳论文奖等奖励。

演讲概要:从互联网上获取信息是人类的刚需。长期以来,以关键词为查询、返回简单网页列表为特点的搜索引擎是人们获取互联网信息的主要手段,但这种简单的搜索方式无法满足用户复杂的信息需求。随着大规模推理模型的出现,通过推理模型对用户问题进行深度思考,将复杂任务拆解,进而自主调用搜索工具完成复杂信息处理任务的深度搜索(DeepSearch)和深度研究(DeepResearch)模型和智能体得到了工业界和学术界的广泛关注。在此次报告中,我将介绍在深度推理模型驱动的深度搜索智能体等方面开展的相关工作。

02 基于大模型Agent的人智协同推荐生态系统模拟

sub-forum-invited

卢暾(复旦大学)

个人简介:卢暾,复旦大学计算与智能创新学院教授、博导、副院长,上海市数据科学重点实验室副主任,复旦大学社会计算研究中心主任,美国卡耐基梅隆大学(CMU)访问学者。现为中国计算机学会杰出会员、协同计算专委秘书长,上海市计算机学会协同信息服务专委会副主任。研究方向为社会与协同计算、人智协同与交互、大模型智能体模拟推演、群智协同与系统、数字社会智能治理等。研究成果发表在CSCW、CHI、UbiComp、NeurIPS、ICLR、WWW、SIGIR、IEEE TKDE、ACM TOIS等领域权威会议和期刊上,曾共同获得过包括CSCW在内的多个国际学术会议最佳论文(提名)奖,常规担任CHI、CSCW等的AC,担任多个国内外知名学术会议的程序委员会(共同)主席,以及多个国内外学术期刊的副主编和编委。

演讲概要:人智协同推荐生态系统是由消费者、生产者、协调者等多种参与主体与AI深度嵌入融合,所形成的动态更新、迭代互动和持续演化的复杂动态社会技术系统。在推荐生态系统中感知潜在风险、把握演化趋势、调控生态平衡,是实现信息服务算法推荐全周期和跨尺度监管与调控的关键。传统单一视角的研究方法难以深入理解和全面剖析推荐生态系统的演化机理及调控路径,存在着演化调控过程不可知和实验不可控的突出问题。大模型Agent模拟技术在角色扮演、行为调节和社会模拟等方面有着独特的优势,为解决这些问题提供了新思路。报告将从HCI+AI的跨学科视角分享团队主要代表性工作,以期为该方向研究提供有益思路。

03 基于大模型智能体的自主检索与推荐

sub-forum-invited

王翔(中国科学技术大学)

个人简介:王翔,中国科学技术大学特任教授、博导,国家青年人才。研究兴趣:信息推荐与挖掘、大模型、可信人工智能等,在相关领域的国际顶会(如SIGIR、WWW、NeurIPS、ICLR)和顶刊(如IEEE TPAMI、ACM TOIS)上发表论文70余篇,谷歌学术引用3万余次,H-因子60,Elsevier中国高被引学者,其中10余篇论文入选国际会议最具影响力论文列表和最佳论文候选。2025年获得人工智能国际顶会ICLR杰出论文奖,2025年、2023年两次获国际基础科学大会前沿科学奖,2024年获ACM SIGIR青年学者奖和吴文俊人工智能自然科学一等奖,2024年入选《麻省理工科技评论》MIT TR35榜单、AI100青年先锋。

演讲概要:本报告聚焦大模型智能体在自主检索与推荐中的最新进展。我们提出“思考-检索-精炼”的新范式 AutoRefine,实现对外部知识的迭代精炼,显著提升多跳问答等复杂任务表现;揭示推理强度的可预测与可控机制,通过内部激活方向与幅度实现推理过程的规划与调节;在推荐场景中,提出 RecZero 与 RecOne,以GRPO强化学习统一推理与预测,突破对教师模型依赖并优化冷启动表现。这些工作展示了大模型在知识精炼、推理控制与智能推荐上的自主化路径。

04 大模型时代信息检索的偏差与不公平

sub-forum-invited

庞亮(中国科学院计算技术研究所)

个人简介:庞亮,中国科学院计算技术研究所副研究员,新加坡国立大学访问学者,研究方向为自然语言生成和信息检索。在国际会议发表过论文60余篇,谷歌引用超4000。担任中文信息学会信息检索专委会常务委员,中文信息学会青工委副主任,北京市科技新星、中国科学院青促会会员,ACL/EMNLP 等会议领域主席。曾获中文信息学会优秀博士学位论文奖,CIKM最佳论文候选,SIGIR最佳论文提名,电子学会科技进步一等奖。NeurIPS18多智能体挑战赛冠军,HotpotQA多跳开放问答位连续三年榜单第一。

演讲概要:随着大语言模型的快速发展,搜索引擎、推荐系统等信息检索系统因与 LLM 的融合,已发生范式转移。然而,将 LLM 融入信息检索流水线也带来了新的挑战,尤其是以偏差和不公平性为表现形式的问题,这类问题可能会破坏信息生态。首先我们将偏差与不公平性问题统一界定为 “分布失配” 问题,并进一步将缓解策略归为 “分布对齐” 的框架下;随后,我们分别讨论“源偏差”现象和“隐式不公平”问题及其解决方案。希望能帮助信息检索领域及其他相关领域的研究者与利益相关者,提高对大语言模型时代下偏差与不公平性问题的关注度。

05 基于智能体的复杂信息获取系统优化

sub-forum-invited

钱泓锦(北京智源人工智能研究院)

个人简介:钱泓锦,北京智源人工智能研究院助理研究员,北京大学联合博士后。主要研究方向为自然语言处理和信息检索,在 NeurIPS、ACL、SIGIR、KDD 等国际顶级会议和期刊上发表论文二十余篇,相关开源项目在 GitHub 上获得数千次星标。

演讲概要:复杂信息获取不同于传统搜索,它要求对任务进行意图分解、多步推理和跨源信息聚合,才能得到可靠答案。在这一过程中,智能体作为一种自主决策与信息整理的范式,展现出独特优势。本报告将围绕“基于智能体的复杂信息获取系统优化”展开,重点探讨智能体如何在应对复杂问题时提升效率与效果。具体而言,将从数据驱动与策略驱动两个角度,分析优化智能体在信息检索、任务分解与知识整合中的方法与实践,以展示其在构建智能化信息系统中的潜力与前景。

06 OneSearch: 电商搜索端到端生成式建模初探

sub-forum-invited

陈犇(快手)

个人简介:陈犇,快手算法专家,长期专注于多模态匹配,生成式检索和电商搜索算法的研究与落地。研究方向为:图文多模态匹配,冷启动搜索&推荐,大模型RAG。已在TKDE、CVPR、WWW、SIGIR、AAAI等国际顶级学术期刊和会议发表论文二十余篇。并长期致力于推动LLM和多模态在搜推系统中的演进与突破。 在快手期间,曾主导多项关键搜推算法项目的研发和逻辑,其代表工作包括UniECS、InfoGain-RAG、OneSug、OneSearch等,在提升业务转化和系统效率方面取得了显著成果,并将持续探索多模态、生成式技术在电商搜推场景中的应用潜力。

演讲概要:传统的搜索系统采用级联式架构,采用各层漏斗式过滤的方式实现业务转化和系统效率的均衡。但是各阶段不一致的优化目标,导致了很多潜在的意图item会被丢弃,从而拉低了整个搜索系统的上限。近年来,随着LLM的发展,交互式对话和生成式推荐得到了快速发展,但有着用户搜索词强约束的搜索系统,却面临着语义相关和转化效率之间的艰难平衡。在这次报告中,我将介绍快手用生成式技术重构搜索系统的工作 OneSug & OneSearch,我们尝试直接利用端到端建模来简化搜索系统,在显著节省算力的同时,通过生成式推理来进一步提升搜索体验和业务转化。

07 OneRec: 以生成式技术重构推荐系统

sub-forum-invited

罗欣晨(快手)

个人简介:罗欣晨,快手算法专家,专注于推荐系统与多模态算法的研究与实践。在Ai Infra、推荐算法及多模态模型等方向拥有深厚积累,长期致力于推动推荐系统核心技术的演进与突破。 在快手期间,曾主导多项关键推荐算法项目的研发与落地,其代表工作包括QARM、OneRecV2等,在提升推荐效果与系统效率方面取得了显著成果,并持续探索生成式技术在重构下一代推荐系统中的应用前景。

演讲概要:Scaling Law 驱动了 LLM 的发展。回顾推荐技术发展历程,推荐领域存在明显的广义 Scaling Law:从简单规则到线性模型,再到深度学习引入推荐,随后是行为序列建模,每一次技术升级都伴随推荐模型算力的膨胀,也带来了显著的推荐效果提升。在这次报告中,我将介绍快手用生成式技术重构推荐系统的工作 OneRec,我们利用生成式技术简化推荐系统,进一步提升算力到推荐效果的转化效率。