分论坛十二:大模型与具身智能
分论坛日程
| 时间 | 报告人 | 单位 | 报告题目 | |
| 08:40 - 09:10 | 查正军 | 中国科学技术大学 | 以人为中心的3D交互理解与重建研究 | |
| 09:10 - 09:40 | 陈超 | 重庆大学 | 智能移动抓取:Affordance检测与移动站位优化 | |
| 09:40 - 10:20 | 张栋 | 西北工业大学 | 飞行器集群协同任务规划与自主决策技术探讨 | |
| 10:20 - 10:50 | 场间休息 | |||
| 10:50 - 11:20 | 苏洲 | 西安交通大学 | 生成式人工智能安全防御与安全赋能关键技术 | |
| 11:20 - 11:50 | 盛律 | 北京航天航空大学 | 面向具身智能的大小模型协同算法研究和实践 | |
主席简介

林倞(中山大学)
个人简介:国家自然基金委青A(杰青)项目获得者,Fellow of IEEE/IAPR/IET,广东省大数据分析与处理重点实验室主任。长期从事多模态人工智能、机器学习等领域的应用基础研究,主持科技部人工智能重大项目,国家自然基金委重点项目,入选国家万人计划青拔人才;曾任商汤科技研究院执行院长/首席研发总监,带领企业研发团队搭建大规模AI基础设施,开拓新兴行业。在国际顶级学术期刊和会议发表论文400余篇,论文被引用4万余次(谷歌学术统计),H因子>103,多次入选全球高被引学者榜单;获权威期刊Pattern Recognition年度最佳论文奖,多媒体计算旗舰会议ICME最佳论文钻石奖,计算机视觉旗舰会议ICCV最佳论文奖提名;获广东省科技进步一等奖,中国图像图形学会科学技术一等奖、吴文俊人工智能自然科学奖,黑龙江省自然科学一等奖;指导博士生(梁小丹、王可泽、王广润等)获得CCF优秀博士论文奖、ACM China优秀博士论文奖及CAAI优秀博士论文奖,指导博士生黄中展获得国家自然基金委首批博士生青年基金,蒲韬入选首批中国科协青年人才托举工程博士生专项。
讲者简介
01 以人为中心的3D交互理解与重建研究

查正军(中国科学技术大学)
个人简介:查正军,中国科学技术大学教授、博导,科研部部长,类脑智能国家工程实验室执行主任。从事图像视频处理与分析、多模态内容理解与生成、具身智能感知与交互等领域研究。主持科技创新2030-新一代人工智能重大项目,国家自然科学基金杰青、优青、重点项目,国家创新人才引进计划青年项目等。多次获得国际会议论文奖励,包括CCF A类会议ACM Multimedia最佳论文奖、最佳学生论文奖,AAAI杰出论文奖等。获中国科学院青年科学家奖、中国科学院优秀导师、霍英东教育基金会青年科学奖等。指导的研究生学位论文入选中国科学院优秀博士论文、中国人工智能学会博士论文激励计划、中国电子学会硕士论文激励计划等。担任国际会议ICME指导委员会委员,IEEE Trans. PAMI、IEEE Trans.MM、IEEE Trans. CSVT等权威国际期刊编委。
演讲概要:以人为中心的3D交互理解与重建是构建交互式世界模型、推动虚拟世界与现实世界深度融合的关键环节。本报告从交互语义理解、交互区域定位与交互状态重建三个方面,分析并阐释了该领域所面临的关键问题。在此基础上,进一步探讨了人-物交互意图与环境物理属性间的视觉关联学习方法,介绍了一套视觉驱动的三维人-物交互状态解析与重建框架,该框架有望为动态世界模型构建提供交互先验与动态约束机制。最后,报告结合AIGC内容生成、具身智能决策以及虚拟现实交互系统等实际应用,对所述方法进行评述。
02 智能移动抓取:Affordance检测与移动站位优化

陈超(重庆大学)
个人简介:重庆大学教授,国家自然科学基金优秀青年科学基金获得者,中国计算机学会杰出会员。长期从事移动具身智能、时空数据智能、智能流体力学等研究。以第一/通讯作者在 TRO、TMC、CVPR、ICCV、SIGMOD、PVLDB等国际期刊和会议上发表论文100余篇。提出的iBOAT异常轨迹实时检测算法被国际学者公认为SOTA算法,在滴滴出行全部业务线部署和商用,已成为滴滴出行的核心竞争技术。出版英文学术专著1部。排名第2获重庆市技术发明一等奖1项。
演讲概要:自主移动抓取机器人是具身智能领域中的关键问题,Affordance检测和移动机器人站位优化是其中核心研究方向。本报告将介绍课题组在该方向的最新进展,主要内容包括: 1)OVA-Fields 框架,面向机器人操作部位识别的弱监督开放词汇 affordance 检测方法;2)MoMa-Pos框架,考虑抓取目标物运动学特性的机器人站位优化方法;3)BestMan平台,构建真实与仿真双向奔赴的桥梁。
03 飞行器集群协同任务规划与自主决策技术探讨

张栋(西北工业大学)
个人简介:西北工业大学教授/博士生导师 青年长江学者,某型号副总师以及某飞行器集群型号副总师,西北工业大学国防科技专家,海军工程大学兼职教授,空军某基地智能空战技术专家以及多个军工院所无人系统技术领域特聘专家。主持国家级科研项目20余项,出版学术著作2部,发表学术论文80余篇,授权发明专利20项,研究成果多次参与军队的重要演训任务,获得国防军队类省部级科技进步奖4项。
演讲概要:飞行器集群具有优异的协同作战性能,作为重要的新域新质力量,已广泛应用于广域压制、目标追踪、城市巷战与应急救援等作战场景。协同任务规划与自主决策技术是实现飞行器集群协同作战的核心技术。汇报的内容重点围绕协同任务规划与自主决策技术研究现状进行了简要概述,并且探讨了集群自主决策与动态任务规划的实现途径,在此基础上给出了一些典型的应用案例。
04 生成式人工智能安全防御与安全赋能关键技术
苏洲(西安交通大学)
个人简介:苏洲,教授、博士生导师、西安交通大学网络空间安全学院院长、长江学者特聘教授、国家重点研发计划首席科学家、爱思唯尔中国高被引学者,全球前0.05%顶尖科学家。长期从事网络安全、AI安全、通信网络等方面研究。获IEEE MetaCom2023、IEEE VTC2023-Fall、IEEE WCNC2023、IEEE ICC2020等国际会议最佳论文奖,以第一完成人获陕西省自然科学一等奖。任IEEE VTS Xi’an Section Chapter 主席、IEEE Internet of Things Journal等国际知名期刊编委。
演讲概要:生成式人工智能利用生成对抗网络、大型预训练模型等人工智能的技术方法,以更快的速度和更低的成本,基于用户提供的提示,通过已有数据的学习和识别来生成相关内容,已引起越来越多的关注,并引领着内容创作和知识表达等范式革新。随着大模型技术与各类新型业务系统的深度融合,构建大模型安全管控保障体系已成为维护国家安全的关键所在。本报告首先探讨生成式人工智能安全防御架构、工作模式和关键特征。然后,针对人工智能数据安全和网络攻击威胁等挑战,研讨安全防御与安全赋能关键技术和最新研究进展。
05 面向具身智能的大小模型协同算法研究和实践

盛律(北京航空航天大学)
个人简介:盛律,北京航空航天大学软件学院教授,入选国家级青年人才、小米青年学者和斯坦福2024年全球前2%顶尖科学家排行榜单。主要研究方向为三维视觉和具身智能。在IEEE TPAMI/IJCV以及CVPR/ICCV/NeurIPS/ICLR/ECCV等重要国际期刊和会议发表论文超过70篇,Google Scholar显示被引用数7600余次。现任ACM Computing Surveys编委,CVPR、ICLR、ECCV和ACM Multimedia领域主席,以及多个领域顶会顶刊审稿人和程序委员。任CCF和CSIG多个专委会执行委员,VALSE执行领域主席。主持或参与多项国家自然科学基金、科技部重点研发计划和省部级重点研发计划项目。
演讲概要:随着多模态大模型和生成式大模型的不断进步,围绕具身智能的研究工作已经从单一的导航、抓取等任务扩展到复杂环境中通用交互任务的广泛解决。在本次报告中,讲者将主要探讨复杂环境下具身智能的大小脑协同的基本形式,并以此为基础探讨实现具身智能体泛化解决能力的几种设计思路,包含在仿真环境和真机操作下的若干尝试和实践。此外,为满足真实三维数据稀缺瓶颈下的具身智能“虚实融合”训练的需求,本次报告也将分享利用扩散模型先验构建高精度、可编辑三维视觉内容的系列工作,研究成果有效提升具身智能体对复杂动态具身任务的学习效果。