分论坛十:大模型基础架构优化与应用
分论坛日程
时间 | 报告人 | 单位 | 报告题目 | |
14:00 - 14:30 | 张奇 | 复旦大学 | 大模型能力边界与发展思考 | |
14:30 - 15:00 | 李俊涛 | 苏州大学 | 面向大模型的高效推理技术 | |
15:00 - 15:30 | 茶歇 | |||
15:30 - 16:00 | 桂正科 | 蚂蚁 | KAG--一种知识增强生成的知识服务框架 | |
16:00 - 16:30 | 朱疆成 | 零一万物 | 从通用到专精,大模型行业落地的技术范式 | |
16:30 - 17:00 | 王喆锋 | 华为云 | AI系统优化实践:算法与系统协同创新 | |
17:00 - 17:30 | 圆桌论坛 |
主席简介
徐童(中国科学技术大学)
个人简介:徐童,中国科学技术大学特任教授、博士生导师,中国中文信息学会青年工作委员会主任,国家优秀青年科学基金获得者。研究领域为多模态知识发现。发表中国计算机学会推荐A类期刊/会议论文80余篇。获5项国际学术会议论文奖项,指导学生获国内外学术竞赛/测评冠军10余项。2022年获安徽省科技进步二等奖。
王喆锋(华为云计算技术有限公司)
个人简介:华为云AI系统创新Lab 技术专家。博士毕业于中国科学技术大学,长期从事AI领域技术研究与应用落地,在NLP、AI系统等相关领域发表论文50余篇,当前负责华为云AI系统优化前沿技术研究。
讲者简介
01 大模型能力边界与发展思考
张奇(复旦大学)
个人简介:张奇,复旦大学计算机科学技术学院教授、博士生导师。兼任上海市智能信息处理实验室副主任,中国中文信息学会理事、CCF 大模型论坛常务委员、CIPS 信息检索专委会常务委员、CIPS 大模型专委会委员。在ACL、EMNLP、全国信息检索大会等重要国际国内会议多次担任程序委员会主席、领域主席、讲习班主席等。著有《自然语言处理导论》和《大规模语言模型:理论与实践》。发表论文200余篇。获得上海市“晨光计划”人才计划、复旦大学“卓越2025”人才培育计划等支持,获得钱伟长中文信息处理科学技术一等奖、汉王青年创新一等奖、上海市科技进步二等奖、教育部科技进步二等奖。
演讲概要:随着人工智能技术的迅猛发展,大语言模型已经成为推动科技进步的重要力量。然而,要充分发挥模型的潜力,首先需要对其能力边界有一个清晰的认知。在本次演讲中,我们将从多个重要角度对大模型的能力边界和未来发展展开深入探讨。这些角度包括大语言模型能力来源,深入剖析其力量源泉;阐述什么是 AGI,揭开这一概念的神秘面纱;解析实现 AGI 所必须具备的重要能力;并审视当前大语言模型在实际应用中的表现。
02 面向大模型的高效推理技术
李俊涛(苏州大学)
个人简介:苏州大学计算机科学与技术学院青年特聘教授,江苏省数据智能与先进计算重点实验室副主任,中国中文信息学会“大模型与生成专委会”副秘书长,入选中国科协“第九届青年人才托举工程”、微软亚洲研究院2022年“铸星计划”访问学者,获得教育部-华为”智能基座”栋梁之师、华为“人才基金”。2020年于北京大学获得博士学位,近年来在TPAMI、NeurIPS、ICLR、ICML、ACL、COLM等顶级会议和期刊上发表论文60余篇,出版Fundations and Trends系列专著(期刊)1部,曾2次在CCF-A类会议上进行Tutorial报告,主要研究语言建模和文本生成。
演讲概要:大模型进入到了大规模应用服务的关键阶段,如何利用有限的算力资源和成本满足实际应用部署中的服务需求是其中的重要问题。本次分享从自适应的参数剪枝、中间计算结果压缩、高效解码算法等多个角度系统的讨论在大模型服务时的算力资源效用优化。
03 KAG–一种知识增强生成的知识服务框架
桂正科(蚂蚁科技集团股份有限公司)
个人简介:蚂蚁集团高级技术专家,拥有十年大数据领域的研发管理经验,并在诸多业务场景中落地。在数据仓库、分布式计算、流式计算、微服务架构、图存储、图计算、图学习、图谱构建、图谱分析推理、图谱挖掘等领域积累了丰富的工作经验;曾主导实施蚂蚁内安全、支付、网商银行、重庆消金等场景的图谱建设落地,并取得明显业务收益。当前聚焦在大模型&知识图谱结合方向,推进知识增强的可信问答在私域知识库落地。
演讲概要:KAG 是源于医疗、政务等蚂蚁核心业务场景打磨并沉淀的一种知识增强的私域知识库可信问答框架。通过知识抽取、语义对齐、概念挂载、文本&图结构互索引等手段,实现非结构化数据的高质量图谱自动构建;基于复杂问题理解&执行规划、逻辑推理、校验&反思等手段,实现符号决策与向量检索结合的推理问答。
用户可基于KAG框架,自定义知识抽取、语义对齐、概念挂载等模块,以提升图谱构建效果;也可自定义复杂问题规划、问题检索、校验&反思 等模块,以提升推理问答的效果。
04 从通用到专精,大模型行业落地的技术范式
朱疆成(零一万物)
个人简介:朱疆成,零一万物AI产业首席科学家。博士毕业于浙江大学,帝国理工学院访问学者。曾任华为强化学习助理首席专家,天才少年。 他作为核心成员参与了多个国内头部大模型项目。同时负责了多个人工智能商业落地项目,对AI应用具备丰富的经验。 他的研究方向专注于大模型、强化学习等,发表包括顶会、顶刊等的科研论文二十余篇。
演讲概要:随着大模型越来越多的进入千行百业,通用大模型很多时候不能满足具体行业专业知识和生产环境操作等具体的需要。如何提升大模型在行业生产环境中的运行效果和效率,如何有效的结合工具以拓展大模型能力边界,是急需解决的问题
05 AI系统优化实践:算法与系统协同创新
王喆锋(华为云计算技术有限公司)
个人简介:华为云AI系统创新Lab 技术专家。博士毕业于中国科学技术大学,长期从事AI领域技术研究与应用落地,在NLP、AI系统等相关领域发表论文50余篇,当前负责华为云AI系统优化前沿技术研究。
演讲概要:大模型规模的持续增长,给AI基础设施带来了巨大的挑战。AI系统优化技术的发展为大模型的高效持续发展提供了强有力的支持。面向大模型训练、推理加速的需求,最核心的两个优化因子就是算法与系统,在AI系统优化实践中,二者越来越呈现协同创新的发展趋势。