1月22日,中国科学院自动化研究所研究员徐常胜、清华大学自动化系兴华讲席教授韩军功应邀做客我校“黄岛讲坛-控制分论坛”,分别以“开放世界的多模态大模型研究与应用”“多模态智能:从任务专用模型到通用智能框架”为题作学术报告。报告会由太阳集团tyc234cc院长刘伟锋主持。

徐常胜作学术报告
徐常胜首先梳理了多模态大模型的发展脉络,指出当前文本大模型已趋于成熟,而通用多模态大模型仍处于探索阶段。他提到,现有多模态方法存在系统性缺陷,无法对视觉空间进行完备建模。针对这一核心痛点,其团队提出解耦路由注意力机制,构建基于视觉解耦的Libra多模态大模型,有效解决了语言世界、视觉世界与跨模态空间难以统一建模的问题。
此外,徐常胜分享了团队在多模态大模型跨域迁移、小样本迁移领域的研究成果与实践进展,并围绕多模态预训练模型面临的骨干网络适用性、模型精简性、模型公平性等关键问题进行系统总结,对行业未来发展方向作出前瞻性展望。报告结束后,他与现场师生热烈互动,逐一解答专业疑问。

韩军功教授作学术报告
韩军功教授以中国电力科学研究院电力行业大模型为案例,剖析了行业多模态大模型的三大核心痛点——训练成本高昂、数据处理效率低下、应用幻觉问题突出,并针对性提出解决思路与技术方案,为行业模型落地提供重要参考。他指出,下一代人工智能将朝着脑与认知启发的仿生式、探索式、数理科学建模及高效模型建构的生成式方向演进。
互动环节中,师生踊跃提问,围绕多模态大模型的行业落地难点、未来发展路径、跨学科交叉融合可能性等议题深入探讨。韩军功耐心回应每一个问题,既给出专业独到的学术见解,也勉励同学们深耕实验、勤于探索,在实践中发现新问题、突破创新点,积极投身前沿科学研究。

报告会现场
徐常胜,中国科学院自动化研究所研究员,国家级高层次人才、首都科技创新领军人才、中科院王宽诚率先人才计划卢嘉锡国际团队负责人,IEEE/IAPR Fellow和ACM杰出科学家。担任ACM多媒体专委会中国区(ACM SIGMM China Chapter)主席。发表IEEE/ACM会刊论文200余篇,CCF-A类会议论文150余篇,在多媒体领域国际顶级会议和期刊上获得最佳论文奖10余次,以第一完成人获中国电子学会自然科学一等奖和技术发明一等奖,7次获得中国科学院优秀导师奖。
韩军功,清华大学自动化系兴华讲席教授(长聘教授),国家级高层次人才。2024年回国,回国前任英国谢菲尔德大学讲席教授,领衔计算机视觉团队。研究涵盖多模态感知、类脑学习与具身智能,三项AI技术产业化,音视频检索获CSI创新奖并助力企业获艾美奖。论文被引超3.5万次,1作单篇最高引超2.1千次,H指数85,连续入选全球前2%科学家及0.05%高被引学者。4本IEEE Transactions副主编,主持2项国家自然科学基金重点项目、1项北京市自然科学基金重点项目,BMVC’25大会主席,欧洲科学与艺术院院士、IAPR、AAIA会士。
【作者:王乙惠 】


实验教学平台
学校OA系统
学校邮件系统
相关文件查询