2026年4月17日下午,清华大学王蔚峻老师应邀来计算机学院、软件学院、网络空间安全学院作题为《Efficient Edge Intelligence: From Video Analytics to Large Model Serving》的专题学术报告。报告由何昕老师主持,我院老师和学生参加了报告会。

本次报告围绕资源受限边缘设备上的高效智能模型部署展开,王蔚峻老师介绍了团队在边缘人工智能系统方面的最新研究进展。报告指出,随着实时智能应用快速发展,如何在带宽、算力和存储受限条件下实现人工智能模型的高效部署,已成为边缘智能领域的重要问题。报告重点介绍了三项研究工作:一是NSDI 2025 的区域化内容增强方法,通过选择性增强视频关键区域,在带宽受限条件下提升视觉分析精度;二是 EuroSys 2025 的基于 LoRA 的大规模多模态模型边缘部署方法,实现了边缘设备上的高效视觉理解;三是正在投稿 SIGCOMM 的 KVFetcher 工作,通过优化 KV Cache 管理机制,加速大语言模型推理过程。报告展示了团队在边缘视频分析、多模态模型部署和大模型推理加速等方向的研究成果。报告结束后,现场师生围绕边缘智能系统设计与大模型高效部署等问题进行了深入交流。

报告人简介:王蔚峻,清华大学助理研究员,水木学者。博士毕业于南京大学(导师:陈贵海教授、戴海鹏教授)和德国哥廷根大学(导师:XiaomingFu教授)。主要研究方向为AloT,包括具身智能系统、大模型训推系统和边缘智能系统。已发表24篇CCF-A类论文,包括NSDI、EuroSys、INFOCOM、MobiCom、ICML、ISCA、ACL等顶级会议和TON、TMC、TC等顶级期刊,Google Scholar引用1000+。主持国家自然科学基金青年基金、博士后海外引才专项(全国500名)等科研项目。曾获IEEE ICPADS最佳学生论文奖、IEEECBD最佳论文奖、德国计算机学会(GI)优秀博士论文提名(全德5人)等荣誉。
(图文:何昕 初审:黄海平 编辑:贾佳 审核:尹志丽)
