当前位置:首页 > 科研工作 > 科研动态

【科研动态】第123期CCF-CV走进高校系列报告会活动圆满结束

发布时间:2023-05-10     字体:[增加 减小]

   2023年4月15日上午,由中国计算机学会计算机视觉专委会(CCF-CV)主办、武汉理工大学承办的走进高校系列报告会第123期活动在武汉理工大学马房山校区会议中心成功举办。本次活动由武汉理工大学计算机与人工智能学院熊盛武院长和朱安娜副教授担任执行主席。

    活动伊始,首先由武汉理工大学吴超仲党委常委、副校长及CCF-CV主任、北京大学查红彬教授分别代表武汉理工大学和CCF-CV专委会致欢迎辞。随后,北京大学查红彬教授、北京航空航天大学徐迈教授、大连理工大学樊鑫教授、中科院计算技术研究所王瑞平研究员做主题报告。最后,中科院计算技术研究所陈熙霖研究员及四位讲者参与了panel讨论环节。

执行主席朱安娜副教授主持开幕式

武汉理工大学吴超仲党委常委、副校长致辞

北京大学查红彬教授致辞

 北京大学查红彬教授报告的题目是“动态视觉与SLAM:在线学习的方法”(Dynamic Vision and SLAM: Online Learning Approach)。在报告中,查红彬教授首先介绍了什么是动态视觉和SLAM,并以移动传感器带来图像变化为切入点,阐述了动态视觉中SLAM要解决的问题及现有方法存在的问题,包括缺少对时序连续性的利用、现有监督学习的缺点等,由此引出并讲解了其团队基于在线学习开展的一系列研究,如基于流数据的动力学模型构建、具有在线自适应能力的自监督SLAM学习等方法。

 北京航空航天大学徐迈教授报告的题目是“通往沉浸式媒体体验之路:全景视频感知、质量评价与压缩”。全景视频在近年来逐步普及,成为沉浸式通信主要载体,可提供身临其境体验。徐迈教授首先介绍了全景视频研究的背景、现状及困境,然后从人类视觉感知机理、降低全景视频感知冗余思路出发,讲解了全景视频感知、质量评价与压缩的研究工作,包括基于深度模仿学习的全景视频视觉注意模型,面向用户体验的全景视频感知失真度量方法和带宽受限下全景视频压缩的质量优化方法。

 大连理工大学樊鑫教授的报告题目是“面向水下机器人的超视觉计算”。樊鑫教授首先介绍了其研究角度是通过算法和硬件系统实现水下机器人在不同环境状态下具有超越人类的视觉感知能力,特别强调环境适应性。然后,将感知分别视为硬件和认知两方面,讲述了感与知相互约束的“超视觉计算”框架的构建、损失及网络结构的优化,以解决“看不清”与“看不懂”难题。最后,樊老师进一步展示了其团队近年来在软硬件平台以及分割、检测等多种水下任务中取得的研究及成果。

中科院计算技术研究所王瑞平研究员的报告题目是“视觉-语言多模态智能评测的探索”。首先,王瑞平研究员回顾了视觉-语言多模态研究背景,对比了视觉与语言多模态智能评测和单纯视觉任务评价之间的区别和难点。然后,从面向图像描述生成评测、视觉-常识理解评测和具身场景理解评测三个方向分别介绍了可学习评测指标FAIEr,问答数据库CRIC和动态环境视频问答数据库Env-QA,并简述了其团队提出的视觉与语言多模态任务的模型方法和测评对比结果。

 Panel环节由武汉理工大学朱安娜副教授主持,参与嘉宾包括中科院计算技术研究所陈熙霖研究员、北京大学查红彬教授、北京航空航天大学徐迈教授、大连理工大学樊鑫教授、中科院计算技术研究所王瑞平研究员。主要围绕以下两个议题展开讨论:

 1. 大规模语言模型ChatGPT爆火后,大家都很期待视觉大模型。最近,Meta 发布图像分割基础模型 Segment Anything,拥有很强的泛化能力,将给 CV 研究带来什么影响(怎么评价这样的工作)?CV将来的主流方法会是什么?

 2. 现在各种LLM(Large Language Model)、AIGC(AI Generated Content)大模型出现,不仅对工业界的格局有很大影响,对学术界也有一定的冲击。我们高校的老师或研究者在没有企业级规模的大算力、大数据的情形下该如何继续开展CV的相关研究?

 Panel环节结束后,武汉理工大学计算机与人工智能学院向剑文副院长围绕本次系列活动“123”期的数字进行了活动总结,感谢了专家们的精彩报告与学术交流以及CCF-CV专委会和校内外师生的大力支持,同时表示期待专家学者们的再次来访。最后,参加活动的人员进行合影留念,活动圆满结束。

      

(图文:朱安娜,审核:向剑文)


附件下载: