2021年5月15日和16日,第一届CCF计算机视觉前沿讲习班活动在武汉理工大学会议中心201成功召开,共吸引了计算机视觉领域的研究人员、学生、工程师等200余人参加。本次活动由中国计算机学会(CCF)主办,中国计算机学会计算机视觉专委会与武汉理工大学联合承办,武汉理工大学计算机科学与技术学院院长熊盛武和华中科技大学自动化与人工智能学院教授白翔担任执行主席。本次讲习班活动旨在促进计算机视觉技术的学术交流与高级人才培养,帮助该领域青年从业者提升技术水平,开拓实践视野,全面学习并系统掌握计算机视觉前沿技术和应用工具。
参会人员合影
讲习班开幕式首先由CCF-CV秘书长马占宇老师主持,由熊盛武院长致辞,熊院长介绍了本次活动的目的、武汉理工大学计算机学院学科的基本情况、本次活动报名情况,以及对邀请的专家和学者表示热烈欢迎。随后,由CCF计算机视觉专委会主任,同时也是本次活动的授课专家——北京大学教授查红彬,介绍了学会的宗旨、发表感谢致辞,并为本次活动的承办方武汉理工大学计算机科学与技术学院、以及组织活动的执行主席:熊盛武教授、白翔教授,和组织主席朱安娜老师颁发了感谢证书。此外,会议邀请的专家还包括中科院计算技术研究所研究员陈熙霖、中国科学院自动化研究所副所长刘成林、西北工业大学教授韩军伟、中国科学院信息工程研究所研究员操晓春、百度飞桨高级技术经理刘其文、阿里巴巴资深算法专家王永攀、南方科技大学副教授于仕琪。
熊盛武院长主持会议开幕式
查红彬教授颁奖
5月15号的活动由武汉理工大学计算机学院副教授刘唯真主持,第一天报告的嘉宾有查红斌教授、陈熙霖研究员、刘成林研究员和韩军伟教授。
5月15活动主持人刘唯真副教授
查红彬教授以“视觉SLAM:在线学习的途径”为题,首先回顾了SLAM基本概念和发展历史,然后分享了在线学习SLAM的相关研究工作,包括引入数据流计算的基本概念,充分挖掘密集采样传感数据内在的时空连续性,来加强SLAM算法的预测能力;构建基于时域变化的增量算法,并利用地图全局特征的约束以及传感数据的实时反馈作用,实现传感器轨迹的高效计算与三维地图的递进式构建;探讨建立自监督SLAM在线学习技术的新途径,包括:面向自监督视觉里程计的序列对抗学习方法、具有在线自适应能力的自监督SLAM学习等。
查红彬教授报告现场
陈熙霖研究员由于武汉雷暴天气航班取消无法到达现场,所以课程在线上进行。陈老师非常想亲临现场给学员授课,在北京首都机场两次登机两次下机,直到凌晨两点多被通知飞机取消才返回。陈熙霖研究员讲授的线上课程以“场景的层次表达与推理”为题,首先介绍了视觉智能的发展趋势以及物体识别背后的局限性。然后分享了以”万物关联、属性为桥”为基本思想的场景理解方法,利用视觉、语言以及知识综合判定检测结果;介绍了以属性为纽带的物体识别方法,不仅满足了最基本的检索、分类需求,还扩展至更丰富多样的视觉描述。最后详细讲述了以语义图为桥梁的场景理解,借鉴人类感知机理,充分利用周边场景与物体间关系信息、建立图结构,设计消息传递机制进行全局关联推理。
陈熙霖研究员报告现场
刘成林研究员以“图神经网络与文档图像分析”为题,首先介绍了文档分析领域的相关流程及难点问题。然后讲述了结构化预测主要的方法,包括隐马尔可夫模型、循环神经网络、马尔可夫随机场等,其中,详细讲解了图神经网络的理论知识。最后,与学员分享了基于图神经网络的文档图像版面分析研究进展,包括基于图注意网络的联机手写文档版面分析、流程图识别,复杂文档图像区域分割和二维结构分析等。
刘成林研究员报告现场
韩军伟教授以“遥感影像‘深度’解译”为题,介绍深度学习在高分遥感影像解译方面的一些典型应用。首先,针对高分遥感图像大规模数据库相对稀少的问题,介绍了课题组发布的两个公开的高分图像数据库:NWPU-RESISC45场景分类数据库和DIOR目标检测数据库。然后,针对高分遥感影像解译存在的一些难点问题和不同的应用需求,介绍了课题组提出的弱监督和旋转不变目标检测算法、型号识别算法以及结合深度学习和度量学习的场景分类算法,最后总结了对未来研究方向的展望。
韩军伟教授报告现场
5月16日主持讲习班的老师为武汉理工大学计算机学院杜亚娟副教授,嘉宾为操晓春研究员、刘其文高级技术经理、王永攀老师和于仕琪副教授。
5月16活动主持人杜亚娟副教授
操晓春研究员以“人工智能驱动的网络空间内容安全”为题,从一整套视觉大数据价值挖掘系统出发,首先介绍其团队在网络空间安全应用方向学术探索的最新进展,然后介绍了在系统中其他方面开展的相关研究包括:开源数据的云弹性采集与强智能搜索、数据驱动的自底向上深度抽象归纳、知识驱动的自顶向下演绎推理、人工智能深度攻防对抗等。
操晓春研究员报告现场
百度飞桨高级技术经理刘其文讲者以“深度学习产业落地的四大挑战”为题,结合飞桨的实际案例,从四个方面介绍深度学习产业落地的四大挑战与解决方法,包括1. 业务挑战:什么样的产业场景适合人工智能落地?2. 人才挑战:人工智能落地,需要什么样的复合型人才?3. 技术挑战:从深度学习框架的角度,还有哪些核心技术有待突破?4. 生态挑战:需要政府、科研、教育和产业怎样相互协同,才能构建良好的人工智能产业生态?
刘其文讲者报告现场
阿里巴巴资深算法专家、达摩院OCR&智慧教育方向负责人王永攀讲者以“OCR&智慧教育”为题,首先介绍了阿里云读光产品在OCR研究方面的应用和功能,演示了其中用于古籍OCR的产品——汉典重光,然后介绍了OCR算法演化和场景延伸,最后引出智慧教育话题,详细介绍了利用AI算法助力教学的难点和思路。
王永攀讲者报告现场
于仕琪副教授以“步态识别技术和最新进展”为题,首先介绍了步态识别的研究背景,然后结合自己在该方向研究的心路历程,以幽默诙谐的方式向大家讲述了其研究成果和最近进展,以及在研究过程中遇到的问题和解决问题的思路。
于仕琪老师报告现场
本次“第一届CCF计算机视觉前沿讲习班”活动为计算机视觉领域的研究学者们提供了一个与专家学者交流学习的宝贵机会,大家对专家所讲的内容有极大的兴趣,现场互动非常活跃,学术氛围浓厚。
学员与专家交流现场
在结业典礼上,由执行主席白翔教授对本次活动进行了总结,首先祝贺本次活动在武汉理工大学举办取得了圆满成功,然后征集学员意见,为下一届CCF计算机视觉讲习班的开展提供建议。最后,所有现场的学员获得了学员证书,并拍照留念,记录自己在第一届CCF计算机视觉讲习班中顺利结业的瞬间。
执行主席白翔教师主持结业式
结业仪式