报告时间:2019年9月16日,星期一,下午2点
报告定点:计算机楼409会议室
报告题目:自然图像中的骨架提取
报告人:柯炜 卡耐基梅隆大学机器人研究所
报告摘要:对称性普遍存在于自然界的一些物体之中,骨架作为对称性的一种描述,是计算机视觉的重要研究课题之一,它可应用于目标特征描述、图像前景提取等方面。骨架提取的数据从二值图像提发展自然图像,骨架提取的方法也从传统的数字图像处理方法发展到基于深度学习的方法。本报告中,将介绍Sym-PASCAL这个自然图像数据集,以及侧输出残差网络及其改进的方法,进一步推进自然图像骨架提取的研究。SymPASCAL数据集,具有多目标共现、遮挡、复杂背景等难点。而侧输出残差网络在全卷积网络的每个卷积阶段进行侧输出估计,并在侧输出上堆叠残差模块,促使网络输出和真实骨架之间的残差趋于零。该方法简单且有效,在Sym-PASCAL以及其它已有的骨架提取数据集上均获得了极佳的性能。在侧输出残差网络的基础上,提出了线性扩张网络,对其进行了理论上的分析以寻求最优的侧输出残差网络结构,进一步提升了骨架提取性能。
报告人简介:柯炜,博士,现为卡耐基梅隆大学机器人研究所博士后研究员。在此之前,他分别于2018年获得中国科学院大学博士学位,2011年获得北京航空航天大学本科学位。2015年至2016年获得留学基金委资助于芬兰奥卢大学进行联合培养。他的研究兴趣包括视觉目标感知和智能视频分析。现已发表论文18篇,包括IEEE CVPR, ECCV等计算机视觉顶级会议论文5篇,并担任多个知名期刊和会议的审稿人。
博士后期间,他参与美国情报高级研究计划局(IARPA)的深度联运视频项目(DIVA),对行为识别在交通监控场景中的应用进行了深入地研究,积累了丰富的工程经验。博士期间,他在自然图像骨架提取上取得了一系列进展,其中第一个工作被CVPR 2017以口头报告方式接受,该论文中发布了一个新的数据集并且提出了侧输出残差网络这种简单有效的方式。其后有对侧输出残差网络进行解释和扩展,提出了线性扩张网络和正交分解网络,分别被ECCV 2018和CVPR 2019接收。与此同时,参与ICCV 2017和CVPR 2019的骨架检测竞赛,分别获得一等奖两项,二等奖两项。