在地理科学学部张立强教授的带领和指导下,2014级本科生李帅朋(地理科学学部)、刘方宇(大二由地理科学学部转至数学科学学院)和叶容天(政府管理学院)等的研究论文“3DCNN-DQN-RNN: A Deep Reinforcement Learning Framework for Semantic Parsing of Large-scale 3D Point Clouds”被计算机视觉领域最高级别的国际会议 International Conference on Computer Vision(ICCV)2017接收。
ICCV是计算机视觉方面的三大顶级国际会议(CVPR、ICCV、ECCV)之一,每两年召开一次,会议的论文集代表了计算机视觉领域最新的发展方向和水平。ICCV对论文的质量有着极其苛刻的要求,收录率很低。据公开资料报道,自1987年创办到今,论文主要作者为本科生的只有十余篇。
该篇研究论文受人类视觉认知模式的启发,提出了3DCNN(三维卷积神经网络)-DQN(Deep Q-Learning Network)-RNN(递归神经网络)深度强化学习框架,克服了难以充分训练深层次网络的困难,在减轻网络训练负担的同时,大幅度提升了网络识别的精度,实现了室内外场景点云中目标的定位、探测、解译、分割一体化处理流程,显著提升了大场景点云数据的智能化处理水平。三位审稿人和领域主席(Area Chairs)一致认为论文方法在大场景室内外三维点云的解译等方面取得了卓越的性能,具有很大的创新性。