成电人物

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
【青年学人】高绍兵:探究 “机器视觉” 的秘密
——生命学院2013级博士生高绍兵在PAMI上发表论文
文:王晓刚 学生记者团 李玉琼 图:王晓刚 来源:学生记者团 时间:2015-10-20 9292

  “科学研究中的神秘和神奇,吸引着我们上下求索,根本停不下来!”在视觉机制模拟研究的道路上,生命学院2013级博士生高绍兵已经走到了“纵深地带”。

QQ截图20151019163643.jpg

  2015年初,高绍兵以第一作者在IEEE汇刊中的顶级刊物PAMI(《模式分析与机器智能汇刊》)上发表了《利用视觉双拮抗机理实现颜色恒常》一文,在视觉机制模拟研究中又迈出了一步。

  这篇论文是我校生命学院(神经信息教育部重点实验室)李永杰教授课题组的重要科研成果之一。高绍兵是论文的第一作者,他的导师李永杰教授为通讯作者。所有作者均来自电子科大生命学院。

  对高绍兵研究的机器视觉问题,学界还有其他纯数学研究方法,并做出了比较好的算法,但像他这样基于大脑本身的生理视觉理念建立模型的“仿生学方法”,在国内可谓特色鲜明,尚属罕见。《模式分析与机器智能汇刊》的审稿人评价高绍兵的这项研究成果时说:“该研究非常新颖有趣,是到目前为止基于生理视觉的颜色恒常模型上取得的最好结果。”

矫正机器的“视力”

  人类的眼睛是大自然长期进化的杰作。光照条件对物体颜色的影响很大,但对人类的眼睛来说影响却很小,秘诀就在于人类的眼睛有“颜色恒常性功能”。它可以自适应地排除光照条件对感知物体颜色的影响,正确感知物体固有的颜色。但对机器的“眼睛”来说,这种影响会造成巨大的视觉障碍。

  实现“颜色恒常性”功能一直是机器视觉领域的基础问题之一。实现这种功能的难度在于,光照条件(如太阳光或各种人造光源)常随时间、地域、天气、气候等因素而变化,进而使得照相机、摄像头等常规的机器“眼睛”看到的物体颜色发生失真。如何解决这个问题呢?高绍兵的方法是,用一种独特的方式模拟人类大脑视觉系统中的“颜色双拮抗机制”。

  这种“仿生学”方式,简单有效地实现了对各种场景下的色偏图像的颜色矫正,等于是把人眼视觉中的“颜色双拮抗机制”移植给了机器,让机器可以像人的眼睛那样“看”世界。“颜色恒常性其实相当于相机里的‘白平衡’,这种‘白平衡’的调节效果,对于机器来说主要取决于它‘眼睛’背后的算法。”高绍兵说,让“白平衡”算法更自动、更智能,是该领域研究的主要追求。

  在这篇论文中,高绍兵对比了自己的方法和其他方法处理偏色的结果。无色偏图像的色偏值为0°,对于一种色偏处理方法而言,它处理后的图片色偏值越趋近0°就越好。高绍兵分别取了一组色偏值为25.42°、13.51°、9.21°的色偏图片进行处理,得到的图片色偏值降低到了1.33°、1.45°、1.11°。而目前流行的Grey-World方法处理的结果分别高达6.74°、5.67°和3.44°。显然,高绍兵的处理方法效果要好得多。

深入科学的殿堂

  2010年,高绍兵从西南科技大学本科毕业后,考入电子科大读研,投身生命科学与技术学院李永杰教授门下。开学后,李永杰教授就指导他研究视觉机制模拟、计算机视觉和图像处理方向。高绍兵在这个方向一做就是三年,硕士毕业后又继续留校读博,依然在李永杰教授的指导下深入探索,到2015年博士研究生二年级发表《利用视觉双拮抗机理实现颜色恒常》这篇论文时,前后酝酿了四五年之久。

  在这四五年时间里,高绍兵从一个刚迈入电子科技大学时的懵懂学子,蝶变成了成果卓著的科研达人。2013年,高绍兵及其所在团队的研究成果《A color constancy model with double-opponency mechanisms》一文被计算机视觉领域最顶级的国际会议之一ICCV(即国际计算机视觉会议)以口头报告形式录用,高绍兵为第一作者。这是该会议当年录取的唯一一篇来自中国大陆地区的口头报告论文,也是高绍兵科研生涯中的第一个高级别研究成果。

  2013和2015年,他还以第二作者发表了两篇CVPR(即IEEE国际计算机视觉与模式识别会议)论文。CVPR是世界顶级的计算机视觉会议,与ICCV和ECCV并列为IEEE的三大顶级会议,近年来每年有约2000名参加者,收录的论文数量一般300篇左右,录取率仅约25%。在各种学术会议统计中,CVPR被认为有着很强的影响因子和很高的排名。2014年,高绍兵的又一力作被2014年的ECCV(欧洲计算机视觉会议)收录。

  从2013年到2015年,他的科学研究似乎到达了一个“爆发期”。不仅高水平论文迭出,发明专利也接连申请成功中国发明专利。2013年1月,他参与研究的《一种彩色图像颜色校正方法》和《彩色图像的场景光源颜色估计方法》申请成功并被公布;2015年,《一种利用灰色点校正图像颜色的方法》和《一种高动态范围图像增强显示的方法》再次成功申请。

  成果不断增多折射出高绍兵在科研道路上越来越如鱼得水。“五年前我考研的时候,头脑里对科研的理解还只是一种随大流的想法,但是,五年后的今天,我对科研的理解有了巨大的转变。”高绍兵说,“很感谢电子科大,感谢李永杰教授,感谢我们团队的老师和同学,一起引导、陪伴我走进了科研的美妙世界。”

寻求更高的顶峰

  高绍兵是一个沉稳、“慢热”型的人。进入了硕士阶段,他的想法就是:再不能浪费时间了,要好好学习!他觉得,科研不是立竿见影或一蹴而就的事情,而是一个慢慢积累的过程,因此很需要耐心。他不骄不躁,从大量阅读Paper开始一步一步地往前走。从早上8:30到晚上11:00,他的大部分时间都待在实验室里。偶尔出去玩一整天,他会觉得整个人都很空虚。

  勤奋是科研积累中十分重要的品质。虽然发表了多篇高水平论文,但高绍兵一直认为,能有这样突出的成果,并不是自己的智商或天赋有多好,而是积累和努力的结果。研究视觉机制模拟,虽然名义上是神经科学工程,但涉及数学建模、计算机编程等多个领域的知识。他起初在这两个方面并没有扎实的基础,为了适应科研的需要,他努力调整知识结构,扩充跨学科知识,最终补上了这重要的一环。

  “我本科时基本上没有实验和编写程序的经验,所以刚开始上研时比较吃力。”高绍兵说,为了提高自己的编程能力,他曾花了两个多月的时间,把一篇优秀硕士论文拿来条分缕析地编程实现,获得了美妙的动手体验。

  此后,碰到建模和编程的问题,他就很容易上手了。平时阅读大量资料,每当遇到“眼前一亮”的论文,他就情不自禁地研读琢磨,尝试自己动手模拟一遍,这样比单纯地囫囵吞枣地阅读论文收效更好,论文中的各种细节都能把握吸收。

  如今,高绍兵说,自己“算是入门了”。而“入门”之后的他,更是感觉自己的研究方向太窄,远远不能满足自己的求知欲。2015年,他受英国伦敦大学学院(UCL)Samuel Solomon先生的邀请,准备赴伦敦进行为期一年的联合博士培养深造。

  Samuel Solomon先生目前是英国伦敦大学学院的副教授(Senior Lecturer),主要从事电生理视觉方面的实验、理论及模型研究,他的工作已被同行引用超过1840次,H指数为21。英国伦敦大学学院已经产生了30多位诺贝尔奖得主,其中自1922年至2007年已诞生了Martin John Evans等17位诺贝尔医学及生理学奖得主。

  高绍兵此行的主要目的,是到世界顶级的电生理实验室,从事视觉机制及计算理论方面的研究,主要涉及到颜色视觉及视觉自适应两方面的内容。“我相信我将在那里得到科研的新惊喜。”高绍兵说。


编辑:林坤  / 审核:罗莎  / 发布:罗莎