启梦成电

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
【启梦成电】邵俊明:挖掘大数据的“潜台词”
——记校“百人计划”入选者、计算机学院邵俊明教授
文:黄土地 来源:学生记者团 时间:2015-11-22 11207

  33岁的邵俊明教授研究方向很“跨界”。他既致力于时下最热的大数据,同时又涉及大脑神经医学和水文水资源领域。“我在读博之前做的只是图像分析。”邵俊明觉得现在能与新的学科方向结缘是非常奇妙的事。“人的潜力真是无限。”他说,每个人其实都是一片大数据,只要勇敢挖掘,总有意料不到的新天地。

01.jpg

发现数据里的诸多“奥秘”

  数据对于今天的我们到底意味着什么?邵俊明做了一个“鲁迅式”的回答:“对于科研工作者来说,数据意味着知识,更深入地说,可能意味着模式。对于商人来讲,意味着金钱、财富。对于普通人来说,意味着便利。其实今天,我们所需要的一切,都深埋在数据里。”

  作为一门诞生不超过三十年的新兴学科,数据挖掘在国内外的热门程度位于前列。在中国,近年来更是把数据挖掘提升到了国家战略的高度。“热门”的另一个解读,也就是竞争激烈。邵俊明是进入数据研究大潮的众多科研者中的一位,他的才华与贡献在新兴领域灼灼闪光。

  邵俊明发现,海量数据、高维数据和复杂数据成为新时代的“常客”,传统的数据挖掘算法已经out,难以“对付”这批新力量。如何做好大数据环境下新的数据挖掘基础算法研究呢?邵俊明受自然同步现象启发,首次将其原理引入数据挖掘领域,创新性地提出了一系列数据挖掘算法。算法的优越性得到国内外同行的广泛认可,ACM/IEEE 院士、美国国际数据挖掘领域鼻祖之一的Philip S. Yu教授评价邵俊明提出的Sync算法是目前最先进的聚类算法之一。

  全球的老年性痴呆症引起了邵俊明的重视,他希望用手中尖端的数据挖掘工具为治疗该疾病尽一份力。邵俊明针对潜在大脑灰质(White Matter)的萎缩,提取异样的网络拓扑结构连接模式来分析,通过科学的方式预测老年性痴呆病人。相关论文发表在神经科学顶级期刊Neurobiology of Aging(中科院JCR一区)等上。同时,论文一经发表就受到著名视频期刊JoVE邀请发表其相关技术。

  不仅在大数据的基础研究中挖掘“奥秘”,更要在交叉领域推动人类社会的美好发展。这是邵俊明科研中很重视的“两翼”。他的成果还包括在基础理论中的数据流挖掘、大规模网络分析,交叉学科中的脑科学、疾病关联分析研究、水文水资源的分析与管理。

  邵俊明的研究成果,为数据挖掘研究注入了新鲜血液,提供了坚实的理论基础和技术支持。

慕尼黑的风雨和彩虹

  慕尼黑大学数据挖掘中心,是全欧洲最好的数据挖掘中心,也是邵俊明难忘的留学之地。

  在慕尼黑大学的三年,邵俊明在数据挖掘领域国际三大顶尖会议及相关期刊发表论文20余篇,其中两篇被评为“最佳论文奖”。他于2011年11月提前一年获得博士学位,博士论文及答辩成绩等级为“最高荣誉”,是慕尼黑大学计算机系成立以来第二个获此殊荣的博士毕业生。其博士毕业论文“基于同步原理的数据挖掘”已受德国Lamber学术出版社邀请出版。

  在外人看来,在德国的这三年是邵俊明一生中精彩而辉煌的一段时光,可在他自己心里却并不尽然。邵俊明说这三年其实是他最难熬也最痛苦的三年。

  当时,邵俊明面对着两大挑战:放弃熟悉的专业方向,转投数据挖掘领域,已是难啃的“硬骨头”。导师还要继续“加压”,让他参与神经医学的合作研究。艰涩的医学知识,对于他这样的医学“门外汉”来说,真是“压力山大”。

  导师对于邵俊明的学业“外松内紧”,表面上是“放养”,不具体指导;实质的要求却极为严格。“20篇论文,其中4到5篇top的文章”这样的要求,让当时的邵俊明对自己的未来陷入了深深的迷茫和忧虑。

  而他所经历到的困境,却不仅仅局限于此。当邵俊明读到博二时,还没有发表一篇论文。他没日没夜地看论文,自学、研究、写论文、改论文、投论文被他每天机械性地重复。身体的疲劳,加上心里的迷茫和无助,使他产生了几近抑郁的倾向。

  但他最终还是挺了过来。好不容易,论文发表了,这时他发现自己的论文第一作者竟然不是自己。原来,在德国,论文作者按照字母顺序来排序。导师名字首字母是B,而他是S,所以一直没被排到第一位。尽管这样的排序在德国甚至欧洲都是认可的,然而中国却不认可。他多次尝试与导师沟通,但都无果。

  这些情况都出乎邵俊明意料之外,挫折感很快笼罩了他。但是他心底始终有一个信念,那就是坚持会带来成功!

  事实也证明,风雨之后,总有彩虹。他的论文陆续发表,神经医学的研究也取得成果。当他发现已有20篇论文时,才发现自己居然提前了一年完成!

  回顾这段经历,邵俊明说:“最后毕业时能够拿到最高荣誉真的是幸运,但是这一段逆境中奋斗的经历对于我来说,很有意义。对于科研、人生、心态,我都有更深刻的领悟。”

坚守科研的“洪堡学者”

  邵俊明的家乡在四川自贡的农村,他从小到大,热爱读书而又朴实执著。他记得,大学以前最大的爱好是看书,看各种各样的书,从武侠到杂文,从古代到现代。中华文化、爱国情怀一直深埋在异国求学的淳朴青年心中。

  从慕尼黑大学毕业后,邵俊明成为了让人艳羡的“洪堡学者”,但他依然想回到中国。2013年,邵俊明通过校“百人计划”来到电子科大。他说:“我不想说太多调子很高的话,因为我的家在这里,我必须回来”。

  学成归来的邵俊明,并没有“吃老本”,而是继续坚持自己的基础科研。他说,自己是一个很享受科研的人,他觉得这是实实在在可以推动社会发展的事情,他很幸福也很幸运。

  每一个科研成果的出炉,背后注定是一次次的失败和尝试。就如同今年的诺贝尔医学奖获得者屠呦呦所说:“科学研究充满着魅力也充满着偶然,有的科学家终其一生,只是证明了‘此路不通’,而有些科学家则是幸运地站到了苹果树下。”邵俊明说,他愿意接受失败带来的乐趣,坚守基础科研的道路,因为这就是他所爱的学术领域。

  回国两年来,邵俊明在电子科大组建了数据挖掘实验室,成员20余人,形成了以教授、副教授、博士生、硕士生为主的良好梯队。他以第一作者发表两篇数据挖掘顶级会议SIGKDD论文,已知是目前以电子科大为第一单位的数据挖掘顶级会议的两篇论文之一。他还合作发表论文在Brain期刊(影响因子10左右,JCR一区)。

  邵俊明希望继续数据挖掘的基础理论研究及创新性应用研究,获得突破性的成绩。

世界这么大,鼓励大家出去看看

  年轻的邵俊明不仅执著科研,还潜心于人才培养。他从事数据挖掘、概率论与数理统计的全英文教学,还指导硕士生、博士生,并担任格拉斯哥学院学术导师。

  虽然初为人师,但邵俊明已有不小成绩。他去年指导的学生中,有1名获英才学院学术奖(一起发表高水平论文),2名获得校优秀论文,2名学生出国深造,2名学生分别保送上海交大、中科大。

  在与学生的交流中,邵俊明经常鼓励大家出国去看看。他说,世界这么大,出去不仅能看风景,也能学知识。

  对于想要出国的同学,他也给出了自己的建议。绩点成绩对于能不能拿到好学校的offer并不能起到关键性的作用,但那是一个永远都绕不开的前提条件。“所以首先要做的,就是认真对待自己所学的每一科。”邵俊明说。

  他强调,出国一定要有目标,不能盲目,这样才不会在异国的文化中迷失自己。“还要有面对困难的勇气。”邵俊明的亲身体会是,国外跟国内是不一样的,真的需要独立成长,一定要有情商,有逆商。

  谈到出国的意义时,邵俊明说,“其实电子科大的硬件条件已经超出了很多国际一流高校。”那为什么还要鼓励大家出国呢?

  他认为原因有二。第一,出国重要的不是学到了什么,而是经历了什么。经历有利于将来的成长,“比如说我,经历过读博的洗礼,现在面对很多困难的时候都比较坦然。”第二,出国让你看世界有不同的角度。在国外看中国,可能对国家、对民族,或者对体系、对自身,都有全新的认识。

  邵俊明分享了一个有趣的现象,“在我参加的数据挖掘国际会议上,有至少四分之一到三分之一的人都是华人。”他很感慨,华人是很有数据挖掘天赋的,但是这与国内的数据挖掘发展水平还不相匹配。所以,他希望大家不要在异国的风景里忘记祖国母亲的面容。


编辑:林坤  / 审核:一戈  / 发布:一戈