成电人物

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
【青年学人】潘黎明:在大数据的迷雾森林中寻找光亮
——计算机学院博士生潘黎明在《美国科学院院刊》发表研究论文
文:李可润 孙艺文 李若琛 来源:学生记者团 时间:2016-05-02 9284

  “探索未知的世界,就像在充满迷雾的森林中寻找一丝光亮!”计算机学院、互联网科学中心2014级博士生潘黎明常这样形容自己在科研道路上摸索的感受——不过,探索的道路上并不会一直充满“迷雾”。

  在国际著名期刊《美国科学院院刊》(PNAS)发表题为“复杂网络链路可预测性”的研究论文,创造性地解了决刻画网络“可被预测的程度”的难题,为解决“链路预测”这一网络科学中的基础性问题做出了重要贡献,正是潘黎明在穿透“迷雾”中获得的“光亮”。

01.png

独辟蹊径

“可预测性”首次有了量化方法

  链路预测(Link Prediction)是网络科学中一个基础性的重要问题。它是指利用网络的结构或者节点的属性信息预测未产生连接的两个节点间产生连接的可能性,其本质是挖掘网络产生连边的原因和驱动力。

  对链路的精准预测结果既可以指导生物网络结构验证实验,大幅度节省实验成本、提高实验效率,也可以进行在线社交网络的好友推荐,还可以挖掘出网络生长的内在机制。然而,链路预测却一直如鲠在喉般地面临着一些基础性难题的困扰。

  “在日常生活中了,我们会遇到很多‘预测未来’的问题,但要做出预测,除了要有科学有效的算法,还有一个重要问题就是对象本身的‘可预测性’。”潘黎明说,如果无法衡量对象的“可预测性”,算法优良与否就缺乏稳固的前提。

  如果把“链路预测”比作烹调佳肴,那么,“算法”就是厨师的烹饪“手艺”。好的厨师当然可以探索各种方法烹出“美味”,但任何一个厨师都要首先挑选并审视“食材”本身的“品相”和营养价值。否则,如果“厨师”烹调的是一块没有“可预测性”或“可预测性很差”的“石头”,那么,即便有很好的“手艺”,结果也会大打折扣,甚至徒劳无果。

  潘黎明所做的研究,就是在“烹调”之前,首先追问“食材”本身的“品相”,并为判断“食材”的“品相”提供一种可以量化的方法。对于这样做的必要性,他的导师周涛教授曾在博文中写道:

  “知道了一个网络的链路在多大程度上‘能够被预测出来’,就能够提供给我们很强大的工具,使得我们可以去判断算法是否已经接近甚至达到预测的上界以及是否还有提升的空间。事实上,这个‘可被预测的程度’本身也可以看做网络的一种重要性质。”

  链路的“可预测性”这一理念,本身就是链路预测研究领域的一大创新。但如何衡量“可预测性”的程度呢?在研究中,他们用网络特征向量空间来衡量网络的结构规则性,并假设网络规则性越强,受随机增加或减少链路的扰动影响越小。通过应用类似于量子力学中对“哈密顿量”做一阶微扰的方法,潘黎明等人在论文中提出了名为“结构一致性”(structural consistence)的新指标。

  这个指标是网络的一个特征指标,可以直接用来刻画网络“可被预测的程度”。在此基础上,他们提出了一种名为“结构微扰法”的新的链路预测方法,其在预测丢失链路以及甄别“噪音边”两方面都明显超过了当前主流的“层次结构法”和“随机分块法”。

  该研究成果在2015年2月被与《Nature》《Science》齐名的《美国科学院院刊》刊发。《美国科学院院刊》是目前全球被引用次数最多的综合学科文献之一,收录的文献涵盖生物、物理和社会科学,2009年影响因子为9.432,在SCI综合科学类排名第三位。

01.jpg

上下求索

如愿找到自己喜爱的方向

  潘黎明从刚进入电子科大计算机学院读博,就开始接触并研究“链路预测”课题。一直到2015年2月发表这篇高水平论文,前后持续两年之久。此间经历的曲曲折折、酸甜苦辣不在少数,但他一直认为,能够在自己喜欢的领域辛勤耕耘,是一件让人感到满足和幸福的事情。

  潘黎明本科、硕士均就读于上海东华大学,本科阶段学习自动化,硕士阶段转至通信领域。2011年,硕士毕业后即来到电子科大,并获得到瑞士弗里堡大学联合培养的机会。然而,他渐渐感觉自己最喜欢的其实是统计物理,于是放弃瑞士的学籍回国读博,2014年,潘黎明大胆地跨学科投师本是物理学出身如今在大数据领风生水起的周涛教授。

  回顾这段曲折的经历,潘黎明说,寻找自己感兴趣的研究方向也是一个认识自我的过程。每个人的内心里可能都隐含着一种衡量事物的标准,只是我们一般没有察觉。但这种标准会指引着我们做出人生的选择。潘黎明的最终选择就是统计物理。

  他认为,统计物理是一整套认识世界的“世界观”和“方法论”,其主要任务就是从对物质微观结构和相互作用的认识出发,说明或预言由大量粒子组成的宏观物体的物理性质。他经常研究1023之多的物质微粒,并乐此不疲地琢磨物质的微观机制与宏观性质之间的神秘关系。

  “当我认识到宏观的性质隐藏在微观的结构和作用机制当中时,思想上很受震撼,也深深地被它吸引了!”潘黎明说,用“机械论”和“还原论”的观念或牛顿的力学方程去理解物质的微观机理,尤其是要直接描述如此巨量粒子的相互作用,就会捉襟见肘,因此,必须采用统计物理的概率统计方法去研究。

  潘黎明所研究的“链路预测”问题,其实也是基于概率统计方法的一种研究。不过,话说回来,在最开始研究链路预测时,他的处境依然是十分“悲剧”的。之所以说“悲剧”是因为科学研究面临的都是未知的问题,即便找到了具体的方向,依然无法确知具体的路径。因此,很多时候,他都感到“黑压压的森林遮挡住了前行的视线,让人感到茫然无助”。

  “做科研就像是在黑夜中赶路,你只知道必须往前走,但却看不见前方的路,无法判断自己走得对不对。”后来,在周涛教授和团队成员的帮助下,潘黎明大量阅读文献、扩展视野、深入思考,终于理出了眉目。“复杂网络链路可预测性”一文正是他“望尽天涯路”之后的重要成果。虽然路途艰辛,但他坚定地说:“既然选择了这条路,哪怕是跪着走也要坚持走下去!况且,这是一条自己喜欢的道路,付出多少努力都是幸福的。”

自由奔放

在没有“条条框框”的团队尽情驰骋

  潘黎明是一个“自由惯了”的人,因此他最终选择了学术道路而没有选择去企业工作。在他的理解中,学术的责任就是要探索未知,而要探索未知就要解放思想,摒除思想自由驰骋的一切条条框框。

  来到周涛教授的团队之后,潘黎明觉得,“这正是自己所要寻找的自由团队。”周涛教授在复杂性科学、大数据挖掘、信息物理等方面有深入的研究和系统的贡献,是一位富有传奇色彩但没有“条条框框”的杰出青年才俊。在互联网科学中心、大数据研究中心,包括潘黎明在内的几乎所有学生都把周涛叫“涛哥”。

  潘黎明坦承,“涛哥”对自己的影响很大。“他很随性、很开放,是那种跟着自己的兴趣和想法走的人,这一点和我很对路.”他说,在“涛哥”的风格影响下,整个团队洋溢着一种浓厚的自由气息和积极进取的氛围。

  “涛哥”自由发散、天马行空的思维,对潘黎明的研究带来了很大的启发,无论是研究“复杂网络链路可预测性”,还是研究统计物理问题,都让他受益匪浅。尤其是他们一起合作,把统计物理学中十分常见的“微扰法”引入了“链路预测”研究以考察“结构一致性越强的网络越容易被准确预测丢失的链路”的理论假设,结果获得了很大的成功。

  潘黎明的兴趣和研究方向都是统计物理,来计算机学院读博本来就带着交叉融合的色彩。而团队的自由与包容,恰好为开展交叉研究提供了良好的环境。潘黎明介绍,团队里有很多年轻的老师或博士,而且来自数学、物理、计算机、自动化、通讯、物理等各个学科,无不从各自的角度探索进军大数据和复杂性科学的路径。团队也十分尊重每个人的兴趣,并善于发挥每个人的特长。团队成员之间坦诚交流,经常相互碰撞、相互启发,产生源源不断的新奇观念,从而使团队保持蓬勃的活力。

  “在这样一个优秀的团队工作,我们以后一定能够产生更多的研究成果。”潘黎明很有信心地说,目前在“链路预测”方面取得的成绩仅仅是活用研究方法的“副产品”之一,未来在统计物理方面还有大量有待开垦的空间。学无止境,探索未知的道路“漫漫而修远兮”,“迷雾森林”也将常伴他的整个科研过程,但他相信,只要坚持自己的兴趣,总会寻找到“穿林破雾”的光亮,照亮前行的征程。


编辑:林坤  / 审核:罗莎  / 发布:一戈