成电人物

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
【启梦成电】徐增林:大数据时代的“smile 王子”
文:杨丽可 来源:新闻中心 时间:2015-06-15 14988

  “这是商业机密,不要透露啊。”在大数据中心的实验室里,博士二年级学生刘斌正要告知记者,参加淘宝新赛季天池大数据竞赛的细节。旁边的徐增林教授故作紧张地摆手制止,逗得大家都笑了。

014.jpg

  徐增林高高帅帅,白皙儒雅,手指修长。谁说男神不幽默?徐教授描述自己个人经历是“打怪升级”的人生,他还将自己的实验室命名为“smile lab”,表达着微笑面对、阳光灿烂的科研态度。

  “我做的是很亲民的研究。”徐增林主研方向是机器学习、数据分析,这在“互联网+”时代是非常重要而前瞻的领域,不过他说得很轻松,甚至建议身为纯文科生的记者也可以学习。

“好玩”的学术:

预测“手机党”下个月买什么

  “一个20岁的都市女性,在夏天某个周末下午的星巴克时间,想要一条玛丽莲梦露式的白色连衣裙,还是更喜欢奥黛丽赫本式的黑色小洋装?”这是淘宝新赛季天池大数据竞赛的一道试题。如此“接地气”的试题吸引了众多数据界的新生代。

  徐增林鼓励支持自己的两名学生积极参加竞赛,基于这样的考虑:有机会让他们了解真实的商业场景的数据,并让自己的学术研究成果走出实验室,还更有利于学生们深入感受“互联网+”时代,更有激情地投入科研工作中,成为时代创新和创业的典范。

  刘斌透露了一点他们正在做的研究,“我们拿到了天猫一个月的部分数据,要建模推测出购物习惯。”刘斌原以为这并不是太难的事儿,“用一个模型套上去就好。”但是,徐增林老师告诉他,不要认为“接地气”的就是容易的,好玩的。他说,最重要的是要读懂数据,其次才是做算法处理,建模型,不能本末倒置。

  面对如火如荼的电子商务大数据竞赛,徐增林不只指导学生参加竞赛,他自己也深入研究其中包含的科学问题,并取得了创新性成果。

  今年三月,徐增林作为第一作者在IEEE顶级期刊T-PAMI(IEEE模式分析与机器智能汇刊)发表文章。他在文中探讨了一种神奇的数据分析——张量分解。以淘宝网为例,这个庞大的网站会员超过3.7亿,在线商品超过8.8亿,每天交易数千万笔,产生约20TB数据。在这里,<用户-商品-交易-时间>数据构成了一个张量,但是,传统的张量分解很难描述各个对象间的复杂关系和处理不同的数据类型。徐增林的研究解决了这一难题,能够更好地发现每个对象上的因子(例如用户的社区结构、商品类型等),用以解释用户的购买规律,并可进一步对用户在未来某一段时间内的购买行为进行预测。

  此外,他的团队在今年人工智能领域的顶级国际会议AAAI发表了两篇文章,其中一篇获最佳学生论文奖提名。

  “数据分析将是大数据研究的核心部分。”徐增林在山呼海啸般的大数据浪潮中,看到了科技发展的走向,坚定地走自己的研究之路。他积极将自己在数据分析领域十余年的研究成果应用于多个行业,包括互联网用户画像、社保的欺诈检测、移动用户的行为分析、医疗辅助诊断等。

  除了将数据分析算法直接运用于行业数据改善行业的生产服务模式之外,徐增林还醉心于机器学习理论与算法的研究。想一想,“如果人类所有的决策都建立在对丰富数据的智能分析基础上,人类该多么省心。”徐增林正在研究开发这样的系统。机器学习是使计算机系统能够利用经验来改善自身性能的智能科学,它与模式识别和统计推理联系紧密,也是人工智能的核心研究领域之一。机器学习涉及到统计学、概率论、算法复杂度理论和逼近论等多门学科。几乎所有的学科都需要对数据进行分析,所以机器学习已渗透到计算机科学以外的各个领域。

  近年来,特别是随着大数据时代的到来,机器学习在理论研究和实际应用上都得到了很大程度的发展。从医学诊断、基因序列测序、智能家电,到机器人运用、航空航天技术等等,机器学习都发挥着非常重要的作用。徐增林和他的“smile团队”正在这一领域积极探索。

打怪升级的人生:

学术新鲜人到成绩卓著的青年学者

  在别人眼里,这位青年学者可谓“人生赢家”,但徐增林认为自己一步一步努力走来,可谓“打怪升级的人生”。

  “刚到香港读博士时很新鲜,经常出去玩,去海边,看电影……”2006年,徐增林到香港中文大学攻读博士学位。轻松了一段时间后,科研进展不大。这是他人生中的第一个挫折。

  “在这之前,我的人生是没有多少故事的。”徐增林说。读博之前他一直是运气很好的优等生,高考成绩在山东省排千分之二,大学时参加数模竞赛确定了对数据分析的兴趣,读研时有很优秀的师兄带着做研究。渐渐地,“我特别想知道许多现象背后的‘为什么’,这促使我继续深造。”良好的学业基础为他提供了很棒的学业方向,他就读于全球排名前列的香港中文大学计算机专业。

  如果说前面的“打怪升级”难度不大,到了读博阶段,难度陡然加大。徐增林开始发力,他扎扎实实地读论文,积极与老师联系,寻求合作。他师从多位知名学者,包括香港中文大学工程学院副院长、亚太神经网络协会(APPNA)常务副会长Irwin King教授和IEEE会士、美国科学促进会(AAAS)会士Michael R. Lyu教授。 在读博期间,徐增林还参加了多次顶尖级的国际会议。

  顺利拿到博士学位后,徐增林又不满足现状。国际视野已经打开,他向往更开阔的学术世界。“在我读硕士时,还觉得遗传算法很新。到香港以后,发现别人都不玩这个,而是玩更新的东西,比如统计学习。”徐增林希望到国外继续学习,深入了解主流学界的研究,学习更popular的方法。

  在他申请美国学校时,遇到了意外。此时正是2009年金融海啸席卷美国,公司裁员,大学冻结科研经费, 徐增林决定“曲线救国”,先在德国马克思·普朗克信息研究所和萨尔大学做博士后,后来再去美国的普渡大学做研究。“在国外做研究是很残酷的,因为是导师出钱,如果没有成果,他有权利开掉你。”经过香港的经历,徐增林在美国的研究过程很顺利。他的主要合作者包括密西根州立大学Rong Jin教授、芬兰科学院院士/IEEE会士Erkki Oja教授、普渡大学Alan Qi教授、Ninghui Li教授等。徐增林至今已在中国计算机学会(CCF)指定的A/B类期刊会议上发表近30篇高水平论文,在机器学习、大数据分析以及其在神经信息学、社会网络分析、异常检测等方面的数据处理方面取得突出成就。

  “我和妻子都喜欢尝试不同的生活。”他们从香港到欧洲再到美国,现在他们带着5岁的孩子来到电子科大开启新的人生旅程。

蔚蓝的梦想:

投身“互联网+”,他要怎么+?

  在近日举行的国家卫生计生委统计信息中心·电子科技大学医疗健康大数据研究院成立大会上,徐增林被任命为该研究院的医疗健康大数据挖掘研究所的所长。他将利用知识才能推动建设这一具有国际学术影响力的创新服务平台,为我国医疗健康大数据相关产业与应用技术的发展服务。

  “‘互联网+’是从事电子信息、大数据、云计算等学科的教学和科研工作者的幸事。”徐增林在电子科大教代会发言时感慨地说。如何抓住这宝贵的历史机遇,实现梦想呢?

  徐增林认为,最重要的是关注大学科的进展和社会发展趋势,实现“跨界”。 他的团队正与校友企业成都勤智数码合作开发运维大数据分析平台,与成都市社保局合作使用机器学习算法进行欺诈检测和骗保分析。

  他的团队还将抓住移动医疗的发展趋势,寻求同四川省人民医院的合作,使用大数据分析手段对电子病历数据、医疗影像数据等进行智能化分析,为临床诊断提供辅助决策手段和循证支持。“我们就是要把握科学发展趋势,积极融入到国计民生中去。”

  成为教师是徐增林的梦想,当他成为电子科大一员后,他又在积极思考“如何培养学生成为创新创业的主体?如何让基础扎实并且热衷于科研的学生选择电子科大继续深造?如何让成功的校友踊跃回馈母校?”

  在这个科技改变社会的时代,徐增林认为,只有独立思考,具有领导力和责任心的人才才能永立创业潮头。在教学工作中,他努力地培养学生优秀的品质,他也加入计算机学院的“立人班”导师队伍中。目前,他尝试使用MOOC的方式来让学生选择网上的部分公开课或者跨学院选课,弥补专业课程设置的缺陷,扩大自己的知识面; 使用小组讨论的方式来加深学生对知识的了解和对问题的思考能力。他还鼓励学生去百度、阿里和腾讯等科技企业实习,提前了解岗位需求,谋划未来,完善自身的能力。徐增林还希望借用研究大数据的便利,研究学生的日常数据,借鉴国外经验,来优化培养模式。

  既然选择了远方,就只管风雨兼程。这是徐增林和他的SMILE Lab在大时代的梦想和征程。


编辑:旷野  / 审核:旷野  / 发布:林坤