科研学术

分享到微信 ×
打开微信“扫一扫”
即可将网页分享至朋友圈
未来媒体研究中心申恒涛团队在ACM MM 2019大会赛事中获佳绩
文:未来媒体研究中心 图:未来媒体研究中心 来源:未来媒体研究中心 时间:2019-10-31 7448

  近日,全球多媒体领域最顶级的学术会议ACM MM 2019大会在法国尼斯拉开序幕,我校未来媒体研究中心硕士研究生许启迪(指导老师沈复民、申恒涛)为第一作者的论文《Time-aware Session Embedding for Click-Through-Rate Prediction》,在大会举办的HULU CBVRP(基于内容的视频关联预测推荐)大赛中一举夺魁,斩获ACM Multimedia 2019 Grand Challenge Winner First Place。这是继今年7月团队在大赛TV series赛道取得世界冠军之后斩获的又一佳绩。

1.jpg

  在此次大赛中,我校参赛选手许启迪和队友在沈复民、申恒涛教授的指导下,以经典的Item2Vec推荐算法为主干,在基于用户观看历史的视频嵌入向量基础上,自适应地引入一个时间衰退因子,在计算目标视频相似度时,更多考虑用户最近观看的视频,相对减弱时间较远视频的影响。同时,为了捕捉用户对视频点击行为的多义化兴趣,在视频的嵌入过程中引入了多头注意力转换器结构,使得结果大幅提升。此外,团队还提出了一种视频多模态特征的融合算法,使得模型能够从视觉/听觉等不同维度对不同视频进行分析。该方法在电视剧赛道上取得了auc:0.6656的成绩,获得了比赛第一名。在Acm Multimedia 2019会议举办现场,大会组委会对Grand Challenge中7个challenge接收的所有paper进行了评选,该工作最终从进入决赛的20篇论文中脱颖而出,获得了所有challenge的第一名。

2.jpg

  ACM Multimedia是中国计算机学会推荐的多媒体领域A类国际会议。为了增强学界和工业界的联系,ACM Multimedia从2009年开始每年专门设置一个名为Multimedia Grand Challenge Session的竞赛单元,由工业界就它们未来5到10年所关心的前沿方向出题,学者通过参加竞赛并投稿论文的形式答题。

  视频相关性预测是在线流媒体服务中最重要的任务之一。根据用户观看或搜索视频的记录,推荐系统能够提供个性化推荐以帮助用户发现更多感兴趣的视频内容。目前大多数在线服务中的视频相关性预测都是基于用户行为,这将不可避免的带来“冷启动”问题,即系统因无法获取新视频的用户行为记录而难以给出相关推荐。基于上述背景,Hulu(北京)与ACM Multimedia 2019 联合推出了基于内容的视频相关性预测大赛,希望通过智能化的分析理解,将视频本身所包含的图像、声音、文本等源内容有效利用起来,作为视频相关性预测的可靠依据。

  未来媒体研究中心申恒涛教授团队自成立以来,在瞄准高水平学术科研工作的同时,也高度重视创新人才培养工作。中心全体教师均承担本科和研究生教学,在培养学生从事高水平科研“硬实力”的同时,通过“听说读写”新四会能力的培养提升学生的“软实力”,面向未来致力于培养具有爱国情怀、全球素养、扎实基础、知识综合与集成创新能力的创新引领性人才。

  中心积极为学生搭建国际化平台,支持学生参与国际合作项目,资助优秀学生去昆士兰大学、新加坡国立大学、悉尼科技大学等国外著名研究机构访问实习,参加高水平国际会议,助力培养学生立足人工智能前沿问题,坚定“文化自信”,鼓励学生在国际人工智能舞台踊跃发出“成电声音”,提供“中国方案”,贡献“中国智慧”。与此同时,中心定期邀请相关研究领域国内外著名教授来校指导学生科研工作、做学术报告,如:IEEE/ACM Fellow、新加坡国立大学杰出教授Ooi Beng Chin,IEEE/ACM Fellow、微软研究院首席研究员张正友,IEEE Fellow、荷兰代尔夫特理工大学教授Alan Hanjalic 等,并组织指导学生开展大型的英文学术报告活动,邀请国际知名学者亲临现场指导,提供与专家学者近距离互动交流的机会。与此同时,中心老师每周安排的office hour和小组讨论会,用心营造一种“转身遇见名师,随处可见讨论”的良好学术氛围。 

 


编辑:卫道鸿  / 审核:李果  / 发布:陈伟