即可将网页分享至朋友圈
近日,信息与通信工程学院2016级本科生王谭在计算机科学与工程学院杨阳教授和徐行副教授的指导下,以第一作者撰写的论文“Matching Images and Text with Multi-modal Tensor Fusion and Re-ranking”(基于多模态张量融合和重排序的图像文本检索)被第27届国际多媒体会议(The 27th ACM International Conference on Multimedia) 接受为Oral(大会演讲)论文。该会议于10月21-25日在法国尼斯召开,王谭同学在会议上报告并交流其发表的论文。
该论文针对现有跨模态检索技术存在的时间资源占用大的问题,对现有的主流两种方法(Classification-based, Embedding-based) 的优点进行整合,在2个数据集上取得当前最好检索效果的同时,将训练过程缩短近一半的时间。同时,作者进一步考虑了文本自有的相似度信息在跨模态检索中的作用,提出了一个简单已用的检索结果改进算法,对目前主流的方法均适用且能在短时间内进一步提升检索的准确率。
方法框架图
ACM国际多媒体会议(ACM MM)是多媒体领域世界顶级会议,也是中国计算机学会推荐的A类国际学术会议(计算机图形学与多媒体方向仅有三个CCF A类会议)。本届ACM MM收到来自世界各地的有效论文投稿近950篇,其中口头报告录取率约为5%。
王谭是电子科技大学信息与通信学院2016级本科生,在校前3年期间荣获国家奖学金,唐立新奖学金。大三开始进入电子科技大学未来媒体研究中心实验室,师从杨阳教授以及徐行副教授开展研究,目前受阿里巴巴-新加坡南洋理工大学联合实验室的全额资助,在南洋理工大学进行科研实习。
论文链接:https://dl.acm.org/citation.cfm?id=3343031.3350875
编辑:罗莎 / 审核:林坤 / 发布:林坤