即可将网页分享至朋友圈
我校信息与软件工程学院嵌入式智能计算团队在IEEE Transactions on Multimedia上发表题为“Self-Supervised Scene-Debiasing for Video Representation Learning via Background Patching”的论文。软件学院2019级来华留学博士研究生Maregu Assefa为研究成果的第一作者,江维副教授为通讯作者,电子科技大学信息与软件工程学院为第一作者单位和通讯单位。
自监督学习通过从未标记视频中自动发现监督信号,进而改进视频表示学习能力。针对现有视频数据的固有场景偏差问题,该研究提出了一种可用于自监督视频表征学习的基于背景修补的场景去偏差增强策略,如下图所示。该研究通过自监督方式将目标视频背景与随机修补帧混合,以减少场景和背景偏差带来的严重影响。同时,该研究通过标签平滑正则化促进标签混合,进一步改进了视频理解的自我监督训练方法。实验结果表明该研究显著增强了视频时空表征的稳健性,进而较好地提高了视频理解任务的性能。
基于背景修补的自监督视频学习框架图
IEEE Transactions on Multimedia是多媒体领域的国际顶级期刊,专注刊登多媒体技术与应用的最新研究成果,2021-2022年度影响因子8.182,是中科院JCR一区Top期刊。嵌入式智能计算团队成立于上世纪八十年代末, 是国内最早开展嵌入式系统及可信计算研究的单位之一。专门从事嵌入式实时计算机系统的软硬件及应用技术的研究。近十年来,团队延续了嵌入式实时操作系统内核和嵌入式实时应用领域的研究,并逐步实现了从传统的嵌入式技术到智能嵌入式系统的成功转型,在图像处理、大数据分析、综合视频监控、物联网技术、区块链技术等领域开展研究,在国防、铁路交通、电信、金融、医养、物流等领域与企业建立了深度合作关系,在多个方向上形成了自己独有的特色。
论文链接:http://dx.doi.org/10.1109/TMM.2022.3193559
编辑:肖洁 / 审核:林坤 / 发布:陈伟