即可将网页分享至朋友圈
近日,2025 IEEE国际计算机视觉大会(IEEE International Conference on Computer Vision,简称ICCV 2025)官方公布论文收录结果。据ICCV程序委员会统计,本届会议共收到有效投稿11,239篇(较ICCV 2023增长36%),最终录用2,698篇论文。计算机(网安)学院数据智能团队(DIG)由2022级本科生周鑫杨、2024级硕士研究生娄峻瑜、2023级硕士研究生张进华、2024级博士研究生游炜熠、2021级博士研究生刘亚豪撰写的5篇论文被此次会议接收。
图1 论文《The Devil is in the Spurious Correlations: Boosting Moment Retrieval with Dynamic Learning》内容示意图
2022级本科生周鑫杨以共同第一作者与新加坡国立大学合作撰写的论文《The Devil is in the Spurious Correlations: Boosting Moment Retrieval with Dynamic Learning》(作者:周鑫杨、魏凡越、段立新、Angela Yao、李文【通讯作者】)。该研究首次揭示了视频检索任务中文本查询与视频上下文之间的存在虚假相关性的问题。该工作通过设计动态上下文视频合成器,将动态上下文信息融合进目标片段中,合成具有更多动态上下文变化的新样本;同时提出了动态增强方法,引入视频动态信息,以增强模型进行视频-文本对齐能力。大量实验证实,该方法在多个视频时刻检索数据集上均达到了目前最优性能。
图2 论文《Learning Pixel-adaptive Multi-layer Perceptrons for Real-time Image Enhancement》内容示意图
2024级硕士生娄峻瑜以第一作者撰写论文《Learning Pixel-adaptive Multi-layer Perceptrons for Real-time Image Enhancement》(作者:娄峻瑜、赵小锐、施柯煊、顾舒航【通讯作者】)。现有的图像增强网络结构往往无法兼顾局部自适应能力与实时性。本文基于双边网格这一具有空间建模能力与高效率的数据结构,为图像上每一个点估计独特的MLP进行颜色映射,实现空间感知的高效图像增强。本文同时提出了网格分解策略,分别存取MLP中不同语义类别的参数,实现图像颜色信息的充分利用与双边网格中MLP参数的精确生成。该方法在色调映射、照片修饰、曝光矫正等多个任务上均取得了最先进的性能。
图3 论文《PerLDiff: Controllable Street View Synthesis Using Perspective-Layout Diffusion Models》网络示意图
2023级硕士生张进华以第一作者撰写的论文《PerLDiff: Controllable Street View Synthesis Using Perspective-Layout Diffusion Models》(作者:张进华、盛华联、蔡思佳、邓兵、梁桥、李文、付莹、叶杰平、顾舒航【通讯作者】)针对自动驾驶领域数据稀缺问题,提出了一种基于预训练大模型的可控交通场景图像生成方法。结合自动驾驶场景3D标注数据的结构化特性,创新性地引入三维几何先验信息,实现了在图像生成过程中的精确物体级控制和高保真街景生成。与传统布局控制方法相比,该方法为下游自动驾驶感知模型的训练提供了更高质量的合成数据。
图4 论文《Consistency Trajectory Matching for One-Step Generative Super-Resolution》内容示意图
2024级博士生游炜熠以第一作者撰写的论文《Consistency Trajectory Matching for One-Step Generative Super-Resolution》(作者:游炜熠、张铭洋、张乐恒、周星宇、施柯煊、顾舒航【通讯作者】)。当前基于扩散模型的超分辨率方法在性能方面表现出色,但需要若干采样步骤,引入了较高的推理成本。为了克服上述挑战,我们提出了一种无需蒸馏的一致性轨迹匹配单步超分辨率方法,该方法首先通过一致性训练直接建立了从带噪声的低分辨率图像到高分辨率图像的确定性映射,同时引入分布轨迹匹配损失,最小化生成图像与自然图像在轨迹上的分布差异,从而提升超分辨结果的真实感。实验结果表明,该方法在多个图像超分辨率数据集上均取得了最先进的性能。
图5 论文《Balanced Sharpness-Aware Minimization for Imbalanced Regressionn》内容示意图
2021级博士生刘亚豪以第一作者撰写论文《Balanced Sharpness-Aware Minimization for Imbalanced Regression》(作者:刘亚豪、王沁、段立新、李文【通讯作者】)。该研究聚焦于回归任务中普遍存在但尚未被充分研究的标签分布不均衡问题。该工作通过分析标签分布不均匀场景下回归模型的损失景观,将不均匀回归问题转化为不均匀泛化问题,提出从分布角度对Sharpness-Aware Minimization方法进行了理论扩展与改进,实现回归模型对数据整体的泛化性提升。大量实验证实,该方法在多个具有标签不均衡特征的回归数据集上均取得了性能提升。
计算机学院数据智能团队(Data Intelligence Group)主要研究领域为机器学习和计算机视觉,具体包括迁移学习、深度学习、弱监督学习、强化学习及在图像视频分析、目标检测、语义分割、眼底影像分析等计算机视觉任务中的应用。研究团队现有正高级教授5人,副教授1人,助理研究员1人,研究生70余人。团队近年研究屡获成绩,发表中国科学院JCR一区或CCF A类期刊会议论文100余篇;荣获四川省科学技术进步奖一等奖,吴文俊人工智能科学技术奖-自然科学奖一等奖等;在国内外多项计算机视觉和人工智能大赛中名列前茅,获2021年CVPR NTIRE移动端视频超分辨比赛全球冠军、2021年火箭军主办的“智箭•火眼”人工智能挑战赛相关科目全国冠军等。
编辑:刘瑶 / 审核:李果 / 发布:陈伟