5月26日记者获悉,西安交大电信学部计算机学院陕西省大数据知识工程实验室曹相湧副教授团队,在计算机视觉领域的国际顶级会议CVPR 2025(IEEE国际计算机视觉与模式识别会议)上取得系列重要突破。

曹相湧团队长期深耕遥感图像智能解译、底层图像处理、生成式大模型等基础研究方向,致力于推动人工智能技术在星/机载遥感图像解译、智慧城市、低空经济等领域的创新应用。此次会议中,团队聚焦遥感图像处理与分析任务中训练样本缺乏、模型泛化能力不足等关键难题,提出了创新性的解决方案。

针对遥感图像开放词汇语义分割(OVSS)的挑战,曹相湧团队提出了首个无须训练的解决方案SegEarth-OV。显著降低了遥感图像语义分割任务对大规模人工标注数据的依赖,在多样化遥感场景下均能实现高质量的分割效果,为遥感图像的智能化解译提供了更高效、更灵活的技术路径。

面对遥感图像目标检测(RSIOD)领域高质量标注数据稀缺的瓶颈,曹相湧团队提出了一种名为AeroGen的布局可控扩散生成式大模型。该成果首次实现了对遥感图像中水平和旋转包围框目标的同时可控生成,能够按需合成高保真度的训练数据,有效提升了下游检测模型性能,尤其对提升稀有类别检测精度具有重要意义。  

在同期举办的CVPR 2025国际挑战赛中,曹相湧团队获两项冠军、一项季军。在“第四届反无人机挑战赛”多目标无人机跟踪赛道中,曹相湧团队以其提出的“Dist-Tracker”方案,为低空安全防卫领域提供了重要的技术储备和解决方案,荣获该赛道国际冠军。在“图像超分挑战赛”通用赛道和高效赛道中,曹相湧团队所提“SMFFRaw”方案夺得通用赛道冠军和高效赛道季军,为推动图像处理技术在移动设备、专业摄影等领域的应用作出了积极贡献。


责任编辑:黄蕊