近日,第八届中国模式识别与计算机视觉大会(PRCV2025)在上海召开,我院2022级计算机科学与技术1班本科生张礼政关于伪装目标检测领域的论文:MambaCOD: Cross-modal Mamba Fusion Network with Adapter Tuning for RGB-D Camouflaged Object Detection被大会录用并受邀做论文Oral报告。

图1 MambaCOD模型
伪装物体检测 (COD) 旨在识别视觉上与周围环境融合的物体。虽然深度图通常用于增强 COD 的空间理解和泛化能力,但现有方法存在深度质量差、由于依赖卷积或 Transformer 主干而导致特征提取受限以及计算成本高昂的跨模态融合效率低下等问题。为了解决这些问题,该研究提出了 MambaCOD,这是一个基于跨模态 Mamba 融合网络并支持适配器微调的新型 RGB-D COD 框架。具体而言,该研究首先引入了伪装认知视觉适配器 (Cona),它与冻结的双流 VMamba 主干协同工作,在保留预训练知识的同时提取有效的 RGB 和深度特征。其次,该研究设计了一个跨状态空间模型 (Cross-SSM) 模块,该模块集成了精心设计的 Shell-Like 扫描 (SLS) 策略和 Dual-SSM 结构,以实现高效的跨模态融合。最后,该研究引入了边缘提取模块 (EEM) 和解码器,以增强边缘感知和多尺度预测能力。在四个基准数据集上进行的大量实验表明,MambaCOD 达到了最佳性能。


图2 张礼政在大会现场做口头报告
论文题目为:MambaCOD: Cross-modal Mamba Fusion Network with Adapter Tuning for RGB-D Camouflaged Object Detection,我院2022级计算机科学与技术1班本科生张礼政为共同第一作者,其指导老师为青年教师吴杰胜博士,接标教授为论文通信作者,安徽师范大学计算机与信息学院为第一完成单位。
中国模式识别与计算机视觉大会(PRCV)是由南京大学党委书记、中科院院士谭铁牛院士发起并大力推动建立的。据官方信息显示,PRCV 是国内模式识别和计算机视觉领域顶级学术盛会,也是国际上重要且受到国际学术界认可会议,进入中国计算机学会推荐国际学术会议和期刊目录分区(CCF-C)。本次会议由中国图象图形学学会(CSIG)、中国人工智能学会(CAAI)、中国计算机学会(CCF)和中国自动化学会(CAA)四大学会联合主办,上海交通大学承办,于2025年10月15日-18日在上海国家会展中心举办。PRCV 2025一共收到2370篇投稿,录用701篇,录用率仅为29.58%。