热红外视觉下的车辆/船舶重识别新方法:Vc-fes-尧图建网站

在监控与海事安防等场景中,如何在**热红外图像**(灰度、无色彩、纹理弱)中准确识别同一辆车或同一艘船,是一个长期悬而未决的难题。近期发表于《International Journal of Machine Learning and Cybernetics》(2026年)的论文《Vc-fes: viewpoint-conditioned feature selection for vehicle re-identification in thermal vision》针对这一问题提出了一套完整的解决方案。## 问题:热红外域重识别为什么难传统的重识别(Re-ID)方法大多在RGB图像上训练,依赖颜色和纹理这类跨视角通用的线索来判断两张图片是否为同一目标。但在热红外图像中:- 没有颜色信息,只剩灰度强度;- 纹理细节被大幅削弱;- 可获取的视角数量有限(不像RGB场景那样容易采集多角度样本)。这导致同类目标(比如两艘外形相近的渔船)在缺乏颜色线索时高度相似,而同一目标从不同视角(前、侧、后)拍摄时特征差异又很大——这两个矛盾叠加,使得直接套用RGB域的重识别算法效果很差。## 方法:视角条件化的特征选择论文提出的核心思路是**将目标的前景图像按可见侧面(前、侧、后)拆分,分别提取特征并分空间比较**,再用各视角的面积占比作为置信度权重融合最终结果。整体流程分为两个子系统:**1. 目标检测与跟踪**基于 TraDeS 算法,针对热红外域做了适配与微调,先用转灰度的COCO数据预训练,再用新采集的热红外海事数据集及 Singapore Maritime Dataset 进行微调,使模型能够在缺乏颜色特征的情况下完成检测与跟踪。**2. 视角条件化重识别**- 首先用一个自建的编码器-解码器网络提取目标前景掩码(实验表明这一步比传统的 GrabCut 方法更适合热红外图像,尤其是在处理船体细小凸出部分和海面反光干扰时表现更好);- 用预训练的 Dino-ViT 提取特征,并通过四个并行线性层将特征映射到全局、前、侧、后四个隐空间,每个空间用 ArcFace 损失增强类间可分性;- 借助与 SPAN 模型类似的思路计算每个视角的**面积占比**(该视角前景掩码占总前景的比例),以此对各空间的 L2 距离加权求和,得到最终的置信度得分;- 训练时联合使用身份分类损失和三元组损失。这种设计的关键优势在于:当查询图像只能看到某一两个侧面时,面积占比会自动把不可见视角的权重降为零,避免了无效比较对最终结果的干扰。## 数据集:首个公开的热红外海事重识别数据集为验证方法,作者用 FLIR M232 热像仪自行采集了一个海事监控数据集,涵盖白天和夜晚场景,标注了船只、大型船舶、行人、水上摩托艇等4类目标的检测框,并整理出用于重识别评估的40艘小型船舶和32艘大型船舶的多视角图像子集。据作者所述,这是目前首个公开的热红外海事监控数据集,同时支持检测、跟踪与重识别三类任务的COCO格式标注。## 结果在跟踪任务上,改进后的 TraDeS 在热红外数据上取得了约 61.2% 的 MOTA,与其在RGB域的表现基本持平,同时保持 30fps 的处理速度,证明了域适配的有效性。在重识别任务上,该方法在RGBNT100(热红外车辆数据集)和作者自建的海事数据集上分别以 mAP 提升 19.7% 和 12.8% 超过此前的最优方法(SPAN)。消融实验也表明:引入 ViT 特征提取、ArcFace 视角空间映射、以及多视角特征融合(相较仅用面积占比最大的单一视角)均能带来稳定的性能提升,尤其在热红外域收益最为明显。## 链接- 论文原文:https://link.springer.com/article/10.1007/s13042-026-03049-w- 数据集主页:https://hevidra.github.io/- 代码仓库:https://github.com/YasodGinige/VCFeS-Maritime-Surveillance

相关新闻

逆向工程实战：从二进制文件解析到自定义格式逆向分析

「 简记往来」第十八篇：云服务器部署——从购买到上线的完整流程

markword在高并发场景下变化剖析

最新新闻

Java SpringBoot+Vue3+MyBatis 校园一卡通abo系统源码｜前后端分离+MySQL数据库

企业为何为AI付费：确定性、安全与领域适配性驱动的决策逻辑

永磁同步电机ADRC控制：原理、实现与性能优化

国内合规调用国际大模型的三大可信路径

Claude、Gemini、ChatGPT能力差异与工程化选型指南

ChatGPT付费值不值？从时间ROI与隐性成本看AI工具商业化本质

日新闻

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

周新闻

3步彻底解决Windows右键菜单混乱问题：ContextMenuManager使用全攻略

通达OA SQL注入漏洞深度剖析：从手工注入到自动化利用与防御

MLT 2026启示：因果推理与概率建模驱动下一代LLM应用

月新闻

FAE放射组学分析工具：医学影像特征探索的完整解决方案

基于Dify与DeepSeek构建私有知识库问答系统实战指南

餐饮老板必看：扫码点餐小程序3步搞定，别再让顾客干等了！

「简记往来」第十八篇：云服务器部署——从购买到上线的完整流程