图像匹配挑战赛
Image Matching Challenge 2024 - Hexathlon
该项比赛旨在利用计算机视觉技术,匹配不同视角下的同一个场景,从而恢复每张图像拍摄时的相机内外参矩阵。今年的比赛中主要对象有室外场景和透明弱纹理物体,这里主要关注室外场景的匹配策略,来总结一下前几名的思路。
总的来说,先通过一次稀疏的匹配,将部分旋转过的图像摆正,再将图像使用ALIKED和LightGlue进行匹配,并使用DBSCAN获取密集的匹配区域,并再一次进行密集匹配,将匹配点输入COLMAP进行位姿计算。第一名完全没有使用Dense-base的方法,他们认为这种方法获得的匹配点通常只在两张图之间,不具备传递性,会导致模型计算错误。
亮点:
- 根据图像稀疏匹配确定待匹配对
- 微调过的ALIKED和LightGlue
- 一些运行效率上的优化,如缓存、分布式训练
- 多尺度下的特征点匹配,在1280分辨率下匹配一次后,通过DBSCAN聚类获取匹配密集区域,剪裁图像后,在2048分辨率下再进行一次匹配,以获取更精细的匹配
- 对图像进行了旋转检测和透明度检测,为了后面分别处理透明图像和非透明图像(大部分方法都将这两种图像分开处理);
- 对所有图像进行了全局特征提取,以生成更可靠的图像匹配对;
- 根据图像匹配对,使用了**(Dedodev2+Dual SoftMax)、(DISK+LightGlue)、 (SIFT+NN)**三种方法获取匹配点;
- 使用了一种基于最小生成树的策略获取各图像全局最优的相邻图,用于第一个粗略的SFM;
- 同时使用全局最优的相邻图和全连接图进行SFM,获得两个SFM结果,用粗略的SFM结果来过滤精细SFM结果中错误的部分,再使用PixSFM和HLoc中重定位模块来处理缺失的相机。
- 透明图像处理不做赘述。
亮点:
- 主要在使用MST获取全局最优图以及使用粗略的SFM结果来过滤精细SFM结果中错误的部分