基于图像配准的微小型自主水下机器人视觉全局定位方法

2023-03-01 07:30李邱达边春华
仪器仪表用户 2023年3期
关键词:关键帧姿态轨迹

李邱达,边春华,张 维,文 杰

(中核核电运行管理有限公司,浙江 嘉兴 314300)

0 引言

随着机器人和传感技术的最新进展,微小型自主水下机器人已应用于人类无法进入或不安全地区的各种水下任务。尤其是,由于安全原因,人类潜水员的现有检查方法存在明显的局限性。因此,水上结构物的目视检查是无人潜水器的一种典型应用[1]。使用水下机器人系统进行自主视觉检查可以提高操作安全性和任务的实际性能。对于自主视觉检查,非常希望能够创建视觉地图并同时相对于地图定位车辆,称为视觉同步定位和映射(SLAM),基于特征的成对图像配准是视觉SLAM前端级的常用方案[2]。通常,视觉特征稀疏地位于水下结构物的表面。这种环境特征可能导致在成对图像配准时产生无意义计算,主要有两个原因:①视觉上无信息的图像的特征提取;②条件较差的图像的特征匹配[3]。该研究提出了一种选择性图像配准方案,该方案包括两个附加步骤:关键帧选择和关键对选择。所提出的方法既可以有效地拒绝非信息图像,又可以减少成对图像匹配的无意义尝试,因此预计它将提高视觉SLAM的总体计算效率。

1 视觉SLAM框架

1.1 SLAM滤波器

使用增强状态卡尔曼滤波器来解决基于视觉的姿态估计问题。在预定义的图像采集模式下(即,使用所有输入图像或仅使用关键帧图像),扩增状态向量定义如下:

这里,x是表示车辆当前姿势的状态向量。车辆状态定义为三维位置坐标和航向角(即x=[x y z]),考虑到机器人的运动通常在横摇和俯仰中充分稳定[4]。增强状态的其他元素{x,i=0,…,k-1}表示以前状态的历史,收集的姿势对应于姿势图结构中的节点[5]。随着历史姿态节点的增加,相应的误差协方差矩阵也随之增加[6]。本研究中制定的SLAM滤波器使用两种不同类型的观测值:一个是局部参考坐标系中z方向上的绝对深度测量,另一个是通过成对图像配准获得的相对姿态测量(即相机测量)。假设各测量噪声项遵循零均值高斯分布。

1.2 基于特征的成对图像配准

可见光在水中的显著衰减和散射,导致低对比度和不均匀照明获取的水下图像中的效果。为了增强原始灰度图像的可见性,采用对比度受限自适应直方图均衡化(CLAHE)作为预处理步骤,然后使用尺度不变特征变换(SIFT)提取显著特征并计算描述符向量。

随后,使用SIFT描述符执行成对匹配步骤来估计图像配准模型,并从中获得相对姿态测量。这里,使用二维单应模型进行图像配准,假设从水下结构表面获得的局部场景近似平面。初始匹配结果可能有不正确的对应关系,称为异常值[7]。为了去除异常值并确定图像对之间的主导单应模型,使用随机样本一致性(RANSAC)方法作为一种稳健的模型拟合算法。剔除异常值后,通过正交回归从内部对应计算出相对单应。

通过一系列的坐标变换,将UUV的相对姿态信息从产生的单应图中提取出来,并利用相机内部参数和高度测量来解决相对平移信息中固有的尺度模糊性。

1.3 闭环测试

式中,

典型的运动结构(SFM)方法从一系列视频帧中估计摄像机运动和3-D场景结构。然而,在使用的应用程序中,低程度的时间图像重叠(通常是35%或更少的数字静止图像)促使专业人员专注于从空间相邻的图像帧中恢复成对测量。在这种方法中,摄像机提供了模尺度姿态之间的6-DoF相对坐标转换的观测(通过计算基本矩阵)。这些测量值在递归估计中用作约束框架,确定与相机测量和导航一致的全局姿态,全局姿态对应于与图像采集相关的时间点机器人轨迹的样本。因此,与典型的基于特征的SLAM估计问题不同,它跟踪当前机器人姿态和相关的地标地图,视觉增强导航(VAN)状态向量完全由图像采集时采样的历史轨迹样本组成。在命名法中,这些样本被称为延迟态。

延迟状态方法对应于基于视图的环境表示,其中估计传感器导航提供了时间(Markov)观测,而重叠图像提供了时间和非时间(即空间图像重叠)姿态约束。这种基于视图的方法可以通过文献追溯到Lu和Milios使用激光距离数据的批量扫描匹配方法。Leonard和Rikoski的延迟决策框架,用于声纳数据的特征初始化,以及Fleischer和McLauchlan使用相机图像的混合批处理/递归公式。在这种情况下,成对注册的图像可以观察到机器人相对于之前访问过的地方进行运动。

2 图像配准模式

2.1 关键帧选择

所提出的关键帧选择方法基于CLAHE的直方图均衡图像。首先,采用高斯差分(DoG)滤波器来识别预处理图像中每个点的清晰度。由DoG滤波器创建的独特性图像ID表示为

其中,I表示直方图均衡图像;G(kσ)和G(σ)分别是具有不同尺度kσ和σ的高斯核函数。

使用DoG的两个主要原因如下:①高斯尺度归一化拉普拉斯(LoG)被认为是图像最稳定的显著性检测器,并且DoG是归一化LoG的合理且计算效率高的近似值;②本工作中使用的SIFT算法还利用DoG函数来寻找候选特征。因此,得到的图像中的显著性值可以反映与SIFT特征的接近趋势。

SIFT特征点是通过尺度层及其相邻层应用非最大抑制来确定的。尽管所提出的方法由于其计算负担而没有显示生成尺度空间,但如果原始尺度层中的显著性值远远大于相邻值的显著性值,则该点很可能是SIFT特征。考虑到这一点,采用相对于显著性值的梯度,并将梯度的大小规格化如下

其中,归一化项可以直观地近似为ID∈(-Imax,Imax),Imax表示最大强度值,对应于白色像素。

基于DoG的归一化梯度,引入了一种定量度量来表示每个图像的信息性。为此,定义了以下关键帧度量,其表示归一化梯度的比率大于阈值Gt。

这里,F(·)表示与标准化梯度之比相关的累积分布函数形象。

图2描述了使用水下图像数据集的初步测试结果。这里,针对每个图像计算并呈现了所提出的关键帧度量(Sf)。此外,SIFT提取的特征数量(Nf)被表示为确认计算值的有效性。从结果评估和比较中可以看出,计算的关键帧度量与SIFT特征的数量成正比例。使用水下图像数据集对所提出的关键措施进行初步测试的结果,用于测试的水下图像在图1(a)~图1(b)中以纹理丰富度的递减顺序显示,图1(c)、图1(d)分别表示与每个测试图像相对应的DoG归一化梯度的统计直方图和累积分布。在每个分布图中指定关键帧度量(Sf)和SIFT特征的数量(Nf)。

图1 使用水下图像进行初步测试的结果Fig.1 Results of preliminary test using underwater images

图2 测试结果图Fig.2 Test results

2.2 密钥对选择

通过评估相机测量的预期不确定性,计算关键对度量以确定是否执行特征匹配步骤。作为高斯随机向量的摄像机测量值zc表示为

式(7)中:Δxi,j,Δyi、j和Δψi,j表示相对x,y平移以及第i和第j之间航向角的变化第j个图像;∑c是相对姿势观察。

假设相机测量主要受比较图像之间的相对单应性影响。因此,为了公式化相机测量的预期不确定性,单应性参数也被视为高斯随机向量,如式(8)所示。

其中,平均向量h由H ij的元素组成,∑h表示相应的协方差矩阵。

一对图像之间的重叠区域通过以下方式估计:与比较图像相关的导航姿态信息(即,增强状态向量的当前估计)。在预期的重叠区域中,认为相机测量的不确定性受到每个特征位置的不确定性和用于拟合相对单应性模型的对应观察数的影响。通过文献中提出的方法获得特征位置的不确定性[8],对应观测值的数量近似为重叠区域中的特征数量。基于该信息,通过协方差更新方程以贝叶斯递归估计的方式计算期望单应性不确定性。

键对测量的测试结果如图2,示例图像是从将过去图像映射到各个目标图像。所得到的密钥对度量值越高,意味着对应的图像越有可能基于重叠区域(蓝色矩形)中的特征观察(黄色圆圈点)实现成功的图像配准。图2为拟定关键空气措施的初步测试结果。图2(a)以及图2(b)描绘高度可能的图像以实现成功的图像配准。尽管图2(a)的预期重叠区域小于图2(b)的重叠区域,但由于特征观察的数量较多,图2(a)中的关键对得分高于图2(b)中的。

3 实验性验证

如图3所示,在位于KAIST的室内水箱中使用可悬停的自主水下机器人获得了一个实验数据集。室内水箱长15m,宽10m,深1.6m。由于污渍和变色斑点导致的非结构化特征很少出现在地板表面,自主水下机器人被控制为遵循给定路径并保持距水面都有恒定的深度。

图3 实验系统及场地Fig.3 Experimental system and site

在实验装置中,没有能够提供地面真实轨迹数据的绝对定位系统。因此,采用全局束调整(GBA)技术绘制全局优化轨迹,作为参考数据。相对于GBA轨迹比较航位推算轨迹,不应用选择性图像配准的穷举基线视觉SLAM的结果以及通过具有选择性图像配准的视觉SLAM估计的轨迹。图4为航位推算(DR)和估计轨迹之间的定性比较。黑线表示GBA结果中的参考轨迹,洋红线是基于IMU和DVL测量的航位推算结果,蓝线表示在无选择性图像配准的情况下通过穷举视觉的基线轨迹,红线表示通过所提出的具有选择性图像配准的视觉SLAM估计得到的轨迹。如图4所示,无论是否采用选择性图像配准方法,视觉SLAM结果显示出比DR结果更精确的轨迹。此外,所提出的具有选择性图像配准的视觉SLAM具有与基线结果相当的精度。

图4 估计轨迹的比较Fig.4 Comparison of estimated trajectories

4 结论

本文针对水下结构物表面视觉特征分布不均匀的特点,提出了一种基于图像配准的微小型自主水下机器人视觉全局定位SLAM算法。所提出的选择性图像配准方法可以在特征提取和特征匹配之前评估每个图像的潜在效用和比较图像的成对有效性,这是一种计算代价高昂的过程。通过使用自主水下机器人平台获得的一系列实验数据,证明了所提出的视觉全局定位法SLAM的有效实用性。

猜你喜欢
关键帧姿态轨迹
攀爬的姿态
轨迹
轨迹
全新一代宋的新姿态
跑与走的姿态
轨迹
基于改进关键帧选择的RGB-D SLAM算法
进化的轨迹(一)——进化,无尽的适应
基于相关系数的道路监控视频关键帧提取算法
基于聚散熵及运动目标检测的监控视频关键帧提取