结合稀疏表示与图像压缩融合的目标检测

2016-03-28 03:41梅家诚叶汉民
红外技术 2016年3期
关键词:子块字典红外

梅家诚,王 瑞,叶汉民



结合稀疏表示与图像压缩融合的目标检测

梅家诚1,王 瑞2,叶汉民1

(1.桂林理工大学信息科学与工程学院,广西 桂林 541000;2.上海大学通信与信息工程学院,上海 200444)

针对单光谱图像用于目标检测时信息量不足的缺点,提出了一种可见光图像与红外图像基于压缩域融合检测的方法。该方法首先使用合适的模型构造目标原子,得到超完备字典,再对待测图像在字典上分解所得稀疏系数进行融合,最后通过稀疏度指标对融合系数进行判定,得到目标所在位置。实验结果表明,与单帧图像检测方法相比,该方法使得待检测图像信息更加丰富,提高目标的检测率。

稀疏表示;超完备字典;图像压缩融合;目标检测

0 引言

红外成像技术[1]具有不受电磁干扰、作用距离远等优良特性。物体任何时候都会产生红外辐射,因而其被广泛的用于目标探测领域。当前,单帧图像的检测算法可以分为:结合图像滤波[2]的检测算法和结合机器学习的检测算法。结合图像滤波的检测算法,首先通过合适的算法计算得到原始图像的背景分量,接着在原始图像中去除背景分量,得到原始图像中的目标分量和噪声分量,最后通过设置阈值滤除噪声分量,代表方法有Max-Median算法[3],Top-Hat算法[4]。结合机器学习的检测算法,是将模式分类的思想引入到目标检测中,首先构造对应的目标模型和背景模型并对其进行训练,接着依次提取图像子块,根据不同目标的特征设置阈值,判断该图像子块是否含有目标。其中,代表方法有主成成分分析算法[5](principal component analysis)。其中结合机器学习的检测算法能够有效地抓住图像的几何特征,且模型的选择更加灵活。

然而光照环境条件、目标位置传感器、目标固有的特点等因素都会对单帧检测结果造成影响,因而通过单一传感器所获得的红外图像信息不足以对目标进行更好的检测。图像融合充分利用了被融合图像中包含的互补信息,通过对来自不同传感器的图像进行融合处理后,获得的融合信息包含了任何单一传感器无法提供的信息。因而在目标检测中融合可见光图像和红外图像的信息,可以实现信息的有效互补。根据图像融合的层次不同,一般将图像融合[6]分为3个层次:像素级图像融合、特征级图像融合以及决策级图像融合。总体来看,像素级融合作为图像融合的基础,已成为国内外的主要研究对象。近年来压缩感知(compressed sensing, CS)理论的发展,为图像融合带来了新的处理方法,其中基于稀疏表示的图像融合方法得到了国内外众多学者的关注。其基本原理是将图像变换到稀疏域中,对稀疏域中系数采用某种融合规则进行融合,最后利用反变换重构融合图像。

引入图像融合理论解决单帧图像检测中信息量不足问题,提出了一种基于稀疏域图像融合目标检测的方法。与其他单帧图像检测算法相比,该方法融合多光谱图像的优点,丰富了待检测图像信息,利于进行更有效的检测。

1 基于稀疏表示的图像融合

结合稀疏表示的图像压缩融合检测是建立在信号稀疏系数融合的基础上的,其中关键的问题就是如何得到信号的稀疏系数。

1)稀疏表示

信号具有稀疏性[6],如何找到信号的稀疏域或变换域至关重要。通常自然信号不是稀疏的,但人们发现信号通过某些变换后,会变成稀疏信号。在对图像进行稀疏表示时,人们发现使用完备正交基通常会更有效。

一个维信号ÎR×1,在正交基={}=1下分解所得变换系数为:

f(1)

如图1所示,如果中只有(≪)个非零元素,则为信号的稀疏表示。

图1 信号稀疏表示的矩阵形式

之前信号稀疏表示方法多基于正交基变换[7],如信号的傅里叶变换、小波变换、Gabor变换等。随着压缩感知理论的发展,超完备字典下的稀疏表示成为研究的重点,人们常使用超完备字典替代正交基。目前常用的稀疏表示算法均为追踪算法,如BP[8]算法、MP[9]算法、和本文使用的OMP[10]算法等。

2)结合稀疏表示的融合

合理的融合规则[6]直接决定了图像融合的质量,超完备字典下,图像分解所得系数具有稀疏性,只有少数系数非零。因此取极大值法融合或加权平均值融合等基于系数处理的规则是适合本文的融合规则。如文献[11]定义图像块活跃度{A}1

A=ïççê1,=1,2,…,(2)

比较活跃度,应用选大规则,确定融合系数,表示为:

式中:、表示红外与可见光子块集合;表示子块个数。

2 超完备字典

对图像进行融合,首先要对图像进行稀疏表示,其中一个关键问题是如何设计有效的超完备字典。利用超完备字典表示图像[9]的基本思想最早是由Mallat提出的,他用过完备的Gabor字典对图像进行稀疏表示。此后,学者提出了多种超完备字典构造方法,大致可分为2种:第1类方法是通过将标准正交基通过一定规则组合起来,获得超完备字典,Gabor就是基于这一方法构造的。第2类方法是利用训练样本来构造超完备字典,其中又可分为2种构造方式:可以使用学习算法生成超完备字典,如Elad[12]利用K-SVD算法生成通用性的字典;也可以根据实际问题,直接用训练样本构造字典。

根据实际问题构造字典的检测方法[13-14],人们普遍使用二维高斯模型[15]来进行建模以构造超完备字典:

式中:max是目标的在中心点的灰度值;(0,0)是目标样本的中心点;(,)为水平、垂直分布参数,其决定了模型分布的特性。实验中假设字典矩阵大小为×,通过改变样本中心点、中心点灰度值、以及分布参数,可以得到不同位置,不同幅值,不同分布的目标样本。其中,为了得到超完备字典,(0,0)需从(1,1)遍历至(,)。分别将样本图像矩阵展开为2×1的一维列向量,将其排列重组成字典矩阵:

式中:为所生成的字典,共有列,每一列v都是一个目标特征样本。图2左图为字典中单个原子的三维视图,图2右图为字典中部分原子。

3 压缩域融合检测

一般红外与可见光图像均满足稀疏性条件,可进行稀疏变换,因此提出了一种基于稀疏域融合检测模型。图3为压缩域融合检测框架图。

图2 超完备字典示意图

图3 图像压缩检测模型

1)压缩域融合

假设YÎR×N表示输入待检测原始图像。文中使用了滑窗技术[11]:选择大小为×的滑窗,对原始图像矩阵进行有序遍历,将遍历的每一个图像子块展开为长度为2的一维向量,表示为{}=1,其中=(-+1)×(-+1)表示图像子块的个数。

当每个图像块列向量随机投影矩阵选定后,则对列向量进行随机投影:

_RP=x,=1,2,…,(6)

即:

_RP=(7)

满足以下约束条件:

_RP=DS(8)

随机投影所得线性方程有无穷多个解,但是只要是稀疏的,在D满足RIP约束时,由压缩感知理论可知式(8)可通过迭代追踪算法求解。

=argmin‖‖0, s.t.‖Ds‖22≤,=1,2,…,(9)

对图像进行融合需要选取合适的融合规则,在超完备字典下分解后,图像的稀疏系数较为稀疏,综合考虑每个图像块对融合图像的贡献度,确定融合影响系数

式中:、b分别表示待融合图像与图像块的平均梯度值;b分别表示待融合图像与图像块的平均灰度值。由此定义融合规则为:

2)稀疏度指标

图4 部分稀疏系数

分析稀疏系数S,若滑窗提取的图像块中存在目标,则其稀疏系数中只有少数数值较大,其余值均可以忽略;若不存在目标,则其稀疏系数的值比较平均且值较小。

图4(a)为存在目标图像块的稀疏系数,图4(b)为不存在目标图像块的稀疏系数。

可见,目标存在与否与其在字典上得到的稀疏表示系数是相关的。可以通过最大稀疏系数max()、稀疏度指标SI(sparse index,SI)来定量描述稀疏系数的差异。

式中:表示样本类别的个数;表示融合后的稀疏系数F的第列;()表示第列第个系数。显然,含有目标的图像子块的max()值比较大、且SI值接近于1,而不含目标的图像子块的max()值均比较小、且SI值接近于0。

3)阈值分割

根据公式(12)、(13)求得最大稀疏系数和稀疏度指标,进行阈值处理,重构后可得到目标位置:

max()≥1, SI()≥2(14)

可通过式(14)对稀疏系数进行二值化处理得到S¢,其中1、2为所设阈值,且1、2Î[0,1],具体取值可根据实际情况进行设置。

其中矩阵S¢满足如下关系:

X¢=DS¢(15)

4 实验分析

为了验证算法的有效性,实验中选择了两组数据集进行测试,数据集来自http://www.metapix.de/ indexp.htm,大小均为256×256,如图5所示。

文中所提到的待测目标指大于2×2的像素点的目标,在本实验中包括第1组数据集中的海船、船上的灯、人、天空中的发光物体;第2组数据集中的人以及天空中的发光物体。

实验最后将所提方法的检测结果与红外图像上基于Top-Hat、红外图像上基于稀疏域的检测算法、可见光图像上基于稀疏域的检测算法进行了比较。生成的字典的原子大小为16×16,字典大小为256×1024,随机投影迭代次数为5,稀疏系数以及图像的重构使用了Smallbox2.0,L1-magic两个工具箱,阈值1设置为0.6,2设置为0.4。

图5 原始数据集

Fig.5 Original data

分别对两组数据集进行测试,实验结果如图6和图7所示。

通过对比实验结果:Top-Hat算法检测在目标较小时背景干扰明显,而基于稀疏表示的检测算法在目标较小时仍有较好的检测效果;使用的融合检测算法对图像背景有很好的抑制;在红外图像检测与融合图像检测中人、船等发热目标均明亮可辨;由于红外光图像与可见光图像有强烈的对比性和互补性,融合后检测所得的目标比红外检测所得图像更为清晰,可见其所得结果优于红外图像检测所得结果。其中图6(d),图7(d)为压缩域融合后检测所得实验结果。

为了对本文方法进行客观评价,对检测结果进行定量的比较。选择常用的峰值信噪比(peak signal-to-noise ratio,PSNR),检测率和虚检率这几个量化指标对3种检测进行客观的比较与分析。其中PSNR定义如下:

图7 第2组图像测试结果

实验中IN×w为待测试图片,OUT×w为检测处理后的图像。信噪比数值越高,则表示噪音越小,图像效果越好。

通过对比表1所列参数可以看出算法在红外图像检测与融合检测中所得检测图像质量更高,优于传统的top-hat算法。融合检测与红外检测客观评价指标接近;但融合检测部分结果略优于红外图像检测,达到了实验的期望,可见光图像对红外图像进行了有效的信息补充。

表1客观评价指标

Table 1 Values of evaluation indexes

对比实验所得数据集、客观评价指标:使用压缩域下图像融合检测算法在检测所得图像中目标的细节、质量,以及检测率方面均有不错的提升。

5 结论

运用图像融合思想解决单光谱图像检测时图片信息不够全面的问题,以求融合多种光谱优点,得到更好的检测结果。提出了压缩域融合检测方法,并在红外光图像与可见光图像融合的基础上验证了算法的有效性。实验结果表明:本文基于二维高斯模型构造超完备字典的检测算法在红外光与融合检测中均有不错的表现;压缩域融合检测方法在处理检测问题时具有略优于红外单光谱图像的检测质量。由于本文采用的OMP算法求解稀疏表示系数,实际过程中运算速度较慢,以后将考虑使用更快的迭代算法求解稀疏表示系数。

[1] Yi C, Nasser M Nasrabadi, Trac D Tran. Sparse representation for target detection in hyperspectral imagery[J]., 2011, 5(3): 629-640.

[2] 候洁, 辛云宏. 基于高通滤波和图像增强的红外小目标检测方法[J]. 红外技术, 2013, 35(5): 279-284.

HOU jie, XIN xun-hong. A method for infrared small target detection with high-pass filter and image enhancement technology[J]., 2013, 35(5): 279-284.

[3] Li J, Shen Z, Lan T. Detection of spot target in infrared clutter with morphological filter[J]., 1996(1): 168-172.

[4] Cao Y, Liu R, Yang J. Small target detection using two dimensional least mean square (TDLMS) filter based on neighborhood analysis[J]., 2008, 29(2): 188-200.

[5] Liu Z, Chen C, Shen X, et al. Detection of small objects in image data based on the nonlinear principal component analysis neural network[J]., 2005, 44(9): 093604-1-9.

[6] Wang R, Du L. Infrared and visible image fusion based on random projection and sparse representation[J]., 2014,35(5): 1640-1652.

[7] 尹宏鹏, 刘兆栋, 柴毅, 等. 压缩感知综述[J]. 控制与决策, 2013, 28(10):1441-1443.

Yin hong-peng, Liu zhao-dong, Chai yi, et al. Summary of compressive sensing[J]., 2013, 28(10): 1441-1443.

[8] Yin W, Morgan S, Yang J, et al. Practical compressive sensing with Toeplitz and circulant matrices[C]//, 2010, 7744: 77440K.

[9] Mallat S G, Zhang Z. Matching pursuits with time-frequency dictionaries[J]., 1993, 14(12): 3397-3415.

[10] Tropp J A, Gilbert A C. Signal recovery from random measurements via orthogonal matching pursuit[J]., 2007, 53(12): 4655-4666.

[11] Yang B, Li S. Multifocus image fusion and restoration with sparse representation[J]., 2010, 59(4): 884-892.

[12] Aharon M, Elad M, Bruckstein A. The K-SVD: An algorithm for designing overcomplete dictionaries for sparse representation[J]., 2006, 54(11): 4311-4322.

[13] Li H, Wei Y T, Li L Q, et al. Infrared moving target detection and tracking based on tensor locality preserving projection[J]., 2010, 53(2): 77-83.

[14] Porat B, Friedlander B. A frequency domain algorithm to multiframe detection and estimation of dim targets[J]., 1990, 12(4): 398-401.

[15] Zhao Jiajia, Tang Zhengyuan, Yang Jie, et al. Infrared small target detection using sparse representation[J]., 2011, 22(6): 897-904.

[16] Donoho D L, Tsaig Y, Drori I, et al. Sparse solution of underdetermined systems of linear equations by stagewise orthogonal matching pursuit[J]., 2012, 58(2): 1094-1121.

Compressive Fusion and Target Detection Based on Sparse Representation

MEI Jiacheng1,WANG Rui2,YE Hanmin1

(1.,,541000,;2.,,200444,)

A target detection approach is developed using compressive fused image for target detection. Firstly, an over-complete dictionary is constructed with atoms which are produced by two-dimensional Gaussian model. Secondly, we encode the sensor data on the constructed over-complete dictionary and combine the coefficients with the fusion impact factor. Targets can be determined by the sparse index of the fused coefficients. Experiment results show that the proposed approach has a higher recognition rate on account of the information enhanced.

sparse representation,over-complete dictionary,image compressive fusion,target detection

TP391

A

1001-8891(2016)03-0218-07

2015-07-24;

2015-09-28

梅家诚(1990-),男,江苏东台人,硕士研究生,主要研究方向为图像处理、检测与跟踪。

王瑞(1982-),博士,副教授,主要研究方向为多媒体信号处理,稀疏表示。E-mail:rwang@shu.edu.cn。

国家自然科学基金青年项目(61301027)。

猜你喜欢
子块字典红外
基于八叉树的地震数据分布式存储与计算
网红外卖
闪亮的中国红外『芯』
基于特征值算法的图像Copy-Move篡改的被动取证方案
基于两层分块GMM-PRS 的流程工业过程运行状态评价
字典的由来
8路红外遥控电路
TS系列红外传感器在嵌入式控制系统中的应用
基于波浪式矩阵置换的稀疏度均衡分块压缩感知算法
大头熊的字典