基于PCA的盲信号预处理方法研究

2013-04-29 13:41赵忠华杨晓梅
无线互联科技 2013年9期
关键词:预处理

赵忠华 杨晓梅

摘 要:盲信号分离技术是信号处理领域发展相对较晚的一种理论,目前已迅速成为该领域内重要的组成部分。本文首先对盲信号的基本研究方法和分离问题的数学模型作了介绍,详细介绍了盲信号分离技术中的预处理方法PCA,并指出其主要特点和性能。

关键词:盲信号;预处理;PCA

1 引言

近年来,盲信号分离(BSS)成为一个全新的信息處理领域,它综合了信号估计、最优化、概率论、信息论以及随机信号等理论。随着技术的发展,盲信号分离方法在通信、图像处理、语音识别、生物医学、地震监测、水声信号处理等众多领域具有重要的理论价值和应用前景。盲信号分离技术是指在源信号和传输通道的参数未知的情况下,仅根据源信号的统计特性,由观测信号恢复出源信号的过程[1]。

1.1 盲信号分离技术的数学模型

盲信号分离技术的基本数学模型如图1所示[2]。由于盲信号的传输通道参数未知,通过对传输通道模型的假设,可分为瞬时线性混合模型、非线性混合模型和卷积混合模型等。

其中为,假设s1(t),s2(t),...,sN(t)为N个未知的源信号,经过传输(混合)后,接收到的M个观测信号为x1(t),x2(t),...,xM (t)。y1(t),y2(t),...,yN(t)为分离后的输出信号。因此盲信号分离可以用下面的混合方程描述[2]:

式中,S(t)=[s1(t),…,sN(t)]T,称为源信号向量;X(t)=[x1(t),…,xM(t)]T,称为观测数据向量,而M×N维的矩阵A称为混合矩阵,其元素表示信号的混合情况(即传输通道参数)。

盲信号分离问题的提法是:在混合矩阵A和源信号向量S(t)未知的情况下,只根据观测数据向量X(t)确定分离矩阵W,使得变换后的输出为:

则Y(t)就是源信号向量S(t)的估计。

而盲信号分离技术就是寻找分离矩阵W,使输出信号Y(t)尽可能的逼近真实源信号S(t)[2]。

以上混合方程基于无噪声的理论模型,若考虑混合中的噪声,混合方程改写为[3]:

这也属于线性混合模型,只要在盲信号分离过程中满足对源信号的假设,就可以实现 的估计,然后再进行降噪处理,从而实现对源信号的估计。

1.2 实现盲信号分离的假设前提[2]

由于源信号S(t)和分离矩阵W均是未知的,因此作为W结构信息缺失的一种补偿,必须要对源信号和分离矩阵W做出某些附加假设,一般假设如下[4]:

假设1:分离矩阵W为可逆或满秩矩阵(n≤m);

假设2:源信号各分量si(t)为零均值的平稳随机过程

假设3:源信号各分量si(t)相互统计独立,且其中最多只能有一个分量服从高斯分布;

假设4:si(t)的方差均为1。

2 盲信号的预处理

由于分离矩阵W未知,实际接收到的数据十分复杂,特别是源信号分量比较多的情况下,若si(t)的均值不为零、方差不为1,在进行信号分离时计算量会非常大,因此可通过白化方法使其均值为零、方差为1。这个过程称为盲信号的预处理。一般情况下,如果将预处理后的信号用ICA(独立分量分析)算法进行分离,能够的到更快的收敛速度和更好的稳定性[5]。盲信号的预处理一般包括两个部分:信号的中心化和白化。

2.1 信号中心化

令 ,其中 为向量X(t)的均值向量,这样 ,这个过程就是信号的中心化。进行盲信号的分离之后还可以将均值向量加回到估计信号向量中。根据概率统计的理论, 可以由X(t)的样本估计得到。

2.2 信号的白化

对向量X(t)进行线性变换,得到一个具有单位方差的新向量Z(t),则 ,且使得Z(t)中的各分量zi(t)互不相关,且有 。这个过程就称为白化。因此将信号白化就是要找到线性变换矩阵P。

3 基于PCA的盲信号预处理方法

PCA(Principal Component Analysis,主分量分析)是统计数据分析、数据压缩、特征提取等领域所使用的经典方法之一。其主要目的是通过降维的方法分离出信号中的主分量(即能量最大的成分)[6]。

3.1 PCA原理

PCA算法从数学角度看就是最小均方误差下的最优正交变换,对消除信号间的突出信号有很好的效果。而主分量的方向就是信号矢量具有最大方差的方向,因此可以用主分量来代表信号矢量。以一个二维数据表为例,若信号样本分布如图2(a)所示。

设其样本重心为e,显然a1方向信号离散度最大,即此方向上信号变化最大,因此其携带的信息量最大。则称a1为第一主分量。如将坐标原点平移到e点,并旋转得到一个新坐标系a1ea2。很明显在新坐标系下进行信号的分析及计算要更加的简便。因此从本质上说主分量分析就是分析该线性空间的秩和基,下面用最小二乘法来进行分析。

3.2 PCA的计算方法

设观测数据向量X(t)中每个变量有K个样本,由此得到一个N×K的数据表,对其进行中心化,设去均值后的观测向量为X,下面求线性变换矩阵P,此过程就是对坐标系进行旋转。

设各分量的线性组合为:

下面先求第一主分量Z1,有 ,其中 为第一主分量对应于X各分量的权重。为保证在旋转坐标系时,空间尺度不发生改变,则要求满足||P1||=1。即寻找向量P1使其满足以下条件:

其中CX为X的N×N维协方差矩阵,则满足式(5)的P1的取值应该是协方差矩阵CX的单位特征向量 的线性组合,并设其特征向量的排列顺序能使其对应的特征根 满足 ,那么由式(5)和式(6)组成的最优化问题的解为 。则第一主分量 [7]。

以此为依据,令第m个主分量 ,则Zm的方差取到最大值的条件是Zm与已找到的所有的主分量不相关,即: ,且考虑有 ,则

在求出第一主分量的前提下,可以求出第二主分量的权重 。以此类推可以得到观测数据各个分量的线性组合,达到旋转坐标的目的,即对观测数据进行了白化处理。

4 结束语

盲信号分离技术对信号处理技术的发展起了关键的作用,还有许多技术和算法有待解决。而PCA算法是盲信号分离技术中广泛使用的一种算法。文章通过对盲信号处理过程的分析,介绍了基于PCA的盲信号预处理方法,其目的是降低数据的维数,从而减少后期的盲信号处理中的运算量。

[参考文献]

[1]高鹰,谢胜利.基于非线性PCA准则的两个盲信号分离算法[J].《计算机工程与应用》,2005(22):24~26.

[2]焦芳芳,封志宏,杨桂芹.盲信号分离及盲信号抽取研究[J].《无线电工程》,2011,41(9):11~14.

[3]胡婧,张更新,熊纲要.盲信号分离技术综述[J].《数字通信世界》2010(4):64~68.

[4]张贤达,保铮.通信信号处理[M].北京:国防工业出版社,2000:367~383.

[5]边肇棋,张学工,等.模式识别(第三版)[M].北京:清华大学出版社,2010: 161~181.

[6]杨幵睿,孟凡荣,梁志贞,等.一种自适应权值的算法[J].《计算机工程与应用》,2012,48(3):189~191.

[7]胡广书.数字信号处理——理论、算法与实现(第三版)[M].北京:清华大学出版社,2012:325~327.

猜你喜欢
预处理
基于预处理MUSIC算法的分布式阵列DOA估计
浅谈PLC在预处理生产线自动化改造中的应用
络合萃取法预处理H酸废水
PMU数据预处理及压缩算法
基于自适应预处理的改进CPF-GMRES算法
以转炉为预处理炉冶炼不锈钢的特点