基于PCA的盲信号预处理方法研究

2013-04-29 13:41赵忠华杨晓梅

无线互联科技 2013年9期

赵忠华　杨晓梅

摘要：盲信号分离技术是信号处理领域发展相对较晚的一种理论，目前已迅速成为该领域内重要的组成部分。本文首先对盲信号的基本研究方法和分离问题的数学模型作了介绍，详细介绍了盲信号分离技术中的预处理方法PCA，并指出其主要特点和性能。

关键词：盲信号；预处理；PCA

1 引言

近年来，盲信号分离（BSS）成为一个全新的信息處理领域，它综合了信号估计、最优化、概率论、信息论以及随机信号等理论。随着技术的发展，盲信号分离方法在通信、图像处理、语音识别、生物医学、地震监测、水声信号处理等众多领域具有重要的理论价值和应用前景。盲信号分离技术是指在源信号和传输通道的参数未知的情况下，仅根据源信号的统计特性，由观测信号恢复出源信号的过程[1]。

1.1 盲信号分离技术的数学模型

盲信号分离技术的基本数学模型如图1所示[2]。由于盲信号的传输通道参数未知，通过对传输通道模型的假设，可分为瞬时线性混合模型、非线性混合模型和卷积混合模型等。

其中为，假设s1（t），s2（t），...，sN（t）为N个未知的源信号，经过传输（混合）后，接收到的M个观测信号为x1（t），x2（t），...，xM （t）。y1（t），y2（t），...，yN（t）为分离后的输出信号。因此盲信号分离可以用下面的混合方程描述[2]：

式中，S（t）=[s1（t），…，sN（t）]T，称为源信号向量；X（t）=[x1（t），…，xM（t）]T，称为观测数据向量，而M×N维的矩阵A称为混合矩阵，其元素表示信号的混合情况（即传输通道参数）。

盲信号分离问题的提法是：在混合矩阵A和源信号向量S（t）未知的情况下，只根据观测数据向量X（t）确定分离矩阵W，使得变换后的输出为：

则Y（t）就是源信号向量S（t）的估计。

而盲信号分离技术就是寻找分离矩阵W，使输出信号Y（t）尽可能的逼近真实源信号S（t）[2]。

以上混合方程基于无噪声的理论模型，若考虑混合中的噪声，混合方程改写为[3]：

这也属于线性混合模型，只要在盲信号分离过程中满足对源信号的假设，就可以实现的估计，然后再进行降噪处理，从而实现对源信号的估计。

1.2 实现盲信号分离的假设前提[2]

由于源信号S（t）和分离矩阵W均是未知的，因此作为W结构信息缺失的一种补偿，必须要对源信号和分离矩阵W做出某些附加假设，一般假设如下[4]：

假设1：分离矩阵W为可逆或满秩矩阵（n≤m）；

假设2：源信号各分量si（t）为零均值的平稳随机过程

假设3：源信号各分量si（t）相互统计独立，且其中最多只能有一个分量服从高斯分布；

假设4：si（t）的方差均为1。

2 盲信号的预处理

由于分离矩阵W未知，实际接收到的数据十分复杂，特别是源信号分量比较多的情况下，若si（t）的均值不为零、方差不为1，在进行信号分离时计算量会非常大，因此可通过白化方法使其均值为零、方差为1。这个过程称为盲信号的预处理。一般情况下，如果将预处理后的信号用ICA（独立分量分析）算法进行分离，能够的到更快的收敛速度和更好的稳定性[5]。盲信号的预处理一般包括两个部分：信号的中心化和白化。

2.1 信号中心化

令，其中为向量X（t）的均值向量，这样，这个过程就是信号的中心化。进行盲信号的分离之后还可以将均值向量加回到估计信号向量中。根据概率统计的理论，可以由X（t）的样本估计得到。

2.2 信号的白化

对向量X（t）进行线性变换，得到一个具有单位方差的新向量Z（t），则，且使得Z（t）中的各分量zi（t）互不相关，且有。这个过程就称为白化。因此将信号白化就是要找到线性变换矩阵P。

3 基于PCA的盲信号预处理方法

PCA（Principal Component Analysis，主分量分析）是统计数据分析、数据压缩、特征提取等领域所使用的经典方法之一。其主要目的是通过降维的方法分离出信号中的主分量（即能量最大的成分）[6]。

3.1 PCA原理

PCA算法从数学角度看就是最小均方误差下的最优正交变换，对消除信号间的突出信号有很好的效果。而主分量的方向就是信号矢量具有最大方差的方向，因此可以用主分量来代表信号矢量。以一个二维数据表为例，若信号样本分布如图2（a）所示。

设其样本重心为e，显然a1方向信号离散度最大，即此方向上信号变化最大，因此其携带的信息量最大。则称a1为第一主分量。如将坐标原点平移到e点，并旋转得到一个新坐标系a1ea2。很明显在新坐标系下进行信号的分析及计算要更加的简便。因此从本质上说主分量分析就是分析该线性空间的秩和基，下面用最小二乘法来进行分析。

3.2 PCA的计算方法

设观测数据向量X（t）中每个变量有K个样本，由此得到一个N×K的数据表，对其进行中心化，设去均值后的观测向量为X，下面求线性变换矩阵P，此过程就是对坐标系进行旋转。

设各分量的线性组合为：

下面先求第一主分量Z1，有，其中为第一主分量对应于X各分量的权重。为保证在旋转坐标系时，空间尺度不发生改变，则要求满足||P1||=1。即寻找向量P1使其满足以下条件：

其中CX为X的N×N维协方差矩阵，则满足式（5）的P1的取值应该是协方差矩阵CX的单位特征向量的线性组合，并设其特征向量的排列顺序能使其对应的特征根满足，那么由式（5）和式（6）组成的最优化问题的解为。则第一主分量 [7]。

以此为依据，令第m个主分量，则Zm的方差取到最大值的条件是Zm与已找到的所有的主分量不相关，即：，且考虑有，则

在求出第一主分量的前提下，可以求出第二主分量的权重。以此类推可以得到观测数据各个分量的线性组合，达到旋转坐标的目的，即对观测数据进行了白化处理。

4 结束语

盲信号分离技术对信号处理技术的发展起了关键的作用，还有许多技术和算法有待解决。而PCA算法是盲信号分离技术中广泛使用的一种算法。文章通过对盲信号处理过程的分析，介绍了基于PCA的盲信号预处理方法，其目的是降低数据的维数，从而减少后期的盲信号处理中的运算量。

[参考文献]

[1]高鹰，谢胜利.基于非线性PCA准则的两个盲信号分离算法[J].《计算机工程与应用》，2005（22）：24～26.

[2]焦芳芳，封志宏，杨桂芹.盲信号分离及盲信号抽取研究[J].《无线电工程》，2011，41（9）：11～14.

[3]胡婧，张更新，熊纲要.盲信号分离技术综述[J].《数字通信世界》2010（4）：64～68.

[4]张贤达，保铮.通信信号处理[M].北京：国防工业出版社，2000：367～383.

[5]边肇棋，张学工，等.模式识别（第三版）[M].北京：清华大学出版社，2010： 161～181.

[6]杨幵睿，孟凡荣，梁志贞，等.一种自适应权值的算法[J].《计算机工程与应用》，2012，48（3）：189～191.

[7]胡广书.数字信号处理——理论、算法与实现（第三版）[M].北京：清华大学出版社，2012：325～327.