基于最小二乘RBF的含噪声散乱数据逼近

2021-04-09 05:46夏磊李水艳
计算技术与自动化 2021年1期

夏磊 李水艳

摘 要:径向基函数能够有效的对散乱数据进行差值和逼近,因此在信号和图形处理等领域应用广泛,例如信号重构。针对从含有噪音的散乱数据中逼近原始数据,提出了一种基于最小二乘的变分模型,该模型由包含L2范数的拟合项和光滑项构成,光滑项通过三角网格上的拉普拉斯平滑方法来实现对函数梯度的约束,并应用最小二乘法求解该模型。最后通过数值实验对噪音数据进行逼近和误差分析来验证此方法的有效性。

关键词:散乱数据;逼近;径向基函数;最小二乘

中图分类号:TN911.7      文献标识码:A

Approximation of Noisy Scattered Data Based on Least Square RBF

XIA Lei,LI Shui-yan

(College of science, Hohai University, Nanjing ,Jiangsu 211100,China)

Abstract:

Radial Basis Function (RBF) is widely used in signal and graph processing because it can effectively perform difference and approximation to scattered data, such as signal reconstruction. Aiming at approximating the original data from scattered data with noise, a variational model based on radial basis function is proposed. The model is composed of fitting terms and smooth terms containingL2-norm, and the least square method is applied to solve the model. Finally, numerical experiments are carried out to approximate the noise data and the error between the approximate data and the original data is given to verify the effectiveness of this method.

Key words:scattered data;approximation; RBF; least square

研究如何從观测得到的含有噪音的散乱数据逼近原始信号是信号处理的重要任务之一。信号逼近技术已广泛应用于地形建模、曲面重建和偏微分方程数值求解、机器学习、人脸识别和计算机仿真等领域[1-3]。由于采样、传输、存储或软件处理等原因,通常观测得到的数据含有高斯、泊松、各种未知类型的噪音,如何从这些带有噪音的数据中逼近原始信号是一个应用广泛,且具有挑战的问题[4-6]。

在过去的几十年里 ,径向基函数已经非常成功地用于从分散的数据重建函数[7-9],这一成功主要基于以下事实:

(1)径向基函数可用于任何空间维度。

(2)它们适用于任意分散的数据,没有任何规律性。

(3)它们允许任意平滑的内插,内插具有简单的结构。

但是当散乱数据含有噪音时,噪音对重建函数f有全局的影响。

径向基函数空间易于计算和存储,并且几乎可以逼近任何连续的函数.给定一个函数φ,对x∈Rs,所有形如φ‖x-c‖2及其线性组合张成的函数空间,称为由函数φ导出的径向基函数空间.径向基函数是由一元函数经过有限次平移、伸缩的线性组合而张成的,具有计算格式简单、计算工作量小巧等优点。

基于最小二乘的正则化方法在变分模型中得到广泛使用,Evgeniou[10]等人使用了正则化的方法用于惩罚最小二乘拟合,Von Golitschek和Schumaker[11]也用同样的方法来平滑样条函数。最小二乘拟合方法对于降低噪音上有良好的效果,正则化方法在信号逼近、曲面重建等领域发挥了重要的作用。

文中主要研究如何从含有噪音的散乱点中重建原始信号,并且分析实验结果。主要思想是在径向基函数空间∑Ni=1ciφ‖x-xi‖2上求解逼近原始函数f。为此,提出基于RBF的最小二乘优化模型,该模型的正则项是函数梯度的L2范数,通过网格上的拉普拉斯平滑方法来实现对函数梯度的约束。

1 理论基础

1.1 径向基函数逼近

径向基函数有着极其强烈的应用背景,径向基函数插值有很好的逼近效果,当径向基函数是正定时,它的线性组合凡乎可以逼近所有的连续函数。径向基函数的表示和计算方法都非常地简单(根据己知的一元函数表示),可以减少到达最优值所需计算函数值的次数,加快寻找全局最优点的速度。

3 数值实验

分别应用函数:

f1x,y=xe(-x2-y2)

f2(x,y)=sin 32πxcos 2πy

f3(x,y)=peaks(x,y)

进行三组仿真实验,以验证模型2及其对应算法的有效性。

第一组实验,设f*1(x,y)为未知连续信号,在Ω=(-2,2)2上随机选取200个含噪音散乱点{xif(xi)}200i=1,得到散乱点的值fi=f*i+0.01ηi,其中ηi服从标准正态分布N(0,1),选用的径向基函数为Multi-quadrich函数。第二组设f*2(x,y)为未知连续信号,在Ω=(0,1)2上随机选取200个含噪音散乱点{xi,f(xi)}200i=1。第三组实验设f*3(x,y)为未知连续信号,在Ω=(-1,1)2上随机选取50个含噪音散乱点{xi,f(xi)}50i=1。

实验基本步骤为:①随机获取原始曲面的散乱数据点;②对原始曲面上的散乱数据点添加高斯噪声;③通过本文模型和算法确定径向基函数的系数,然后反求逼近后的函数并画出网格曲面.最后,计算出所有等间距网格点上的原函数值与逼近后的函数值之间的均方差,计算结果如表1所示。

图2-图5为实验结果数据,通过图3与图5对比可知:本文模型在去噪的同时能够有效的逼近散乱点的原始曲面;图4为应用传统RBF方法[18]对含噪音数据逼近的结果,传统RBF方法详见文献18中的模型11,通过图4与图5对比可知:对于含噪的音散乱点,与传统的径向基函数逼近方法相比该模型有更好的去噪和逼近能力,得到的曲面光顺性也较好。

表1中的均方差1为利用传统RBF逼近方法确定的所有等间距网格点的原函数值与逼近后的函数值的均方差;均方差2为利用模型确定的所有等间距网格点的原函数值与逼近后的函数值的均方差;由表1可知:本文提出的模型方法相比于传统的径向基函数逼近方法有着更好逼近能力。

4 结 论

讨论了当散乱点含有未知噪音时,用L2范数拟合的模型与算法。借助径向基函数插值和正则化的方法,用最小二乘法求解该模型。最后通过三组实验对比及误差分析来验证该模型的有效性。

在下一步的工作中,如何进一步提高逼近效果和算法效率;如何使模型具备对不连续函数的良好逼近能力,如果考虑将在模型中加入

L1范數约束,实验效果是否会更好,这些问题有待进一步研究。

参考文献

[1] 兰凤崇,陈吉清,林建国.散乱点曲面拟合及在车身曲面中的应用[J].机械工程学报,2005, 41(11):213-216.

[2] GAO W, SUN X, WU Z, et al. Multivariate Monte Carlo approximation based on scattered data[J]. SIAM Journal on Scientific Computing, 2020, 42(4): A2262-A2280.

[3] 任同群,赵悦含,龚春忠,等.自由曲面测量的三维散乱点云无约束配准[J].光学精密工程,2013,21(5):1234-1243.

[4] 杨建斌,陶薪竹. 基于小波框架方法的信号重构[J]. 高校应用数学学报,2019,34(3):364-372.

[5] YANG J,STAHL D,SHEN Z. An analysis of wavelet frame based scattered data reconstruction[J]. Applied and Computational Harmonic Analysis,2017,42(3):480-507.

[6] 冯建周,孔令富.基于网格的散乱点曲面重构技术[J].计算机工程,2009,35(18):19-21.

[7] 李乐庆,康宝生.基于RBF的散乱点曲面重构[J].西北大学学报(自然科学版),2011,41(2):221-225.

[8] 魏义坤,杨威,刘静.关于径向基函数插值方法及其应用[J].沈阳大学学报,2008,21(1):7-9.

[9] 吴宗敏.径向基函数、散乱数据拟合与无网格偏微分方程数值解[J].工程数学学报,2002,19(2):1-12.

[10]EVGENIOU T, PONTIL M, POGGIO T. Regularization networks and support vector machines[J]. Advances in Computational Mathematics, 2000, 13(1): 1.

[11]VON GOLITSCHEK M, SCHUMAKER L. Penalized least squares fitting[J]. Serdica Mathematical Journal, 2002, 28(4): 329-348.

[12]吴宗敏.函数的径向基表示[J].数学进展,1998,27(3):202-208.

[13]XU Q, LIU Z. Scattered data interpolation and approximation with truncated exponential radial basis function[J]. Mathematics, 2019, 7(11): 1101-1101.

[14]FENG R, SONG L. Rational quasi-interpolation approximation of scattered data in R 3[J]. Numerical Mathematics-Theory  Methods  and Applications, 2018, 11(1): 169-186.

[15]韩旭里,庄陈坚,刘新儒.基于径向基函数与B样条的散乱数据拟合方法[J].计算技术与自动化,2007,26(1):63-65,69.

[16]龙辉平,习胜丰,侯新华.实验数据的最小二乘拟合算法与分析[J].计算技术与自动化,2008,27(3):20-23.

[17]王洪申,张家振,张小鹏.三角网格模型骨架提取算法[J].计算技术与自动化,2020,39(2):145-149.

[18]MAJDISOVA Z, SKALA V. Radial basis function approximations: comparison and applications[J]. Applied Mathematical Modelling, 2017, 51: 728-743.