机器学习辅助太赫兹涡旋波超表面快速设计方法

2024-02-21 11:14司黎明邓嘉轩
无线电通信技术 2024年1期
关键词:涡旋模数波束

司黎明,邓嘉轩,吕 昕

(北京理工大学 集成电路与电子学院/毫米波与太赫兹技术北京市重点实验室,北京100081)

0 引言

太赫兹波是指频率在0.1~ 10 THz的电磁波,由于其广阔的频谱带宽有望运用到6G通信技术,来解决当前通信频带频谱资源匮乏的困境,而备受科学家的青睐[1-2]。涡旋电磁波是指携带有轨道角动量(Orbital Angular Momentum,OAM)的电磁波,可以理解为在平面波的基础上增加了相位因子eilφ[3]。有别于传统电磁波的幅度、频率、相位、极化方式等参数,在当今频谱资源匮乏的时代,涡旋电磁波给出了新的自由度,为提高未来6G通信系统容量以及通信安全提供了可能[4-7]。现阶段产生涡旋电磁波的方式主要有天线阵列、涡旋相位板以及超表面等[8-10]。其中,超表面是由亚波长人工电磁结构 二维周期排布形成的材料,相较于前两个器件具有设计简单、剖面低、成本低的优势,因而成为当前产生涡旋波的主流选择[11-13]。

传统的超表面设计方法主要是依靠设计人员通过仿真软件进行参数扫描来获得符合预期的超单元。然而,涡旋波超表面由于相位因子的加入,阵面上每个单元的相位需求都不尽相同,导致超表面结构复杂,需要耗费大量的时间对每个点位的超表面单元进行扫参。如何快速准确地得到满足相位和幅度条件的单元是构筑涡旋波超表面的研究热点。近年来,以机器学习为代表的人工智能技术异军突起,给学术界、工业界乃至人们日常生活都提供了极大的便利,为解决学术以及生产生活中的实际问题提供了新的方向[14-16],目前已有学者将机器学习运用到辅助超表面设计中。利用机器学习辅助超表面设计只需大量可靠的数据集并构建合理的神经网络,即可得到符合预期的超单元结构参数,大大缩减了时间和精力的损耗,也降低了超表面的设计难度[17-19]。

本文提出了一种利用机器学习辅助快速设计太赫兹涡旋波超表面的方法,其特点在于同时运用神经网络和优化算法,快速精准地得到满足预期的超单元。利用得到的超单元组成的超表面能够在 220 GHz产生多模数的涡旋波。220 GHz是大气传输窗口,在该频段下太赫兹波传输损耗小,常常用于点对点通信,因而具有极高的研究意义。基于提出的超单元,设计了基于长短期记忆(Long Short-Term Memory,LSTM)神经网络和遗传算法的逆向单元设计模型,并由此得到工作频率在220 GHz,模数分别为1、2、3的涡旋波超表面。

1 机器学习辅助超表面快速设计方法

1.1 超表面结构

本文设计的属于反射型超表面,超单元结构及参数如图1所示。该单元由三层结构组成,单元长度a=500 μm,中间的介质基板的材质为TOPAS(环烯烃共聚物,相对介电常数为2.34,损耗角正切为 0.000 07),厚度为h=70 μm。该材料在太赫兹频段具有较高的稳定性,且吸收损耗较小,常常被用作加工设计太赫兹材料[20]。基板底部为金(电导率为 4.561×107S/m),金的稳定性和电导率保证超表面在高频段能够保持良好的反射性能。基板上方为开口环形状的谐振腔结构,其材料为金。主要结构参数包括:a为超单元晶格长度,b为开口环形谐振腔宽度,g为开口环形谐振腔末端间距,d为开口环形谐振腔长度,w为开口环形谐振腔金属条宽度,h为介质基板厚度。通过调节尺寸参数b、g、d、w可以改变单元的谐振频率,从而改变反射波束的相位。

图1 超表面及其单元结构示意Fig.1 Schematic diagram of metasurface and meta-atom structure

为了得到大量可靠的数据集,需要对输入的尺寸参数在合理的范围内进行采样,从而得到大量的样本。利用Python-CST联合仿真在合理范围内改变b、g、d、w四个参数,得到3 200组尺寸参数对应的单元样本。将这些结构参数代入电磁仿真软件CST中进行全波仿真,导出对应单元的S11参数。由于单元背面为金层,反射幅度变化小,可以忽略不计,只需考虑相位部分。将S11参数进行如下的数学变换,得到对应的反射相位:

(1)

式中:Phase为单元反射相位,Re(S11)为S11的实部,Im(S11)为S11的虚部。由式(1)得到的相位在 -180°~180°,得到的反射相位还需要进行归一化数学处理,使其处于-1~1,以避免神经网络在计算中产生的数值问题,便于网络的收敛以及后续的预测。

1.2 LSTM神经网络辅助快速设计超表面模型

机器学习辅助超表面快速设计需要精确地预测单元相位。只有当单元频谱的预测精度足够高时,设计的单元才能较好地满足目标相位需求。基于神经网络的频谱预测模型是指将训练集中的单元结构参数与对应的反射相位作为训练数据,对神经网络进行训练。训练完毕后,输入合理的单元尺寸参数能够输出对应的反射相位,其模型示意如图2所示。

本文选取的神经网络为LSTM。LSTM属于循环神经网络(Rerrent Neural Network,RNN)的一个分支,拥有三种重要的门[21],即输入门(Input Gate)、遗忘门(Forget Gate)和输出门(Output Gate)。其中,遗忘门是最重要的门,它是用来对输入数据进行选择性“遗忘”,在存储重要有用信息的同时删除无用的信息,从而达到高效记忆的目的。LSTM由于高效的记忆能力,常常被用在时间序列预测、股票预测、自然语言处理等方面,与正向频谱预测有着极大的相关性,这也是选取该网络的灵感及由来。

LSTM是重复的模块(Block)的链式结构,也称为LSTM的神经元(Cell)。图3展示了LSTM神经网络的典型单元结构。绿色的Xt代表输入信息,蓝色的ht代表LSTM层的输出信息,t表示时序。黄色方框代表神经网络层,粉色圆圈代表逐点运算, LSTM可以通过控制各种门的状态来实现对神经元增添信息。

图3 LSTM神经网络典型单元结构Fig.3 Typical unit structure of LSTM neural network

本文选取的神经网络由输入层、四个LSTM层、一个全连接层和输出层构成,具体神经网络结构如图4所示。由于LSTM神经网络的结构中有时间序列的加入,故输入输出的维度需要增加序列长度。图4中输入输出维度的顺序为batch大小、序列长度、特征参数个数。在设置网络参数时,将初始学习率设为0.001,训练轮次epoch设为200,即训练的迭代次数为200。每训练完一次epoch,学习率减少0.000 000 45,即最后一次训练时学习率为 0.000 1。这样设置的目的是为了让网络训练趋于稳定时,防止过大的学习率破坏网络的稳定性。优化器选择自适应优化器(Adam),将数据集中的3 200份数据按照8∶2随机划分为训练集与测试集。损失函数选用最小均方误差(Mean Square Error, MSE )来表征预测结果与实际标签的距离。

图4 LSTM神经网络结构Fig.4 Structure of LSTM neural network

图5为机器学习辅助超表面快速设计方法示意,输入目标单元相位,遗传算法在尺寸空间内随机生成一组尺寸参数,调用神经网络实时预测对应单元相位,评估预测相位与目标相位的差距,迭代更新尺寸参数后再调用神经网络进行预测,如此反复,最终输出符合目标相位的尺寸参数。

图5 机器学习辅助超表面快速设计方法示意Fig.5 Schematic diagram of machine learning-assisted metasurface rapid design method

2 结果分析

将本文的LSTM神经网络与传统的多层感知机 (Multi-Layer Perceptron,MLP)神经网络进行对比,在网络结构与参数相同的情况下,比较二者对于相同超单元频谱预测效果。图6为选取的两个超单元LSTM和MLP预测相位与实际仿真相位曲线对比。

(a) MLP预测单元1

(d) LSTM预测单元2

从图6可以看出,LSTM对于单元相位的预测效果是要优于MLP的,对于相位跨度较大的单元,对比效果更加明显。这是由于LSTM加入了对时间序列的考虑,对单个预测频点相位进行预测时会受之前频点相位的影响。为了进一步探究两个神经网络预测效果不同的原因,给出了两个神经网络训练200 epoch的MSE损失值和单元预测准确率的曲线,如图7所示。

(a) 训练损失值曲线

(b) 预测准确率曲线

从图7可以看出,LSTM的初始损失值高于MLP且初始预测准确率更低,这是由于LSTM神经网络训练初期对单元预测效果差,再加上时间序列的前后影响,导致网络对整个序列的预测误差大,损失值高,预测准确率低。而MLP为简单的全连接网络,对相位的预测是基于各个频点单独预测,前后之间不产生影响,对整个序列的预测误差更小。但LSTM仅训练了20 epoch后损失值便从3.65下降到接近0,而MLP则训练了120 epoch才从1.8下降并收敛到0附近。这是由于随着训练轮次的增加,准确率逐渐升高,LSTM网络序列内部的前后影响带来的“正反馈”进一步提升预测准确率。而MLP只能通过训练一步步提升对单个频点相位的预测准确率。这反映了LSTM在序列预测方面相较于MLP具有收敛快、预测准确率高的优势。

为了验证机器学习在辅助快速设计太赫兹涡旋波超表面的性能,分别设计了工作频率在220 GHz,模数分别为1、2、3的涡旋波超表面,利用仿真软件CST对其进行全波仿真,并远近场分析。

涡旋电磁波是指携带有OMA,波前呈现螺旋式分布的电磁波[22]。轨道角动量与电磁波的位置相关,表现为电磁波的波前相位分布。简而言之,涡旋电磁波就是在平面波的基础上加上一个相位因子,可以简单表达为:

V(r,φ)=A(r)·eilφ,

(2)

式中:A(r)为平面波的幅度,r表示空间点到波束中心轴的径向距离,φ为方位角,l为OAM 的模数,即相位从0°~360°的变化次数。在自由空间的传播过程中,相位会随着方位角的变化而变化,电磁波的等相位面呈现螺旋阶梯状。在理论上,涡旋电磁波携带的OAM的模数l可以取任意值,不同模数之间可以相互线性表示而且互相正交。当平面波垂直入射到超表面时,要产生模数为l的涡旋波束,超表面上的相位分布可以表示为:

(3)

式中:φ(x,y)表示超表面单元中心点坐标为(x,y)时的相位,l为OAM的模数。由式(3)可以看出,涡旋波超表面每个位置上的相位需求不尽相同,这造成了超表面结构的复杂,依靠传统的仿真扫参得到符合相位需求的单元需要耗费大量时间。而本文的逆向单元设计模型只要训练完毕,依靠Python-CST联合仿真,能够快速得到满足相位分布的涡旋波超表面。平面波垂直入射到超表面上反射得到的涡旋波三维远场图如图8所示,图中所有波束都呈现中空环形的“甜甜圈”样式,且图8(a)~(c)中的相位分别呈2π、4π、6π的螺旋分布证明了其分别为模数l为 1、2、3的涡旋波束。

图8 频率为220 GHz不同模数涡旋波束远场强度和相位分布Fig.8 Far-field intensity and far-field phase of vortex beam with different modes at a frequency of 220 GHz

超表面上产生的涡旋波为多个OAM模数叠加产生的,为了进一步验证涡旋波束的质量,还需要对其进行模式纯度分析。模式纯度可以定义为主模数功率占所有模数功率的比值,即:

(4)

式中:El表示模式为l的电场强度,En表示模数为n的电场强度。模式纯度越高证明该模数涡旋波占所有涡旋波的比重越高,涡旋波束质量越好。频率为220 GHz时三个超表面生成的涡旋波束在模数分别为1、2、3的模式纯度如图9所示,可以看出,涡旋波束在l=1、2、3的模式纯度分别为91%、82%、80%,模式纯度较高,波束质量较好。

(a) l=1

(b) l=2

(c) l=3

3 结束语

本文利用机器学习的方法辅助快速设计太赫兹涡旋波超表面。提出了基于LSTM神经网络和遗传算法的超单元逆向设计模型,该模型对于超单元的频谱预测准确率高达95%,并能快速准确得到满足相位需求的超单元。利用该模型构筑了三块工作频率为220 GHz,模数分别为1、2、3的涡旋波超表面,远场仿真效果良好且模式纯度高于80%。该方法能够解决传统涡旋波束超表面设计时,由于超表面结构复杂而耗费大量扫参时间和精力的问题,对于未来产生6G太赫兹涡旋波、提高通信安全具有启发意义。

猜你喜欢
涡旋模数波束
基于PM算法的涡旋电磁波引信超分辨测向方法
基于单片机和模数化设计的低压侧电压监视与保护装置
模数化设计方法在景观铺装设计中的应用
毫米波大规模阵列天线波束扫描研究*
光涡旋方程解的存在性研究
圆阵多波束测角探究
基于LID模式的城区排涝模数探析
Helix阵匹配场三维波束形成
一种新型的RSA密码体制模数分解算法
变截面复杂涡旋型线的加工几何与力学仿真