基于零样本学习的集装箱箱号识别系统研究

2023-12-29 03:56刘东辉沈毅炜赵中华
港口装卸 2023年6期
关键词:编码器类别集装箱

刘东辉 刘 奇 沈毅炜 赵中华

1 青岛海西重机有限责任公司 2 中国石油大学(华东)经济管理学院 3 山东科技大学自动化学院

1 引言

集装箱编号用于跟踪和管理集装箱,其准确性直接影响到物流效率和客户满意度。传统的集装箱号码识别方法主要基于监督学习,对于新出现的没有标签的集装箱号码无法进行准确识别。为此,提出一种基于语义自编码器的零样本学习方法,旨在通过学习图像特征与语义的映射,实现对陌生集装箱号码的准确识别。

2 零样本学习与语义自编码器

2.1 零样本学习

零样本学习是一种机器学习任务,旨在实现对未见过类别的准确分类[1]。传统的机器学习方法通常需要大量已标注的数据进行训练,但在现实中,获取大规模标注数据的成本较高。零样本学习通过利用已知类别和属性之间的关系,以及通过学习类别的特征表示,实现对未知类别的分类。这种方法可以通过将样本映射到一个共享的语义空间来实现,使得类别间的关系更加明确。

特征提取算法是零样本学习算法中的重要组成部分。在集装箱箱号识别中,需要选择一种合适的特征提取算法来提取集装箱箱号中的关键信息。常用的特征提取算法包括卷积神经网络、循环神经网络等。GAN(Generative Adversarial Network,生成对抗网络)是一种用于生成新数据的深度学习模型。在基于零样本学习的集装箱箱号识别系统中,可以利用GAN生成新型号的集装箱样本,从而实现对新型号集装箱的零样本学习。模型训练算法是实现集装箱箱号识别的关键技术之一。在集装箱箱号识别系统中,需要构建一个合适的模型来训练数据。常用的模型训练算法包括支持向量机、随机森林等,这些技术相互协作,共同实现对新型号集装箱的准确识别。

2.2 语义自编码器

SAE(Semantic Auto Encoder,语义自编码器)能够学习到数据的低维表示,并将数据映射到一个语义空间中[2],由编码器和解码器组成。编码器将输入数据转换为语义空间中的表示,解码器将语义表示重新映射到原始数据空间,以重构输入数据。

语义自编码器的训练过程包括2个关键步骤:编码和解码。在编码阶段,输入数据经过一系列的隐藏层,每一层都将数据表示压缩成更低维度的表示。在解码阶段,低维度的表示经过一系列的隐藏层逐步解码,最终重构成与原始输入数据尽可能相似的输出。在训练过程中,通过最小化重构误差来优化自编码器的参数,使得其能够学习到数据的有效表示。

语义自编码器的关键优势在于能够将不同类别的样本映射到语义空间中的不同区域,不同类别之间的语义距离可以被有效地量化。在零样本学习任务中,语义自编码器能够训练已知类别和语义空间之间对应的关系,对未见过的类别进行准确分类。

3 系统设计

岸边集装箱起重机(以下简称岸桥)箱号识别系统由3个子系统组成,分别是前端岸桥智能视觉识别子系统、后端集中管控子系统、web前端子系统。

3.1 智能视觉识别系统

视觉识别子系统部署在岸桥上,由高清摄像机、电气柜、PLC系统组成。系统采集PLC信号进行转换解析,通过识别集装箱装卸过程中小车及吊具的动作自动触发摄像机对集装箱、集卡车进行全方位的抓拍。通过基于零样本学习的识别模型识别集装箱箱号、箱型代码、集卡车号、箱门方向等信息。系统可触发不同位置的相机精准抓拍集装箱可见面的高清图像,并通过网络将识别结果以及高清图像传输至后端集中管控平台做进一步的业务处理。

集装箱起重机箱号智能视觉识别系统的前端设备,包括前端采集摄像头、集装箱起重机箱号识别服务器、交换机等通过网线连接,各岸桥与中控服务器之间通过码头预设光缆连接进行数据传输。系统网络架构图见图1。

图1 集装箱起重机箱号识别系统网络架构图

3.2 后端集中管控系统

集中管控平台作为岸边集装箱起重机箱号智能视觉识别系统的核心业务系统,是基于Nacos、MyBatis、ZeroMQ、WebSocket、Protobuf等成熟开源框架构建的Web后台微服务应用。软件采用微服务架构设计,系统采用双机热备部署,若某台服务器出现异常情况,业务数据可自动切换到冗余备份服务器中进行处理。在理货作业过程中,系统实时将前端采集识别系统中上传的设备状态、理货作业等信息,存储在Redis和MySql数据库表中,并将理货生产作业数据发送至理货平台。

3.2.1 数据预处理

在集装箱号识别任务中,首先建立一个包含已标注的集装箱号和相应类别信息的数据集,然后对集装箱号进行预处理操作,以便为语义自编码器的训练和零样本学习做准备。数据预处理包括以下步骤:

(1)去除噪声。集装箱号图片通常会受到噪声的影响,例如图像中的模糊、光照变化等。通过图像处理技术,如滤波和去噪算法,可以减少噪声对集装箱号图像的影响。

(2)归一化。为了保证不同集装箱号之间的可比性,需要对集装箱号进行归一化操作,包括图像尺寸的统一、图像亮度的调整等,以确保输入数据具有相似的特征表示。

(3)特征提取。为了将集装箱号映射到语义空间中,需要从图像中提取有意义的特征。可以使用卷积神经网络等深度学习模型,或者使用传统的计算机视觉特征提取方法,如局部二值模式、方向梯度直方图等。

3.2.2 语义自编码器的训练

在零样本学习任务中,需要使用已标注的数据集来训练语义自编码器模型。训练过程可以分为编码和解码2个阶段。

编码阶段将预处理后的数据集的特征向量输入编码器,获取其在语义空间中的表示。编码器负责将高维数据转换为低维数据,并得到高维数据在语义空间的低维表示。解码阶段将语义空间中的表示返回解码器,并通过一系列的步骤解码,最终重构出与原始输入数据尽可能相似的输出。解码器的目标是最小化重构误差,使得解码后的数据与原始输入数据尽可能一致。

通过训练语义自编码器,能够获得编码阶段的特征向量到语义空间的投影矩阵W,为了能够应对大规模数据,简化模型,令语义空间到解码器的投影矩阵W*=WT。

3.2.3 基于语义自编码器的零样本学习

在测试阶段,利用已训练好的语义自编码器模型进行零样本学习,实现对陌生集装箱号的识别。将数据集的80%作为训练集,20%作为测试集。

设Y={y1,…,ys}和Z={z1,…,zu}分别表示s个训练集和u测试集的标签,Y∩Z=φ。同样SY={S1,…,Ss}∈Rs×k和SZ={s1,…,su}∈Ru×k表示相应的训练集和测试集的语义表示(例如k维属性向量)。给定N个样本的训练数据XY=(xi,yi,si)}∈Rd×N,其中xi是从其中一个可见类的第i张训练图像中提取的d维视觉特征向量,零样本学习的目的是学习一个分类器f:XZ→Z即预测图像的标签来自于测试集的类,其中XZ={(xi,zi,si)}为测试数据,zi和si是未知的。

将给定N个样本的训练集数据XY=(xi,yi,si)}∈Rd×N,xi输入到SAE中进行训练,通过si和xi的关系得到视觉空间到语义空间的投影矩阵W。

对于测试集的集装箱号图片,将其提取好的特征向量输入编码器,获取其在语义空间中的表示。然后,通过计算该表示与已知类别的语义表示之间的距离,可以确定其所属的类别。通常可以使用欧氏距离或余弦相似度等距离度量方法进行距离计算,距离越小,表示未见过的集装箱号与已知类别越相似,从而达到准确分类的目的。

为了进行零样本学习,还需要构建一个属性空间,其中包含每个类别的属性信息,如集装箱类型、尺寸等。通过将属性信息与语义表示相结合,可以提高零样本学习的准确性。

在实际应用中,可以使用大规模的集装箱号数据集进行训练和评估,以验证基于语义自编码器的零样本学习方法在集装箱号识别任务中的性能;还可以探索其他改进方法,如引入注意力机制或生成对抗网络等,进一步提高零样本学习的准确性和泛化能力[3]。

通过以上方法,基于语义自编码器的零样本学习在集装箱号识别上可以实现准确的分类,降低对大量已标注数据的依赖性,提高算法的适应性和泛化能力。

3.3 web前端系统

web前端子系统是可视化的交互平台,基于LayUI框架、JavaScript、HTML5等前端核心技术开发实现,通过Tomcat服务器发布后,可直接通过浏览器访问的前端可视化应用系统。

4 结语

基于语义自编码器的零样本学习方法,为解决集装箱号识别中的零样本学习问题提供了一种新的思路。通过有效地学习集装箱号的语义表示,能够在未见过的类别上实现准确的分类,提高集装箱管理的效率和精度。

猜你喜欢
编码器类别集装箱
美军一架C-130J正在投放集装箱
虚实之间——集装箱衍生出的空间折叠
基于FPGA的同步机轴角编码器
我家住在集装箱
基于PRBS检测的8B/IOB编码器设计
服务类别
JESD204B接口协议中的8B10B编码器设计
一种新型自卸式污泥集装箱罐
论类别股东会
多总线式光电编码器的设计与应用