基于移动云计算技术的在线翻译系统设计研究

2021-07-11 08:16赵力瑾

电子设计工程 2021年13期

赵力瑾

（榆林学院，陕西榆林 719000）

随着我国近年来计算机信息技术的不断创新研发，手机作为移动终端设备，目前在人们的社会生活、工作学习等各领域占据重要地位。而近年来国际间各领域的交流渗透，使得每年中国出境总人数呈递增趋势，那么身处异国他乡遇到不认识的文字时，就可以运用移动手机，将摄像头打开从而获得文字翻译结果，所以本研究旨在能够设计可以满足实时、准确翻译的系统。如今手机可以支持的互译语言包括了中文、日语、韩语、俄语、西班牙语等，部分公开翻译软件有：有道翻译、Google 翻译、百度翻译等。不仅如此，国内手机云应用近年来也获得了飞速发展，譬如百度、阿里巴巴，阿里巴巴于2011 年便成功发布手机计划，先后推出了阿里云、云智能OS 等功能，让用户无需在手机终端下载应用，便可以实现在网络环境下登录云账号正常应用。如今，多数应用都基于云平台成功搭设服务器，来扩充计算资源提高整体应用性能。基于此，本次研究立足实际翻译所需，与云计算技术、移动应用开发技术相结合，设计基于移动终端的云计算实时翻译系统，来针对性结合动态化运行环境，保证短时间内可以成功获得最高效的翻译使用体验。

1 相关技术概述

1.1 图像数字化

模拟图像作为在空间中无连续性分割且无等级划分信号值的一种图像，数字图像处于空间中被持续分割形成离散像素，主要表现方式为二维数组，应用于该文图像处理中，通过采集图像功能转换为数字化图像之后再进行处理。

1.2 边缘检测算法

图像信号在具体处理过程中，进行边缘检测可以有效减少数据量，同时也能够将大批量不相关信息成功剔除，从而有效保留图像结构属性。目前常见的边缘检测算子分别包括了Canny 算子、Sobel 算子、Roberts 算子等。

1.3 图像膨胀和腐蚀

图像膨胀腐蚀操作中的基本组成是结构元素，一般情况下主要包括了多个待处理图像矩阵，在结构元素中心点则明确指定图像中所需要加以处理的主要像素范围，设定结构元素为1，作为邻域像素膨胀腐蚀操作参与计算的关键依据。

1.4 光学字符识别

OCR 主要经电子设备成功获取文字图像具体信息后，对于图像的亮暗度等情况进行检测，运用字符识别法翻译图像信息，获得计算机文字光学转换处理图像中文字，最终可得黑白点阵图像文件，从而运用识别软件转换文字形成的文本格式。在OCR 技术运用中，会存在书写习惯、图像品质等影响，导致OCR 识别结果的差异。所以运用OCR 就是为了有效降低文字识别时误识、拒识等情况的发生率，并提升整体识别的稳定速率。

2 系统需求分析设计

2.1 系统需求分析

本次系统设计是为了在手机终端平台中，运行基于移动云计算的实时翻译系统，将手机摄像头预览图像英文文字转换为中文，用户可以通过手机屏幕实现图像场景预览，同时也可以实现对场景预览图像的实时改变。实际应用通过定义整个运行过程为多个任务序列组合，包括实时翻译的图像获取、文字定位、识别、翻译、显示结果等五大任务功能。该系统的实时翻译任务路径如图1 所示。

图1 实时翻译任务路径

2.2 系统网络架构设计

图2 作为本次系统设计架构图，采用C/S 网络总架构，用户可以通过手机终端完成系统安装，并经手机网络或无线网，访问该手机的云计算服务器，之后计算分担服务器便可经有线网络访问百度翻译服务器，从而形成该系统的正常运行所需条件。与传统C/S 云服务运行不同，本次系统架构云服务器计算过程均在云端执行，经代码实现整个文字定位、识别，实际运行中也可以通过手机运行云端。

图2 系统网络结构拓扑图

3 系统功能模块设计实现

本次设计的基于移动云计算技术的实时翻译系统功能模块，如图3 所示，包括了实时翻译、云计算动态分担两大功能模块。

图3 系统功能模块图

3.1 实时翻译模块

图4为本次系统设计中的实时翻译模块结构图。

图4 实时翻译模块结构图

1）图像采集中，能够实时采集经摄像头获取的用户所在场景图像信息，不需要按下快门，即可成功获取相应的图像信息，并且显示于手机屏幕中实现图像信息预览。在本次功能设计中选用了Andorid摄像头接口，能够对场景信息进行实时捕捉和获取，经onPveiwFrame 即可完成图像像素字节组的妥善保存，并将不同像素点RGB 值保存为三维数据。

2）文字定位。通过分析处理场景图像，可以对于复杂化背景图像，成功完成文本定位，最终返回至文字区域中的外界矩形顶点坐标。通过运用图像形态学结合连通域，成功定位文字区域，并进行图像预处理，即可根据文字特征成功定位，需要经过灰度化处理、边缘检测、图像膨胀腐蚀、填充孔洞、标记和分析连通域等步骤。

3）文字识别。在识别图像中存在的数据文本信息，操作中可以识别为英文数据字符加以处理，运用光学字符识别能够成功识别。基于Tesseracr-OCR引擎成功识别文本，从而支持各类编程语言。

4）文字翻译。本次系统设计中基于百度云翻译API 智能识别翻译文本，能够以带翻译的原文本语言和最终翻译的目标语言，以百度接口向API 提供从而获得相应的存储翻译JSON 字符串。

5）显示结果。经过显示文字定位、翻译最终结果，可以在预览图像中，根据用户的指定位置，完成翻译文本添加并覆盖。

3.2 云计算动态分担模块设计

本次系统设计主要基于移动云计算技术实现，在云计算动态分担模块中，主要功能点包括了资源监控预估、分担决策、分担执行以上3 个模块，具体如图5 所示。

图5 云计算动态分担模块架构

1）资源监控预估

想要获取在资源运行过程中，系统CPU 和具体的网络传输总速度、数据总量各类历史资源数据，还有以往系统运行过程中所获取的真实历史数据资源，设计出基于系统历史数据的计算评估模型，从而评估未来系统运行的资源数量。以该部分为例设计代码示例如下：

2）选择分担路径

结合具体监控资源并选择预估模块内部的资源数据，本系统可以经过云端计算以及运作协作方案，寻找最优化分担执行路径方案。执行路径在选择过程中，对性能产生主要影响的因素包括T、E，分别表示时间消耗、电能消耗。其中时间消耗又包括了数据的传输所耗时间，执行数据任务获得结果的所需时间，以及云端文字识别的计算时间。对于策略制定过程中，假设本地执行、远程执行两个时间分别为Tloeal、Tremote，计算远程执行时间和远程执行能耗公式如下：

3）分担执行

本系统通过封装处理每一个任务作为可序列化处理对象，并进行单独封装作为任务序列，经本地或云端执行每一步任务，并经分散决策动态化制定具体运行位置，最终分别执行于本地、云端等，可以获得相应的运行结果，并向分担决策功能模块提供真实的运行数据，包括数据量的上传下载、运行时长等均作为关键的预估依据。经Java 序列化、反序列及反射从而成功云端执行，定义C 类拥有p 方法，C 类实例对象o，假若o 采用的m 方法可以向云端执行成功迁移，那么则可以传输o、o、m 对象调用p 参数序列化可传输byte 数组。同步传输m 至云端服务器，接收云端服务器后，反序列byte 数组，成功恢复为o 对象，可以唤起o 对象的m 方法，最终获得运行结果。

以历史运行数据为依据，完成执行任务的时间、能量具体消耗情况，完成总运行消耗量计算，最终选择消耗量较小的路径，作为主要的实际运行路径。

4 系统测试

经本次测试发现，通常情况下该系统的静态图像文字定位精准率可以达到80%以上，可以成功识别90%以上的正确定位区域文字。并且经本次测试研究结果，也发现该算法可以准确识别小倾斜角度文字区域。通过将文字场景图片展开测试，将系统打开后对准图片进行拍摄，其程序运行结果如图6 所示，发现可以在原图文字位置实时显示翻译后的文字信息。

图6 实时翻译运行截图

5 结束语

文中通过与移动应用需求相结合，设计了基于移动云计算的实时翻译系统，能够经摄像头实时取景后获取翻译结果，经云计算动态分担获取资源信息，并经Java 程序实现云端分担执行翻译任务，证实了该文设计的实时翻译系统的翻译效果，未来也将在翻译领域有一定的发展前景。