采用移动GIS结合语音识别的地下管线数据采集系统实现

2018-11-08 02:41李海飞
江西测绘 2018年3期
关键词:外业短语管线

李海飞

(福州闽地勘测规划有限公司 福建福州 350011)

1 引言

城市地下管线探测的外业数据采集,目前处于纸质手工记录向移动GIS过渡的阶段,采用纸质手工记录,作业人员需外业完成记录以后,转入内业,继续完成数据的整理和录入或交由专门的内业人员整理。内业工作量大,内外人员数据交接存在数据不规范、理解有偏差等现象。成果数据出现问题时,分析原因较为困难,工序中间环节多,出错几率大。采用移动GIS进行数据采集,高效的优化了外业数据采集流程。

为进一步提高作业效率,本文以地下管线普查工作为例,研究了在外业采集终端的基础上,结合语音识别的技术进行数据采集应用,为类似工作提供参考。

2 基于语音识别移动GIS平台介绍

本移动GIS硬件采用RTK手簿,系统包含的应用程序框架 (Application framework),作为Andrio开发的基础,利用最新的Visual studio c#,可开发供不同组件调用的功能模块,利用核心API访问权限,开发外业应用组件[1];移动终端硬件具有双频双星主板及双频双星天线,搜索卫星的灵敏度和有效性高,在外业有很强的便携性及灵活性,还具有以下特点:

1)采用网络RTK可得到小于30厘米的实时手持定位精度,甚至可以完全不依靠外接设备,只采用单机。

2)通过对中杆或支架与主机连接后,定位精度可以精确到厘米级,辅以系统强大的计算能力,为使用者提供稳定的高品质数据采集成果。

3)通过GIS软件平台的二次开发,可实现数据的无缝对接。并可以根据客户的个性化要求,定制各种特定需求的行业应用软件。

3 基于语音识别移动GIS地下管线数据采集系统的设计

地下管线敷设于地下,按功能可分为给水、排水、燃气、热力、电力、通信、工业等。地下管线探测应查明地下管线的类别、平面位置、走向、埋深、偏距、规格、材质、载体特征、建设年代、埋设方式、权属单位等,测量地下管线平面坐标和高程,并符合下列规定:

1)地下管线普查时应建立管线数据库;

2)地下管线详查时应查明与工程建设施工有关的信息;

3)地下管线竣工测量成果应符合地下管线数据库更新的技术要求。

为完成以上任务,本系统以Andrio系统的RTK手簿为基础,开发基于语音识别的信息采集系统,启动该系统后,可手动加载测区的地形底图或正射影像图,系统会自动建立各种管线图层,也可以打开已有的管线图进行修改编辑、管线属性信息的查询与编辑、成果质量检查,利用外接配带的耳机与麦克风,在野外现场采集管线的空间信息和属性信息,必要时可手工干预修改,系统外业采集的数据可与电脑上的管线数据处理系统对接[2]。

4 基于语音识别移动GIS地下管线数据采集系统的开发

语音识别移动GIS地下管线数据采集系统的开发环境,采用Visual Studio.NET 2017的C#进行Andrio应用开发。

语音识别移动GIS地下管线数据采集系统主要由以下几个模块组成:

1)数据录入和处理

通过访问API获取平面位置和地面高程;通过语音识别获取点名、埋深、材料等属性,在主界面上分别显示到对应输入框,在确认无误后,存储到管线成果数据文件中,若外业不便于观看屏幕,可选择语音识别的同时,对操作人员的语音进行录音,各段录音与录音时设备所在位置信息一起保存,以便后续查验核对如图1

2)管线图形显示

管线图形显示:根据录入及读取的管线数据自动生成管线图,同时提供矢量和栅格显示及平移、缩放、旋转功能;交互编辑功能,添加或删除管线点、标注点名和管径、连线、删除线、移动、捕捉、属性匹配等功能。

图1 管线数据采集

3)数据检查

检查管线点和线的图、属性信息的一致性,选择管线、管线点查询其相应的属性,在图上圈定范围并进行分类统计,实时显示、保存或统计结果。

4)成果数据输出

以shape格式或DXF格式输出管线数据,在电脑上进一步编辑或导入管线数据库。

除第一个模块外,其它各模块目前均有不少研究及应用案例,本文不再进行说明,重点对该系统的语音识别部分进行说明。

该语音识别数据采集系统采用在安卓开发中的使用的离线语音识别的开源项目CMU Pocket-Spinnx。它是完全离线的语音识别,只要按照要求开发,目前的语音识别正确率尚可。

通过PocketSpinnx官网,可以学习该离线语音识别的工作原理,能够加深对移动GIS地下管线数据采集系统使用语音识别的理解。为了把Pocket-Spinnx的离线语音识别功能引入到地下管线数据采集系统:

a)建立语言模型:

图2 管线短语

将外业数据采集时,常用到的术语、数字、字母等想要识别的字、词组成命令集,能组合成短语的尽量组成短语,如“4 孔”、“6 孔”、“4 根”、“6 根”等,打开Sublime Text新建一个管线短语的txt文件,采用utf-8编码,每一行写一个命令词,如图2管线短语的txt文件编辑完后,打开http://www.speech.cs.cmu.edu/tools/lmtool-new.html生成语言模型,点击选择文件,选择刚才编写的管线短语的.txt文件,然后点击COMPILE KNOWLEDGE BASE按钮,生成语言模型,将生成的整个.tgz文件下载下来解压缩,本系统需要的语言模型即为其中的.lm文件。

b)建立字典模型

字典模型在语音识别数据采集系统的作用是为了让语音识别器能正确识别短语的发音,从而选择正确的中文、数字、字母等管线短语,以便于采集系统根据管线短语中的关键字对输入的数据进行分类、分层、录入属性,获取字典模型要到PocketSpinnx的资源网盘中的Mandarin文件夹,将后缀为.dic的文件下载,该文件里已存在日常普通话的发音,在其中查找到管线的短语,找不到完整短语的就用单个字的发音组合,以该.dic文件的格式为模板,在.lm语言模型文件中的.dic文件中,补充完善.dic文件的发音,如图3。

图3 字典模型

完成管线短语字典模型。

c)建立声学模型文件

在上述资源网盘的Mandarin文件夹下,下载.tar.bz2并解压,得到声学模型文件:

d)导入接口

做好以上准备工作后,在PocketSpinnx开源的安卓demo中可以看到如图4。

图4 集成相关接口

将demo中的aars和models导入创建语音识别数据采集系统的项目中,快速集成相关接口。为了让系统能够识别中文,参照demo中en-us-ptm中的英文声学模型,新建一个GXDY文件夹,含前面获得

的普通话声学模型、语言模型和字典模型。

e)调用识别器

获得以上模型以后,在项目中调用相关的API,获取语音识别器类SpeechRecognizer,开始监听和结束监听。创建管线短语文件监听的时候需要.gram文件,参考.gram文件编写管线短语文件。

grammar menu;

public=管线短语1|管线短语2|管线短语3;

外业开始语音数据录入以后,监听器在监听管线短语文件的字、词中找出发音最相似的,在语音显示行中显示监听结果。在使用者确认后,系统对听取到的属性信息和从API中获取的坐标信息对管线数据进行分类存储并显示在屏幕上[3]。

5 结束语

系统采用语音方式进行属性录入,系统对关键字进行提取后分别填入对应字段,不必人工一一查找并填写对应字段;对部分属性相同的管线或管线点可只录入不同的属性部分,相同的属性部分可用同前一点或前一线的方式快速填入,语音录入的属性字段若存在不正确的数据可手工修改后录入绘图的方式进行记录,结合耳机语音回报的功能,可实现免看屏幕,解放双手的外业操作。由于大量管线短语数据采用规范输入,可以有效降低语音识别的错误率,极大减少内、外业的工作量,明显提高工作效率。

由于口音、环境嘈杂等复杂情况,某些情况下可能存在误录的情况,需人工查看并修正录入,可通过操作人员本人对需用到的管线短语一一读音建立语音字典的方式,过滤无关声音,提高正确率。

猜你喜欢
外业短语管线
基于移动 GIS 的公路工程外业调查系统研究
高级别管线钢X80的生产实践
基于市政管线外业采集命名规则和辅助软件开发
天津市第一次全国地理国情普查外业调绘核查
浅谈通信管线工程建设
浅谈通信管线工程建设
公路外业测量中GPS RTK测量技术的应用探究
《健民短语》一则
匀质地下管线大变形的控制微分方程及其近似解