关于语音识别技术在电力生产中的应用研究*

2015-02-17 07:59陈锦彪
新技术新工艺 2015年11期
关键词:电力生产语音识别人机交互

陈锦彪

(广东电网有限责任公司 佛山供电局,广东 佛山 528000)

关于语音识别技术在电力生产中的应用研究*

陈锦彪

(广东电网有限责任公司 佛山供电局,广东 佛山 528000)

摘要:语音是最自然的输入手段,近年来语音识别已被广泛应用于智能家具、车载导航等场合,电力作为生产生活的基础,吸纳语音处理技术是势所必然。对语音识别技术进行了研究,从EMS人机交互、巡检机器人控制、远程影音对话和巡检单现场操作等诸多方面阐述了语音识别在电力生产中的应用构想。让更多的读者了解到语音识别技术在电力生产中解放双手的新式操作体验,为语音识别的人机交互新技术在电力生产的大量应用抛砖引玉,从而为提升电力生产效率添砖加瓦。

关键词:语音识别;电力生产;人机交互

语音识别是语音技术的重要分支,其起源于20世纪50年代。20世纪60—80年代,语音信号线性预测技术、动态时间规正(DTW)、矢量量化(VQ)和隐马尔柯夫模型(HMM)等相继被应用到语音识别技术,使之逐渐具有非特定人、大词汇量和连续语音识别等功能。20世纪90年代后,人工神经网络以其高度容错性和自适应性使语音识别系统从实验室走向实用。目前,我国开发的汉语人机对话系统准确率已达90%以上。

电力系统应用语音报警、语音合成等语音技术的历史可谓悠远,但应用语音识别是刚刚起步。本文将在充分分析电力生产特点的基础上,阐述语音识别技术对于电力系统的重要性,以期进一步拓展该技术的覆盖范围。

1语音识别原理

语音识别就是利用计算机将语音信号转化为机器可执行的文本命令,其属于模式识别的范畴。按工作原理划分,模式识别细分为模式匹配、句法模式识别和统计模式识别等3类,当前的语音识别系统大多数是基于模式匹配原理的。语音识别实现过程的简单描述如图1所示,其主要包含特征提取、模式匹配和参考模式库等3个单元[1]。

图1 语音识别的原理

语言识别原理如下:1)待识别语音通过麦克风变换成输入语音,然后到预处理环节;2)预处理涉及多样技术,包括信号采样、反混叠滤波和端点检测等,有时还会有模/数转换和预加重,其目的是排除因个体差异、周边环境等产生的噪声;3)特征提取通过对一些特征函数(如倒谱、共振峰、线性预测系数、平均能量和过零数等)的计算,得到代表输入语音本质的信息;4)训练、聚类是通过让语音输入者多次重复讲话以提炼关键数据(除掉冗余信息),并形成独特类别,保存进参考模式库;5)模式匹配是语音识别的核心,其通过距离测度的方法来衡量输入特征与参考库之间的相似度,以此来判决最终识别结果,其中,距离测度常用的方法有HMM距离测度、似然比测度和欧氏距离测度等。

2语音识别的典型问题分析

语音识别要达到实用化要求,应妥善处理如下几个问题。

1)降噪。很明显,语音识别不可能避免噪声环境。所谓噪声,除了客观环境的背景噪声外,讲话人因情绪变化而导致发声失准(与正常相比)也是不可忽视的一个噪声因素。目前,应对噪声的方法主要有谱减法、环境规正技术以及建立合理的噪声模型等。

2)基元选取。根据使用经验,欲使语音识别系统能识别更多词汇,所选择的基元应该尽可能小。

3)端点检测(即确定语音的起末点)。据大数据统计,50%以上的语音识别错误源于端点检测环节。提升端点检测成功率的关键是找到稳定的语音参数。

4)识别速度及拒识问题。语音输入者应尽可能减少“啊”、“吧”等语气助词,并且不使用方言或口语化语言,以提升语音识别的速度和成功率。

3语音识别在电力生产中的应用

3.1应用于EMS人机交互层面

能量管理系统(EMS)是调度员日常工作中操作最多的系统,其关系着整个电力系统的控制。EMS系统牵涉大量的人机交互环节,传统的交互途径是基于鼠标/键盘的组合。根据文献[2]的研究,EMS必然朝着“动用各种感官,实现人机全面沟通”的方向发展。语言是自然、有效的交流方式,若能将语音识别融入EMS的人机交互,将能显著提高信息输入的效率(特别是在电网发生紧急情况时)。

3.1.1可行性和价值分析

当前,调度员主要通过鼠标和键盘来操控电力系统的运行,当语音识别加入后,其与鼠标、键盘在命令控制和文字录入环节上的综合比对见表1。

表1 EMS系统中3种人机交互方式的比对

限于篇幅,仅就命令控制情况进行分析如下:1)用鼠标选择命令,不需记忆代码,但要花时间找,其因此认知负荷低,操作效率低;2)用快捷键选择命令,速度快,记忆量小(因只涉及少量命令),因此,其操作效率高,认知负荷较低;3)语音识别牵涉到固有的语音代码,需要花费时间去记忆,但语音一经出口即进入自动执行环节,因此,其认知负荷较高,操作效率高;4)鼠标及键盘都是第三方工具,而语音是人类最常用的交流方式,因此,语音识别的自然性要优于鼠标及键盘。

可见,语音识别作为一种新型的交互技术,是键盘和鼠标等传统交互的有效补充。

3.1.2关于语音识别在EMS的应用架构的设想

一般来说,EMS命令可分为模糊空间类命令(如框定一块没名称的区域)、具体空间类命令(如选中一个变电站)和非空间类命令(如显示功率)[3]。显然,语音识别对模糊类命令很难表达,对具体类命令则非常合适。在考虑语音识别后,EMS人机交互的组成框架变为如图2所示。图2中,调度员正常是指身体状态良好且已熟悉业务。

图2 语音识别在EMS中的应用

3.2应用于机器人巡检

电压等级为500 kV及以上的变电站已普遍使用机器人巡检,但其控制指令一般在主控室后台下达。这种方式有如下不足:1)变电人员无法直面设备操控机器人,无法在设备区查询状态信息;2)后台程序专业性强,操作路径复杂,不经严格训练是不能使用的,由此限制了较大一部分变电人员的工作。采用语音识别,则变电人员只需熟悉简单的指令,就能命令机器人前进、后退、转弯和温湿度查询等,既提升了变电站的智能化管理水平,又方便机器人日常运维,还可推进无人值守。

实现过程如下:变电人员通过无线话筒发布指令,机器人由自带的拾音器采集声音并送达系统内部,经由语音识别算法(如DTW算法)提取特征参数,再和参考库进行比对,发出识别结果供执行。

3.3应用于其他方面

传统的变电、线路巡视往往依照巡视卡规定的路线和项目进行巡视(巡视情况需手工记录在案),这种方式的明显缺点是效率低下,且可能会出错(如笔误)。随着智能变电站的兴起,可视化技术逐渐获得应用,在可视化支撑下,远程巡视成为可能。和上述EMS一样,远程巡视要顺利开展,离不开工作人员的远端控制。一般来说,巡视是很有规律的生产活动,可将其细化为一系列前后相继的标准化、格式化操作步骤,这样就可使用语音识别来控制巡视过程的进行以及现场巡视单的生成。以变压器巡视为例,针对巡视部位选择和巡视情况记录,只需几个简单的语音(如“是”、“否”和“选择1”等)就能完成。详细如图3所示。

图3 语音识别应用于远程巡检

另外,远程影音对话与课件点播等场合均可使用语音识别技术。以科大讯飞语音平台为基础,勾勒出包含多环节的语音识别应用体系(见图4),具体流程如下。

图4 语音识别应用于电力生产的总体架构

1)用户打开语音识别系统主界面,然后报菜单名称(有4个可选项:可视现场、巡检表单、播放课件和退出系统)。

2)机器在监听到用户语音后,打开相应菜单。

3)以“可视现场”菜单为例,用户用语音控制打开之后,进入远程巡检模式(能看到远端设备的状况),在巡检完成后,用户发命令“关闭”,则系统自动转到主界面。

4)在远端在线巡视完成后,用户用语音打开“巡检表单”菜单,进入表单填写。为了具备可操作性,表单所有内容均被整理为标准选择项形式,即用户只需使用“选择A”等类似词汇即可完成表单自动填写。在所有项目选择完毕,用户发命令“提交”,表单就自动生成,系统回到主界面。

5)如用户希望播放课件,则只需在主界面状态下发命令“播放课件”,系统开始自动播放课件(如存在多个课件,可通过应答机器提示而选择)。

4结语

语音识别能彻底解放电力工人的双手,使各项操作更为简捷和高效。随着嵌入式系统的发展,语音识别还能推广到无线系统中。总之,语音识别技术是时代发展的前沿,也是电力行业应用的趋势,应该加以快速推广。

参考文献

[1] 杨朴. 电力系统中的语音应用技术研究[J]. 计算机仿真,2004 (2):38-39.

[2] 李鑫. 电力系统智能导航巡检仪的开发与应用[J]. 电子世界,2013 (3):48-50.

[3] 王大伟. 基于语音分析技术的电力客户服务质量检测与分析探究[J]. 电子测试,2013 (9):173-174.

* 中国南方电网有限责任公司科技项目(030600KK52140058)

责任编辑彭光宇

The Speech Recognition Technology Application Research in Electric Power Production

CHEN Jinbiao

(Foshan Power Supply Bureau,Guangdong Grid Co., Foshan 528000, China)

Abstract:Voice is the most natural input mean, in recent years, speech recognition has been widely applied to intelligent furniture, car navigation and so, and power is the basis of production and living in urgent need of the speech processing technology. Summarize the speech recognition technology, and then from the EMS man-machine interaction, inspection robot control, remote video dialogue, checking single site operation, and many other aspects. Expound the idea of the speech recognition application in electric power production. The purpose of the article is to make readers know more about the speech recognition technology in electric power production while hands are free in new operation experiences. For speech recognition of human computer interaction application of new technology in electric power production, it can improve power production efficiency.

Key words:speech recognition, electric power production, the human-computer interaction

收稿日期:2015-05-11

作者简介:陈锦彪(1986-),男,工程师,主要从事电力系统自动化、软件工程等方面的研究。

中图分类号:TP 183

文献标志码:A

猜你喜欢
电力生产语音识别人机交互
通话中的语音识别技术
电力监控系统在电力生产中的应用
供电企业电力技术发展与电力生产的安全探讨
某型柴油机虚拟维修系统研究
人机交互课程创新实验
面向移动终端的语音签到系统
农业物联网平台手机秘书功能分析与实现
基于Android手机语音和Arduino控制板的机器人控制系统