语音识别技术在广播电视监测中的有效应用

2022-02-10 13:24李雨柯
西部广播电视 2022年24期
关键词:音频电视节目语音

李雨柯

(作者单位:贵州省广播电视监测中心)

1 语音识别技术

1.1 语音识别技术简述

语音识别技术可以转换输入系统中的声音信号,使其转换为文字形式或预设的命令,语音识别技术使人们不用借助鼠标、键盘等设备而通过语音进行命令输出,可以更加便捷高效地开展各项工作。语音识别技术自20世纪开始研发,目前发展应用已经非常成熟,再加上计算机技术的发展,语音识别技术的应用更加普及。语音识别技术中的核心内容是针对语音信号利用动态规划技术和线性预测分析技术进行模型问题解决。

语音识别技术的主要识别方法包括4个方面。第一是基于声学和语言学的识别方法,目前这一方法的普及程度仍然有限。第二是随机模型法,其相关技术的发展已经较为成熟,因而实践应用也比较广泛。随机模型法在语音识别过程中的主要流程包括特征提取、模块训练和分类、模块判断等,涉及矢量量化技术、动态时间规整技术等。其中,马尔可夫模型算法具有显著的优质性和简便性,语音识别效果更加理想,在语音识别系统中具有极为广泛的应用。第三是神经网络识别方法,是一种新兴技术,可以模拟人类神经活动,且具有一定的人类特性,包括自动适应、自主学习等,在映射能力和归类能力方面具有优异的表现。实践应用过程中,通过对传统方法和神经网络识别方法的灵活融合,能够有效弥补两种方法的不足,令语音识别功能具有更高的效率。第四是概率语音分析识别方法,通过应用这一技术,可以对较长的语音内容进行识别,具有语言特征区分能力,也可以对多层次问题加以解决。但是,在运用这一识别方法时,必须建立具有有效性和适应性的知识系统,如图1所示。

图1 语音识别系统整体架构

1.2 语音识别程序

第一,语音识别主要包括命令和识别两种工作模式。根据工作模式的不同,要使用针对性的程序,进而有效实现语音识别功能。命令模式的实现需要程序员先进行词典编写,然后再编程,还要基于语音词典进行修订处理。识别模式的原理是在后台中由引擎系统创造词库及识别模块库,实践应用过程中不用再对识别语法进行任何改动,只要改写识别引擎的主程序源代码就能够实现语音识别功能。相较而言,命令模式和识别模式最大的差异在于命令模式中程序员要基于词典内容对代码进行修改核对。第二,设置语音识别环境。语音识别程序环境设置内容具体包括采集并设定计算机电信集成(Computer Telecommunication Integration,CTI)服务器硬件的默认参数、初始化硬件采集卡、设置引擎端口等内容[1]。CTI技术是识别环境设置过程中的核心技术环节,对语音采集系统进行初始化操作时,是否有语音录入系统中可以作为判断工作是否启动的重要标准,在对语音内容进行采集和输出时,主要是利用语音卡进行相关工作。语音卡的操作使用非常简便,只需要将其中的板卡打开并将参数输入其中,就可以正常运行作业。引擎端口的设置过程中,因为语音开发平台中已经设置有应用程序编程接口函数,因此只要对其进行调用和复制即可。第三,对语音词典进行编译,具体内容包括语音模板、语音识别规则、语法等内容的制定,实际工作开展中要先设置语音识别核心包,然后根据个人编译语言标准进行字典设置。第四,主程序编制识别。通过编写主程序交互界面,令使用者和电脑之间能够实现交互操作。

2 语音识别技术的应用类别

2.1 内容识别

通过分析语音的生理与物理属性,语音识别技术能够对语音内容完成判断识别。但是,由于说话人在表达习惯、发音及方言等方面均具有较大的差异性,内容识别的难度较高,为有效克服这一不足,逐渐发展出了声纹识别技术。在应用声纹识别时,需要利用词语区分、词性标记及语境理解等,令声纹和语义模型、语法模型具有较高的相符性,实现对语音内容的精准判断,处理过程也具有一定的烦琐性[2]。

2.2 声纹识别

声纹识别技术能够对说话人的具体身份进行明确判断,识别过程对语音波形进行结合分析,匹配说话人行为特点和语音状态。声纹识别技术的应用基础是语音信号,然后根据每个人发音的特征对其个性进行判断,并进行身份对应识别。从生物学角度来看,声纹识别和指纹识别具有一定的相通性,均属于生物因子的认证范围。两者不同之处在于声纹识别是基于说话人的特征进行准确判断,而指纹识别则是基于指纹的独特性进行身份判断。

2.3 语种语音识别

语种识别是对语音材料中的语种特征进行分析判断,具体应用过程是将电脑中的语音材料提取录入语种识别系统,然后进行识别判断。智能翻译技术和语音内容识别技术是从语种识别技术发展而来的,通过对比语音标准模型,就能够对某个人的语音材料完成语音状态分析,并对语音中的不标准发音进行抓取标识[3]。

3 语音识别技术在广播电视监测中的实践

3.1 实时监测多路节目内容

借助电视、手机等诸多载体,语音识别技术已经在社会生活中实现了非常广泛的运用,例如,使用手机及内部相关软件程序,就能够对语音内容进行识别并转换成文字内容,或者对手机用户的语音指令进行有效执行。在多路自动语音识别方面,应用监测服务器集群和资源处理技术就能够令实时监听多路电视节目内容的能力实现指数级增长。实时监测过程中,各路电视节目都会转换成相应的文本内容单独输出。对于当下十分火爆的网络视听节目,相关部门可以要求其必须在接入语音识别功能后才能入网发布,在此基础上,实时向监测监管机构发送针对视听节目的监听文本内容。智能语义分析系统仅需要通过对各路节目传输的文本内容做监测分析,即可实现预期监控监测目标。其应用优势在于相较视频流处理分析,不会造成过大的硬件资源压力,仅需要消耗极少的资源,就能够将网络平台上的所有视听节目资源纳入实时监控监测范围[4](见图2)。

图2 语音识别分析监管流程图

3.2 实现更高准确率的语音识别

广播电视与网络视听节目大多都是在专业录像或录音间进行录音和配音工作,且均配置有专业的主持人或主播,其普通话非常标准。语音资源中的环境噪声非常小,且说话人的发音大都非常标准,语音识别系统可以获取更高质量的语音资源。使用专业设备就可以将声音轨道分离,从而令处于监控监测范围内的电视节目与网络视听节目源在语音识别和文字转化方面具有更高的准确率,使后续分析工作和监测工作的开展更加科学、可靠[5]。

3.3 实现更加便捷的语种识别

电视节目中的内容非常多样化,且随着全球化发展进度的不断推进,电视节目中经常会播放世界各地的音视频内容,其中包含多种类型的语言。针对这一电视节目的发展现状,语音特征值提取与图像识别很难发挥应有的作用,监测监管过程中,不管是应用监测技术或人工识别,均很难对电视节目中的有害信息实现高效辨别。但是,通过利用多语言混合识别技术,在系统中加入其他语种声学模型,就可以在监测电视节目时实现有效的文本输出与语义智能分析,大大降低了广播电视监测工作中的人力投入和成本。

3.4 实现更加高效的违规信息识别

作为传播意识形态的重要载体,相比其他传播载体,语言占据着不可撼动的重要地位。在针对视频内容或图片内容进行监测分析时,语音识别和画面监测技术的单独应用,在识别违规违法事件及舆论导向方面仍具有较为明显的局限性。但是,通过应用智能文本语义分析技术,能够开展同形、同音及同义等多方面变形分析,并自动检索网络新词,识别新兴网络用语,对各类潜在危险信息和变形信息进行有效识别与预警。智能文本语义分析系统通过对神经网络算法的运用,持续性进行违规案例学习训练,不断更新案例资源库,计算机系统在理解越来越多样化的语言表述形式方面的能力也在持续提高,能够对文本信息中的主要思想内容与内在逻辑进行精准分析,从而更加高效精确地对违规信息进行识别。

4 语音识别技术应用实例

首先是信号解调设备,主要由调幅广播解调器、调频广播解调器及有线电视解调器构成。对检测信号源中的特定频率调幅或调频广播信号进行解调,使其转变为普通音频的信号,并传输到信号收集站中进行音频录音。其次是信号预处理设备,为进一步提高信号判断水平,采用信号预处理设备分析音频信号,基于分析结果,利用信号处理器进行音频信号的失真修正、噪声消除等处理,使其成为可用于后续环节的信号源文件。再次是多路信号收集站。针对特定频道传输而来的视频信号,有线电视解调器能够将其中的伴音和视频解调为模拟音频与视频信号,然后将其传输到信号收集站中进行统一记录。一方面,根据检测频道的具体数量,可以灵活调整有线电视解调器的数量,另一方面,信号收集站可以同时进行广播音频和电视信号的接收,并对信号进行搜集、压缩和储存。信号搜集站主要分为电视信号搜集站和广播信号搜集站两种。以广播信号搜集站为例,可以同时采录多路广播信号,各路信号音量光柱也可以实时呈现在采录页面上,工作人员还可以根据各路信号的具体情况,使用软调音台对信号大小进行控制。广播信号搜集站中装有监听按钮,可以对各路输入信号进行实时监控。广播信号收集站能够对获取的广播音频信号进行实时压缩和实时监听,一旦出现信号异常问题,系统就会自动报警,避免发生录音内容丢失等问题。最后是视频信号采集站。电视信号收集站可以采录8路电视内容信号,而视频信号采集站可以实时复合电视节目音频信号码流,使用动态图像压缩算法国际标准压缩格式进行采录。根据不同频道节目的播出时间,可以独立设计其采录的时间。

5 结语

语音识别技术在各行业中的应用范围日益扩大,且识别准确性也显著提高,随着广播电视监管行业要求日益严格,内容监管中语音识别技术的应用有利于节目搜索速度的大大提升,减轻相关人员工作压力。在不断深入有效应用语音识别技术的过程中,要加强校正工作,避免出现偏差问题,从而令广播电视监控监测工作切实发挥预期作用。

猜你喜欢
音频电视节目语音
魔力语音
基于MATLAB的语音信号处理
基于MQ3与MP3的价廉物美的酒驾语音提醒器
必须了解的音频基础知识 家庭影院入门攻略:音频认证与推荐标准篇
对方正在输入……
基于Daubechies(dbN)的飞行器音频特征提取
音频分析仪中低失真音频信号的发生方法
周五广播电视
周三广播电视
电视节目