多通路空间声的前方四扬声器局域Ambisonics信号馈给法∗

2024-02-29 10:58谢菠荪
应用声学 2024年1期
关键词:仰角局域扬声器

张 驰 谢菠荪

(华南理工大学物理与光电学院 声学研究所 广州 510641)

0 引言

为了适应高质量视频、声频重放的要求,目前家用多通声正在从水平环绕声向空间环绕声发展,由面向通路的系统结构向面向目标的系统结构发展。空间环绕声增加了垂直方向的声音信息,改善了空间感知效果。而面向目标的系统结构相当灵活,可采用多种不同的扬声器布置和信号馈给进行重放,适应于不同的实际应用。国际标准化委员会和国际电工委员会(ISO/IEC)已经制定了面向目标的空间声标准MPEG-H3D[1],推荐了一些参考的扬声器布置,如9.1 通路、11.1 通路、22.2 通路布置,也推荐了一些信号馈给法,如基于振幅矢量的信号馈给法(Vector base amplitude panning,VBAP)、全局Ambisonics馈给法等。

多通路声的重放声场和感知效果是由扬声器布置与信号馈给所决定的(对非消声室的重放环境,还和听音室(重放房间)的声学特性有关,但本文略去这问题)。因而多通路空间环绕声的扬声器布置和信号馈给的设计取决于期望的重放声场和听觉感知效果。目前的多通路空间环绕声主要是用于伴随视频的重放,并且听觉的空间分辨率也是非均匀的。因而大多数多通路空间环绕声(包括国际标准的推荐)都采用了前方相对密集,侧向、后方和上方相对稀疏的扬声器布置。特别是多通路空间环绕声的重要目标之一是产生与视频配合的前方水平与垂直方向的听觉定位效果,因而大多数的扬声器布置(如9.1 通路布置)包括了水平面(或略低于水平面)的左前、右前,以及高仰角的左前上、右前上的扬声器[2],该4个扬声器布置在投影幕的周边。

为了在投影幕范围内产生不同的水平和垂直方向的虚拟源,可以利用上述4 个扬声器设计各种的信号馈给法。分立-对是最简单的信号馈给法[3]。它将信号馈给一对相邻的扬声器,通过改变两扬声器信号的相对幅度(通路声级差)而产生扬声器之间的虚拟源,但不能产生4 个扬声器所包围的中间区域的虚拟源。VBAP 是分立-信号馈给法的推广[4]。它是根据目标虚拟源的方向,在4 个扬声器中选用其中的3 个组成包围目标方向的球面三角形,并采用矢量合成的法则得到扬声器信号的振幅。VBAP 信号馈给相对简单,但不能同时精确产生合成定位所需的双耳时间差(Interaural time difference,ITD)及其随头部转动的动态变化因素[3]。只有在扬声器之间的张角较小的情况下,VBAP 才能近似产生适当的合成定位因素,在扬声器布置的范围内得到较好的定位效果。

全局Ambisonics 是另一种常用的信号馈给法[5-6]。它采用声场空间谐波展开的方法(在三维空间就是球谐函数展开),逐阶逼近目标重放声场。全局Ambisonics 的优点是可以根据需要,灵活地选取合适的重放阶数与扬声器数量,其重放效果和复杂性都随阶数而增加。根据Shannon-Nyquest空间采样理论[3],空间全局L阶的Ambisonics需要(L+1)2个独立信号通路,以及M≥(L+1)2个扬声器重放。全局Ambisonics 对空间不同方向的声音信号按等同的精度处理,因而更适合于空间均匀的扬声器布置。当应用于空间非均匀的扬声器布置时,很容易引起信号馈给的稳定性问题。

最近研究也提出了一种局域Ambisonics 的信号馈给法[7],它也是采用声场空间谐波展开的方法,但只将信号馈给目标虚拟源方向附近空间区域的扬声器而不是所有扬声器重放。例如,利用布置在前方中垂面的3 个扬声器和局域Ambisonics 的信号馈给法即可产生扬声器之间的虚拟源。

当然,也可以采用头相关传输函数(Head related transfer function,HRTF)和虚拟听觉传输信号处理的方法,利用上述4 个扬声器布置产生前空间范围的虚拟源[8]。但受其物理原理的限制,这种方法的听音区域较窄,主要适用于多媒体计算机的声音重放。

由于在相关的标准中,空间环绕声的信号馈给是灵活和开放的。本文将研究一种利用上述前方四扬声器产生投影幕范围内水平和垂直虚拟源的局域Ambisonics信号馈给方法,以改善伴随视频的多通路空间环绕声的重放效果。

1 四扬声器局域Ambisonics信号馈给

本文采用以头中心为坐标原点的逆时针坐标系统。空间中的任意一点可用(r,θ,ϕ) 表示,其中,0 ≤r<+∞表示到原点(头中心)的距离;-180◦<θ≤180◦和-90◦≤ϕ≤90◦分别表示方位角和仰角。ϕ为-90◦、0◦、90◦分别表示正下方、水平面和正上方;在水平面θ为-90◦、0◦、90◦、180◦分别表示右方、前方、左方和后方。

如图1 所示,4 个扬声器布置在以头中心为原点、半径为r0的球面上,其位置为水平面左前方和右前方,高仰角的左前上方和右前上方4个方向。其中水平面左前方和右前方扬声器的方位角和仰角分别为

左前上和右前上方扬声器的方位角和仰角分别为

Ambisonics 是一种典型的多通路声信号馈给法[3,5-6],它通过对重放声场和目标声场进行球谐函数展开,在一定的阶数内相匹配,即可得出各扬声器的馈给信号值。传统的全局Ambisonics需要将信号馈给所有扬声器,主要适用于全空间均匀扬声器布置的情况。对全空间非均匀扬声器布置的情况,全局Ambisonics信号馈给容易出现稳定性问题。而局域Ambisonics 只是将信号馈给空间的部分扬声器,如图1的4个扬声器,避免了稳定性问题。

对位于空间方向ΩS=(θS,ϕS)、距离r=rS的目标点声源,当rS位于远场距离时,坐标原点附近的声压可近似为入射平面波。把平面波的振幅归一化为单位值,并适当选择平面波的初相位,在头部尺度大小的区域内,任意场点(r,Ω)=(r,θ,ϕ)的自由场频域声压为

其中,f是频率,k是波数,∆Ω=ΩS-Ω是声源与场点之间的方向夹角。式(3)可用实值球谐函数展开为

其中,jl(kr)是l阶球贝塞尔函数,(Ω)是l阶m度归一化实值球谐函数:

对于图1 的扬声器布置,在头部尺度大小的区域内,任意场点(r,Ω)=(r,θ,ϕ)的声压为4 个扬声器所产生的频域声压的叠加。当扬声器位于远场距离时,可对扬声器产生的声压作平面波近似,得到

其中,∆Ωi=Ωi-Ω是第i个扬声器与场点之间方向的夹角,Ωi是第i个扬声器的方向,Ai是第i个扬声器的信号振幅。将式(4)同样按照实值球谐函数展开可得:

令局域Ambisonics 重放在头部尺度大小的区域内产生的声场与目标声场相匹配,即式(8)与式(4)相等,并截断到一阶球谐函数的展开式,可得到4个扬声器信号振幅满足以下方程:

将式(1)、式(2)给出的扬声器方向和式(5)代入式(9)后,得到4个扬声器的信号振幅所满足的线性(矩阵)方程:

Y不是满秩矩阵,所以独立线性方程的数目少于未知数的数目,方程存在无限多组精确解。取其中的伪逆解:

因而得到4个扬声器的信号振幅为

式(13)的信号振幅满足公式(9)中第一式给出的幅度归一化关系,即所有4 个信号的振幅之和为单位值,与目标虚拟源的方向无关。由于重放中感知虚拟源的方向是由各扬声器信号的相对振幅决定,将式(13)的4 个信号振幅同时乘以一个公共因子Atotal不会改变重放感知虚拟源的方向。因而4 个扬声器的信号振幅也可以取为

这时4个扬声器信号的功率之和等于单位值:

式(13)和式(14)分别是四扬声器重放时采用恒定振幅归一化和恒定功率归一化的一阶局域Ambisonics信号馈给法。

图2为根据式(13)给出的目标声源方向在水平面ϕS=0◦和ϕS=30◦的信号馈给曲线。由图2 可以看出,4 个信号并不同相,总存在1∼2 个反相信号,这与全局Ambisonics信号的基本特征一致。

图2 不同仰角下局域Ambisonics 的四扬声器信号幅度Fig.2 The local Ambisonics mixing functions at different elevation plane of four loudspeakers

值得注意的是,由于局域Ambisonics方法求解信号的过程中使用了伪逆矩阵的方法,按照数值分析原理,可以用条件数表示伪逆计算对于误差的敏感程度。通过计算矩阵Y的条件数,Cond[Y]=∞,且对伪逆解的误差进行分析可以发现,随着目标声源的方向逐渐偏离正前方,伪逆解的误差逐渐变大。故使用该方法,并不能在全空间产生准确的虚拟源,而只能在前方的四扬声器布置内和周围的局域空间内产生较为准确的虚拟源。这一点在第4 节的实验中也可以充分看出,随着重放区域偏离扬声器布置区域,重放的效果是逐渐变差的。

另外,对L阶Ambisonics,系统能够准确重构目标声场的上限频率fmax和重构区域半径rmax之间满足如下关系[3]:

其中,c=340 m/s为声速。当取重构区域半径rmax相当于平均头部半径,即rmax=0.0875 m,由此可以得到一阶局域Ambisonics 信号馈给重构声场的上限频率约为0.6 kHz,这与普通的两通路立体声的情况(0.6∼0.7 kHz)相当。

2 虚拟源定位分析

为了评估上述信号馈给法的效果,需要对重放产生的定位因素进行分析。听觉方向定位是多种因素综合作用的结果[9],其中低频(1.5 kHz 以下)的ITD、高频(大约4 kHz 以上)的双耳声级差(Interaural level difference,ILD)是侧向定位的主要因素;动态因素(头部转动引起的双耳声压的改变,特别是低频ITD 的改变)和耳廓散射产生的高频(5∼6 kHz 以上)谱因素提供了声源前后和垂直定位的信息。但是由于这里涉及的四扬声器布置和一阶局域Ambisonics 信号馈给并不能在高频的范围内精确重构目标声场,因而也不能精确重构高频的听觉方向定位信息。但由于不同听觉定位因素所提供的信息是有冗余的[3,10-11],低频ITD 及其随头部转动的变化对侧向及垂直定位起主导作用,准确重构低频双耳声压及定位因素将可得到一定的虚拟源定位效果。普通的立体声和多通路声就是基于这心理声学原理而设计的。因而这里主要对重放产生低频ITD及其动态变化进行分析。

2.1 基于简化头部模型的分析

在低频的情况下,可以略去头部的散射和阴影作用,将双耳简化成自由空间内相距2a的两个点。对方向为(θS,ϕS)的远场声源,可以计算出ITD 及其随头部转动的变化率作为(θS,ϕS)的函数。对于多扬声器重放,假设M个扬声器布置在环绕倾听者的远场球面上,令第i个扬声器的方向为(θi,ϕi),其信号振幅为Ai。则合成虚拟源的感知方向(θI,ϕI)可通过对比M扬声器重放与单声源产生的ITD 和及其动态变化得出[12]。

通过对比ITD可得

通过对比头部绕上下轴转动引起的ITD 变化可得

通过对比头部绕前后轴转动引起的ITD 变化可得

将式(1)、式(2)和式(13)代入式(17)∼式(19),可以得到式(17)∼式(19)产生自洽的结果,即感知虚拟源方向为

因而四扬声器布置与一阶局域Ambisonics 信号馈给产生的虚拟源方向与目标方向一致。当然,这里简化模型的分析结果只在f<0.7 kHz 的低频才是有效的。如前所述,局域Ambisonics 信号馈给中有部分扬声器信号是反相的(图2)。正是由于该部分的反相信号,使得式(17)∼式(19)产生自洽的结果,从而产生较为理想的虚拟源定位效果[3]。相反,在传统的VBAP 信号馈给中各扬声器信号都是同相的,式(17)∼式(19)不能产生自洽的结果[3-4]。

同时,式(20)也表明,该信号馈给不但可以产生扬声器布置区域之内的虚拟源,同时可以产生扬声器布置区域之外以外(如30◦<θS<90◦,30◦<ϕS<90◦)的虚拟源,也就是说,可以产生前半球面空间的虚拟源。但下面的分析将看到,实际情况并不一定如此。

2.2 基于HRTF的分析

更精确的分析应该考虑头部阴影的作用,也就是采用HRTF 模型进行分析。对于方向为(θS,ϕS)的远场声源,双耳频域声压可由式(21)计算:

其中,Hα(θS,ϕS,f)代表远场声源的HRTF,下标α=L、α=R分别表示左和右耳;f代表频率;P0代表头移开后在原头中心处的自由场频域声压。

对于局域Ambisonics 重放,双耳声压是4 个扬声器产生声压的线性叠加:

其中,Hα(θi,ϕi,f)代表第i个扬声器到左或右耳的HRTF,Ai为式(13)求出的扬声器信号振幅。

通过求得的双耳声压,就可以计算出ITD。有多种不同的ITD定义及计算方法[13]。在低频下,双耳声压相延时差是声源方向定位的一个主要因素。但利用HRTF 计算出的双耳声压相延时差是和频率有关的,计算和分析相对复杂。所以这里采用基于双耳声压互相关法定义的ITD来分析,该方法计算得到的是一定频带范围的“平均”ITD,它与频率无关。在频域,双耳声压的归一化互相关系数为

ITD 定义为ΨLR(τ)最大值对应的τ:

由于ITD 是低频定位因素,故式(23)对频率的积分上限为1.5 kHz。与2.1 节类似,为了分析动态定位因素,还需要利用HRTF 计算出头部转动后双耳声压及ITD的变化,具体方法和步骤如下:

(1) 给定的目标声源方向(θS,ϕS),通过式(21)和式(22)分别计算出单声源和局域Ambisonics 重放产生的双耳声压;然后分别计算出两者的ITD并进行对比分析。

(2) 头部绕垂直或前后轴旋转一个小角度∆θ或∆γ后,分别计算出目标声源和所有扬声器相对头部的新方向,利用式(21)和式(22)分别重新计算出新的双耳声压,进一步计算出新的ITD。与头部转动前的ITD 比较得到ITD 的差值∆ITD,即动态定位因素。再将目标声源和重放产生的∆ITD进行对比,则可以判断重放虚拟源方向与目标声源的方向是否一致。

上述分析中,所使用的HRTF 是通过边界元方法计算得到的无躯干但包含耳廓的KEMAR 人工头(DB-060/061)的远场HRTF[14]。HRTF 的频率分辨率为50 Hz,角度分辨率为1◦。

图3 给出了ITD 随目标声源方位角变化的规律。图3(a)和图3(b)分别为ϕS=0◦水平面和ϕS=30◦仰角面情况。从图中可以看出,水平面和ϕS=30◦仰角面的情况是类似的。在-30◦∼30◦方位角的范围内,局域Ambisonics重放的ITD与实际声源的情况是一致的;在此范围之外,随着方位角的增加,局域Ambisonics重放的ITD与实际声源情况的差异逐渐增大。这说明在扬声器布置的方位角范围内,局域Ambisonics重放可以得到准确的方位角定位效果;而在扬声器布置方位角范围之外,感知方位角会向扬声器的方向(±30◦)漂移。

图3 中心倾听位置的ITD 随方位角的变化规律Fig.3 The ITD for the actual source and local Ambisonics with four loudspeakers arranged at different elevation plane

为了分析头部转动引起的动态因素,图4给出了头部绕上下轴顺时针转动一个小角度(∆θ=10◦)后,在中垂面和θS=30◦垂直面,局域Ambisonics 重放和目标声源产生的∆ITD 随仰角的变化规律。图5 给出了头部绕前后轴顺时针转动一个小角度(∆γ=10◦)后,在θS=0◦中垂面和θS=30◦垂直面,局域Ambisonics 重放和实际声源产生的∆ITD 随仰角的变化规律。可以看出,局域Ambisonics 重放虚和目标声源产生的∆ITD 随仰角变化的趋势是一致的,但定量变化上有所差异。随着仰角的升高,对于头部绕上下轴转动,局域Ambisonics 重放和实际声源的∆ITD 的差异基本不变或略有减少;而对于头部绕前后轴转动,局域Ambisonics 重放和实际声源的∆ITD 的差异逐渐增大;且在不同的垂直面下有着相同的变化趋势。

图4 头部绕上下轴转动∆θ=10◦后ITD 的变化Fig.4 The ∆ITD after head rotation ∆θ=10◦for the actual source and local Ambisonics panning with four loudspeakers arranged

图5 头部绕前后轴转动∆γ=10◦导致的ITD 变化Fig.5 The ∆ITD after head tilting ∆γ=10◦for the actual source and local Ambisonics panning with four loudspeakers arranged

总体上,在四扬声器布置的范围之内,局域Ambisonics 信号馈给可以产生定量上和目标虚拟源一致的ITD;同时也能产生定性上和目标虚拟源一致的随头部转动的动态ITD变化趋势。但本节分析的结果和上面3.1 小节的分析结果有所不同。首先,四扬声器重放和局域Ambisonics信号馈给只能在0.6 kHz 以下的频率范围准确重构双耳声压,需要利用心理声学原理产生虚拟源。其次,3.1 小节分析是基于简化的头部模型,只适用于0.7 kHz 以下的低频近似。本小节采用HRTF 模型进行分析,并且将ITD 及其动态变化的分析拓展到它们对定位起主要作用的频率范围(1.5 kHz 以下)。并且系统产生不同方向虚拟源的能力还同控制双耳声压的代价有关[15]。因而最终的结果应该由实验验证。

3 心理声学实验验证

3.1 实验设计

为了验证局域Ambisonics 信号馈给的实际定位性能,进行了虚拟源定位心理声学实验。实验是在听音室(重放房间)内进行。听音室的混响时间为0.15 s,本底噪声不大于30 dB(A)。基于本实验室搭建的多通路空间声重放系统平台,按照第2 节的方法,扬声器布置在半径为1.45 m 的球面上,其方向由式(1)和式(2)给出。实验系统的照片如图6所示。

图6 扬声器布置Fig.6 Arrangement of loudspeakers

目标声源方向分布在6 个仰角(纬度面),即ϕS分别为0◦、15◦、30◦、45◦、60◦、90◦,每个仰角(ϕS=90◦除外)包括11 个方位角的方向,即θS分别为0◦、±15◦、±30◦、±45◦、±60◦、±90◦。因此共有56 个空间方向,分布在前上半球面空间,包括扬声器布置之内和之外的区域。实验中选取了3 种信号,分别是全频带粉噪声、1.5 kHz低通滤波粉红噪声和管弦乐信号(选自J.Strauss 的蓝色多瑙河)。每一段信号的时长为10 s,头中心位置的重放声压级约为75 dB(A)。

实验开始前,调整座椅高度,确保受试者的头中心与扬声器所在弧面的球心重合,并且面向正前方。在固定扬声器的支架上,水平方向与垂直方向每隔5◦都标有标示,以方便受试者进行方向的读数。在实验时,受试者每进行一次方向判断,都会有专门的记录员对数据进行记录。

由于实验设计的目标声源的方向较多、信号较长,为了避免单组实验时长过长而导致定位的误差较大,在实验中,受试者对每个方向的虚拟源只进行单次判断。同时为了保证实验结果的可靠性与实验条件的一致性,需在每组实验中选取10个方向增加额外的两次判断(因而这10个方向共有3 次重复判断)。只有受试者对这10 个方向的虚拟源的感知具有良好的重复性,该次实验才会判断结果有效。每名受试者将进行56+2×10=76 次虚拟源方向的判断。这76 个信号将会随机顺序播放给受试者进行判断。

共有8名受试者(5 男3 女)参加实验,他们均为声学专业研究生,双耳听力正常,且有一定的心理声学实验经验。在正式的实验开始前,将会对每个受试者进行训练。受试者可以重复倾听某方向的信号,直至有明确的方向判断为止。每个受试者的实验分为3 组,在3 天内完成,每一组实验选取不同的信号用于虚拟源方向的判断。

3.2 实验数据的统计方法

由于实验数据为三维方向数据,故将用平均无符号方向偏差来反映感知方向的偏差情况。平均无符号方向偏差表示的是感知方向与目标方向在空间上的平均偏差,其计算公式为

其中,N为某种条件下所有受试者的总定位判断次数,dS和dI(n)分别是目标虚拟源方向和第n个实际感知判断方向,“·”表示矢量的内积。

由于受试者的感知方向是三维球型数据,故为了进一步分析数据的离散特性,将对8 名受试者的数据做Kent 分布和Fisher 分布检验。Kent 分布和Fisher分布是两种球型数据的分布。当数据服从Kent 分布时,表现为受试者对某目标声源方向的感知值在仰角和方位角上的方差没有明显差异;当数据服从Fisher 分布时,表现为受试者对某目标声源方向的感知值在仰角或方位角上的方差更大[16]。为了更好地展示出不同方向数据的分布,这里用Leong等[16]提出的球型数据图示法来展示。

3.3 实验结果与分析

在分析实验数据之前,首先要对所有受试者数据的重复性进行检验。将8名受试者,10个方向的3次重复数据的平均无符号偏差,与单次的实验结果进行Wilcoxon符号秩检验。经检验,在显著性水平α=0.05的情况下,两者并无明显差异,说明受试者的感知方向重复性较好。

图7 给出的是3 种信号的感知方向的角度统计结果分布图。由于目标方向较多,且ϕS=60◦的高仰角数据方差较大,为了使图像清晰易懂,左列画出的是目标方向满足|θS| ≤45◦且|ϕS| ≤45◦的分布图,右列画出的是目标方向满足|θS| >45◦的分布图。从图7中可以看出:

图7 局域Ambisonics 对3 种不同信号的定位统计结果Fig.7 Statistics for three different signals for local Ambisonics

(1) 当目标声源的仰角和方位角均小于45◦时,定位的效果较好,感知方向与目标方向的误差较小;当方位角或仰角大于45◦时,定位误差较大,且感知方向不再随着目标方向而变化。从数据中可以看出,受试者能感知到的最大方位角θI在±50◦附近,能感知到的最大仰角在45◦附近。这和3.2 节采用HRTF分析的结果是一致的。

(2) 受试者对低通信号的定位精度较差,而另外两种信号的定位精度相差不大。具体表现在受试者对低通信号的仰角定位效果更差,而对音乐信号和全频带粉噪声在方位角和仰角上的定位效果相近。这可能是信号带宽的原因,由于1.5 kHz低通信号只包含低频定位因素,所以即使是实际声源,其定位精度也较差。

(3) 在扬声器布置区域范围内,对大多数虚拟源方位角和仰角的定位方差没有明显差别,而在扬声器布置范围外,对仰角的定位方差大于对方位角的定位方差,即受试者对仰角的定位效果要劣于方位角的定位效果。一方面是由于听觉对垂直方向的分辨率低于水平方向的分辨率,另一方面,也说明了局域Ambisonics 重放时对于垂直方向的重放效果劣于水平方向的重放效果。

(4) 在扬声器布置的范围外,由第3 节基于HRTF 模型的分析中可以看出,当方位角大于30◦时,ITD 随着方位角的增大逐渐趋于一个稳定值;而当仰角大于30◦时,头部绕垂直轴转动引起的∆ITD随仰角的变化率没有明显变化。这种情况下,感知虚拟源最多只能到略超出扬声器布置的范围,且总体的方差较大。

图8 为不同仰角下,感知方位角和式(25)定义的方向偏差随目标声源方位角的变化规律。从图8中可以看出,在不同的维度面,方向偏差随方位角的变化趋势是一致的,感知误差会随着方位角的变大而变大。而且,随着仰角的增大,感知误差也会逐渐变大。当目标方位角或目标仰角较大(大于45◦)时,方向误差快速增大,定位效果大幅下降。其中,当方位角为±90◦时,甚至会出现误差过大从而使受试者感觉无法定位的现象。故局域Ambisonics方法重放虚拟源,仅能够在扬声器布置范围内和略超出扬声器布置范围产生虚拟源。但这已经能满足伴随图像重放的实际要求了。

图8 3 种信号不同仰角面的方向偏差和感知方位角Fig.8 Directional deviation and perceived azimuth of different elevation planes for three different signals

3.4 讨论

在上面的实验中,低通信号定位的效果不如其他两种宽频带信号。事实上,对真实单声源,头部转动引起的低频动态因素(ITD)和耳廓等生理结构引起的高频谱因素是垂直定位的两个因素。一方面,两个因素的协同作用能增强垂直定位;另一方面,两个因素提供的信息有一定的冗余,当其中一个因素缺失时,只靠另一个因素也能在一定程度上进行垂直定位[10],这是多通路声产生垂直定位的心理声学基础。

对本文涉及的空间声重放,信号处理设计产生了期望的低频动态定位因素。但由于重放实验是在有一定反射的听音室内进行(这是ITU 标准的规定[17],为了模拟实际家用重放的情况),听音室的低频反射对重放产生低频动态定位因素多少是有一定影响的。对重放低通滤波信号,双耳声压只包含(受到反射影响)低频动态定位因素。而对于重放宽频带信号,双耳声压同时包含低频动态定位因素和高频谱因素带来的信息。虽然重放所产生的高频谱信息并不能和目标声源的情况一致。但由于实验是采用布置在水平左前、右前、30◦仰角左前上、右前上4个扬声器重放的,扬声器之间的垂直仰角与目标仰角差异不大。因此扬声器本身提供了一种粗略的目标垂直定位谱信息(至少排除了虚拟源在正上方或后方的错误谱信息),它与低频动态定位因素协同作用的结果,将在一定程度上改善宽带信号的合成垂直定位。

将本文的局域Ambisonics 信号馈给与现有的信号馈给方法对比是有益的。理论和实验结果[18]表明,现有的全局Ambisonics信号馈给能同时精确产生合成定位所需的ITD 及其随头部转动的动态变化因素,因而能产生全空间(包括前方垂直方向)的定位效果。但全局Ambisonics信号馈给需要全空间相对均匀的扬声器布置,和伴随视频重放的扬声器布置并不匹配。

如前面引言部分所述,在扬声器布置之间的张角比较大的情况下,现有的VBAP 信号馈给不能同时精确产生ITD 及其随头部转动的动态变化因素,其重放虚拟源定位应该是有不足的,且存在对头部转动的稳定性问题。过去已有不少实验对VBAP 的垂直定位特性进行了实验的研究,Wendt等[19]讨论了在不同扬声器布置下使用VBAP信号馈给法,发现重放时改变目标仰角,感知到的方位角也会产生偏移;Baumgartner等[20]讨论了在与本文相同的扬声器布置下,使用VBAP 信号馈给重放前方声源,发现低仰角时重放的感知精度较高,与局域Ambisonics重放的感知精度类似,高仰角时感知精度大幅下降,劣于局域Ambisonics重放的感知精度。

为了对比局域Ambisonics 信号馈给法与VBAP 信号馈给法的重放效果,补充了VBAP 信号馈给法的实验。在上述相同的听音室内,使用相同的式(1)、式(2)扬声器布置,选取全频带粉红噪声信号进行定位实验。定位实验的条件、受试者、统计方法同前。目标声源方向选择为扬声器布置范围内的15 个方向,即5 个方位角θS分别为0◦、±15◦、±30◦,每个方位角上3 个仰角ϕS分别为0◦、15◦、30◦。因为理论和实验结果都表明,VBAP 主要产生仰角方向的失真,为简单起见,这里只给出仰角定位的结果。图9 对比了不同方位角下的局域Ambisonic和VBAP的平均感知仰角和标准差随目标声源仰角的变化规律。从图9中可以看出,使用局域Ambisonics 重放方法和VBAP 重放方法的定位效果是类似的,与相同目标方向的局域Ambisonics相比较,仅在扬声器布置方向上VBAP 重放方法明显优于局域Ambisonics 重放方法(对实验结果进行方差分析可证明这点)。这是由于参考ITU 建议[2],实验选取的4 个扬声器布置的张角不大,VBAP 的误差不算特别明显,且听觉对垂直方向定位的分辨率较低,故在扬声器布置范围内,VBAP 导致的仰角误差在听觉上不一定能分辨出。而目标声源方向与重放扬声器方向重合时,VBAP 仅由该方向的单一扬声器发声,故定位效果较好。但依据VBAP 的理论[3],只有重放虚拟源方向在选取的3 个扬声器范围内才能计算出扬声器信号的解,故使用VBAP只能产生重放扬声器布置范围内的虚拟源。而本文所用的局域Ambisonics 重放方法可以在方位角和仰角上均略超出扬声器布置方向下重放准确的虚拟源,由此可见,在局域Ambisonics 方法的垂直虚拟源效果是不劣于甚至略优于现有的VBAP 方法。并且现有的空间声标准中[1],原始信号有可能是以空间谐波(Ambisonics)的形式给出的,因而只有采用全局或局域Ambisonics的信号馈给,而全局Ambisonics 信号馈给是不大适合非均匀的扬声器布置的。这种情况下局域Ambisonics信号馈给应该是一种选择。

图9 两种重放方法不同垂直面的方向偏差和感知仰角Fig.9 Directional deviation and perceived azimuth of different elevation planes for two different methods

本文的扬声器布置是选取的国际标准给出的9.1 通路的参考扬声器布置的前方4 个扬声器,这是出于对定位稳定性及其他性能的综合考虑。但在实际应用中,扬声器的布置相对灵活,不同的扬声器布置和不同的信号馈给对头部平移的稳定性会产生不同的影响,如何根据听觉感知和实际需要适当设计扬声器布置与信号馈给是一个非常有意义且值得进一步研究的问题。此外,实际应用中使用的扬声器的指向性也会影响听觉方向定位,并且会影响重放音色,如何利用扬声器指向性的实现局域目标声场控制也是一个值得进一步研究的问题。

4 结论

一些典型的多通路空间环绕声(如9.1 通路声)包括了前方了水平面(或略低于水平面)的左前、右前,以及高仰角的左前上、右前上的扬声器布置。利用这4 个扬声器布置,一阶局域Ambisonics 信号馈给方法可以产生合适的低频ITD 及其随头部转动的动态变化,从而在扬声器布置的范围内,甚至在略超出扬声器布置的范围内产生不同方位角和仰角的虚拟源。因而本文的方法可作为空间环绕声重放的一种可选择信号馈给法。

猜你喜欢
仰角局域扬声器
薄如纸张的扬声器
Focal&Naim同框发布1000系列嵌入式扬声器及全新Uniti Atmos流媒体一体机
用锐角三角函数解决仰角、俯角问题
大地震 正式发布Cinenova系列扬声器
局域积分散列最近邻查找算法
自制手机扬声器
分段三次Hermite插值计算GNSS系统卫星仰角
PET成像的高分辨率快速局域重建算法的建立
基于局域波法和LSSVM的短期负荷预测
基于非正交变换的局域波束空时自适应处理