论人工智能在影视配音艺术中的应用、影响与启示

2024-04-26 03:42刘铮

齐齐哈尔大学学报（哲学社会科学版） 2024年2期

刘铮

(沈阳音乐学院戏剧影视学院,辽宁沈阳 110818)

人工智能配音是指以大数据处理与学习、虚拟合成与化身、人机交互等人工智能技术为动力,负责广播、电视、电子出版物和互联网上的同步和广播任务的智能媒体产品。“人工智能同步”的概念实际上包括不同历史时期的不同形式,这不仅符合当前智能媒体的基本特征,也反映了最新的“综合”特征。人工智能同步的概念起源于英国,最早应用于中国、韩国、日本、美国等国家。自2018年以来,人工智能配音在全球同步加速了研发和推广。人工智能同步的现阶段以人工智能合成语音为代表,但与高级人工智能的目标仍有不小差距。本文从人工智能配音发展现状的梳理出发,阐述了人工智能配音的实际应用场景,对比人工智能配音相比传统真人配音的优劣,分析人工智能配音对影视配音行业的影响,重点落脚在于人工智能配音时代配音人员应如何保持自身独特优势。

一、人工智能配音概述

(一)人工智能的起源与进步

现代科学技术发展催生出了人工智能,人工智能从上世纪5、60年代就已经存在了,而且随着科学技术的不断进步,人工智能技术得到越来越多的完善,将在当今和未来人类社会的发展中发挥不可估量的作用。人工智能对未来的改变,是对我们一点一滴形成知识过程本身的自动化,是让我们用这个机器取代人力过程本身的自动化。AI革命,我们可以称之为机器学习和发现的过程,打破了人类大脑的专利。

(二)人工智能配音的发展现状

人工智能配音最早可以查到的资料是到虚拟主持人时代,其应用最初旨在取代人类播报的部分工作。虚拟主持人在英国最早起源,20世纪初在中国、日本、美国和其他国家处于领先地位。世界上第一个虚拟演讲者是“Ananova”,2000年由媒体公司英国新闻协会在互联网上首次推出。继Ananova之后,中、美、日、韩等国家相继推出了虚拟主持人,之后世界各地的主要媒体纷纷效仿。

2018年,《创新中国》上映,这是世界上第一部完全由人工智能重新进行配音同步的纪录片,播出后立即引发了热烈反响。CCTV和科大讯飞对已故的配音大师李易的声音进行了采样和分析,通过人工智能大数据学习恢复了李易的声音,并在整个纪录片中同步使用人工智能配音,成为智能配音的一个重要里程碑。最近的几年来,随着抖音、快手、Bilibili等自媒体平台发展的迅速性,越来越多的人们把人工智能用来为自己的视频创作去配音。比如说,在软件中输入一段文字,人工智能会自动生成声音,制作者可以选择不同种类的声音,比如蜡笔小新、说唱、甜美等等,甚至还有方言配音,如四川方言、东北方言、山西方言等等。人工智能的配音在人们的日常生活中越来越普遍,并正在成为创造者的强大工具。

二、人工智能配音的实际应用

(一)实际应用场景

在2018年和2020年,搜狗公司推出了两款不同型号的“人工智能合成主播”,代号为“新小浩”和“新小微”。人工智能主播“新小浩”以二维虚拟图像面对观众,其播放状态几乎与原型新华社主播邱昊相同。2020年5月发布的人工智能主播“新小微”的首个3D版本以新的三维动态图像的形式出现。与上一代“新小浩”相比,改进之处在于从2D到3D、从平面到空间的转换。最新版本的“人工智能合成主播”弥补了人类皮肤、身体运动和辅助习惯的缺陷。通过深度学习功能,人工智能合成的主持人能够理解语义,实现有声语言与副语言的深度结合。然而,当笔者查看所有人工智能合成主播模型时发现了人工智能配音一个最大的缺陷:所有人工智能合成主播的发声都是电子音!可见,人工智能主播完全模拟人声还有很长的路要走。无论是上一代“新小浩”还是最新版本的“新小微”,都会出现观众感觉电子音过强的问题,无形中与观众产生了隔阂。因此,新闻广播中存在着“人机合作”的格局。方法是对新闻条目进行分类。应该反映“人文关怀”和“亲切感”的新闻信息被传送给人类主播播出,而将更为严谨的新闻转移给“人工智能合成主播”进行播送。另外,一些高重复和低情感的广播任务可以应用人工智能配音。人工智能技术的应用可以方便地进行语音播送,主要用于数据量大、形式相对简单的文本信息,例如财经新闻、天气预报、读报等。这些广播不需要太多的技术要求,只要吐字清楚、内容正确即可。而且,人工智能技术的使用将比手动传输更加准确,同时在广播过程中不会受到太多紧急情况的干扰,这可以防止广播过程中出现错误。显然,在转换基本文本信息方面,人工智能配音方便解放人们的工作时间。

在2016年,一些新闻客户端率先使用智能语音播报来提高工作效率,只需轻触旁边的按钮,即可收听详细新闻。这样的媒体客户端可以帮助用户更轻松地播放相关新闻内容,既方便用户使用又提高整体工作效率。用户可以使用这项新技术在尽可能短的时间内就获得他们最想要的新闻。在过去,用户被动地接收新闻节目,但随着当前人工智能配音的普及,用户接收信息的方式也变成了一种主动的状态,可以选择性地收听新媒体信息内容。人工智能新媒体在整个信息接收过程中很好地解决了成本高、效率低的缺点这些问题,为人工智能在广播领域发挥作用奠定了基础。所以,人工智能在新闻广播中的应用不仅可以提高工作效率,而且可以最大限度地降低人工成本。

人工智能还可以尽最大可能恢复已逝去的经典之声。除了降低工程成本和提高工作效率外,人工智能同步产业还可以恢复已逝的高质量声音。2018年初,李易深厚低沉的声音被中央电视台和科大讯飞的人工智能配音技术给还原了。在纪录片《创新中国》中,央视团队和科大讯飞团队就是运用了人工智能配音技术,将经典之声再次呈现观众面前。使用这项技术可以最大限度地降低复制成本,节省配音的周期。同时,相应的公司也可以基于该技术设计其独特的品牌需求。从这一现象可以看出,人工智能在播音主持中的应用在不久的将来将取代一些低端的配音工作。

(二)人工智能配音相比传统真人配音的优劣

1.人工智能配音的优势。与传统的真人配音相比,人工智能配音的优势在于工作十分高效、执行能力强大、风格丰富多彩。一般来说,不同的配音员由于经验、知识和身体状况的不同,需要不同的准备时间,因此稿件的准备时间会有很大差异。与人工智能分类和提取重要信息的速度相比,人类的准备工作无疑效率低下。例如,栏目《看东方》中的人工智能可以根据气象数据分析和预测天气状况,并进行实时天气评估。但是要做到这一点,人类主播不仅需要专业知识,还需要长时间的编辑和准备。根据个人特点和多年的配音经验,配音员往往在工作中形成自己独特的风格。一方面,这种风格可以突出配音者的特点,提升其标志性和综合性的竞争地位;另一方面,由于相对固定的语言风格,它也会使配音者陷入某种局限,给观众一种单一风格的感觉。技术的发展使人工智能能够收集来自不同配音风格的语音素材并进行相应的整合。

2.人工智能配音的劣势。人工智能的本质是向人类学习的机器,它并不具有主观创造性,因此不能发展出自己独特的特性,这点必须由人类赋予。人工智能是基于一行行代码的,始终不能和人类的真情实感相对比,在人工智能配音中缺少了人类的感性,而更多的是理性,并且由于人工智能操作的流水线化,生产出来的声音也变得像流水线产品一样,没有自己的独特之处。人工智能也缺乏同步情感交流和互动,而在广播者和主持人作为传播主体的信息传播过程中,信息事实是基础,情感、情绪和态度是核心。

(三)人工智能配音是否会取代真人配音

人工智能技术虽然以其高效率和低成本的优势得到了普及,但在某种程度上完全取代同步工作的想法还是不切实际,因为尽管人工智能可以模仿人类的声音,但它的声音线条过于理性,没有自己的情感色彩,人工智能配音并不能完全取代真人配音。虽然人工智能的效率非常高,但在配音行业中它只能替代人类的声音,不能替代个人的感情色彩。虽然人工智能在各个方面都表现出“智”的特征,但它却不“能”,人工智能只依赖机器后面的一行行代码,并不是人类的思想和情感。所以,在当前的配音领域不要同人工智能的优势方面去竞争,而要充分利用我们人类特有的优势。配音工作者要充分融入自己的思想和感情开展相应的工作,使受众能感受到来自声音的人文关怀。在当今人工智能迅速普及的时候,做一个热情而深情的配音演员难得可贵。在相关的配音工作中,配音工作者必须推敲整篇稿件的细节,进行从内容到情感演绎,让听众感受到温暖的感官体验,这是当前配音工作者需要培养的核心素养和竞争力。

三、人工智能配音时代配音人员如何保持自身独特优势

(一)感情真切,形成共鸣

人工智能并没有作为人类的生理活动和情感,虽然它可以在很大程度上避免主观错误,但它无法与观众建立情感交流。由于人工智能配音的工作是由硬件条件和软件代码支持的,目前人工智能配音硬件的设计和代码编写还没有达到能够体验和表达人类情感的水平,所以传统人声配音不仅是文字的传递,而且还是我们人类特有的真实情感流露。在2008年汶川地震发生时,全国上下众志成城抗震救灾,中央电视台在24小时直播中,主播赵普在播报地震遇难人数以及现场状况时,难以控制自我情绪哽咽了;云南旱灾,当画面定格在一个5岁的小女孩那渴盼的眼睛时,赵普又哽咽了,这无不令观众动容。这就是人工智能所无法理解的情感,人工智能配音在一行行代码之下,只会通过理性分析对人类输入的数据进行处理,从而形成人类想要其发出的声音,并不具有主观创造性和自我的情感,无法理解除事实之外的丰沛情感。作为配音者,应该发挥我们特有的情感体验,在稿件中融入个人的思想感情,并不是成为单纯的播报机器,配音员的工作才能在未来发挥不可替代性。

(二)表达自然,注重细节

人工智能配音主要基于对优秀视频和语音材料的整理和分析,因此更依赖于真人的声音,自主创新能力较弱,生成的同步产品相对僵化,表现能力较弱,目前并没有得到公众的普遍认可和喜爱。配音员的优势在于创新和丰富的配音形式:他们会变换自己的配音风格,以适应不同场景的同步,用情感与观众交流,而不是局限于一种表达方式。配音员在配音时应调整自己的状态以获得放松自然的声音。当然,用轻松自然的生活化语言说话不应语言含糊不清,还应该强调语言中的关系感,注意语言的规范。因此,自然放松是相对而言的,而不是回到原始的生活状态。这个所谓的松弛当然是基于语言艺术,应该让听众找不到人工雕刻的痕迹,所以对配音员的要求更高。

(三)形成风格,提升水平

从目前人工智能技术的发展水平来看,人工智能配音独立创造的能力还并不完善,主要是模仿人类的配音方式。在更丰富的影视配音方面,呈现出不够灵活的状况,无法应对复杂的配音环境。当前的人工智能配音发展还不成熟,只能给低情感类型的稿件配音,在影视作品中还是更需要真人配音员去用自己的真情实感,形成自身独特的配音风格,将稿件演绎出来。例如,动画片《蓝猫淘气三千问》系列中,蓝猫的配音演员葛平老师,他的标志性台词“大家好,我是超威蓝猫”,已然形成了自己的独特声音标志,在扣到这句台词的时候,大家联想到的是葛平老师而不是动画片中的人物;《舌尖上的中国》中的一句台词也深入人心——“高端的食材,往往只需要采用最朴素的烹饪方式”,配音者李立宏老师也因此被称为“美食纪录片专用配音员”。这些都是通过自身独特的配音风格去给听众留下深刻印象的生动例子。所以,配音工作者必须以正确、积极的态度面对人工智能配音的冲击和挑战,提高政治站位,提升艺术修养,增强专业配音技能,扩大知识储备,逐步形成他人难以模仿的独特风格,确立并巩固自己在受众脑海里的独特印象,保持自身的优势。

总之,在人工智能科技不断发展的道路中,人工智能同步技术在当前配音领域的引入使配音的形式更加丰富多彩。目前,人工智能配音在低质量应用领域的研究正转向高水平应用,从“机器替换”转向“人机协作”,从单调模式转向个性化定制,从机器人式沟通转向情感沟通,从实验室发展到商业化推出等不同阶段的不断发展,将进一步影响传统媒体产业结构和人们的思维。人工智能技术的不断深化已经取代了更多的廉价劳动力。随着合成配音技术的不断完善,人工智能配音未来会取代一些重复性、低情感的播报工作,但不会取代高情感、高交流度的配音作品,因为人工智能始终是人类制造出的机器,不会也不能取代人的主观创造性,配音这门艺术还是必须通过配音者内心的情感去表达和演绎出来。配音者和主持人都应该提升自身素质,不断学习、不断进步,确定自身独特的风格,用情感去表达文字应有的态度,这样才能保持对人工智能配音的优势。