从“无身体”到“类身体”：AI虚拟主播的身体演进

2023-12-17 00:13姚宇航黄勇军

新闻论坛 2023年5期

姚宇航　黄勇军

【内容提要】AI虚拟主播作为人工智能的衍生物，凭借高拟人的语态和神态，受到视听行业的追捧。通过对AI虚拟主播的身体呈现方式进行梳理，发现AI虚拟主播的身体大致经历了三个阶段，即“无身体”“身体化”和“类身体”阶段。本文从这三个阶段出发，探究AI虚拟主播在身体演化的进程中呈现的具身传播逻辑。

【关键词】AI虚拟主播身体传播具身传播人工智能主播

伴随着智媒技术的不断发展，自2018年新华社联合搜狗推出世界第一个全仿真AI虚拟主播后，AI虚拟主播的身体便朝着具身化、拟身化的方向不断演进，当AI虚拟主播呈现出愈发清晰的身体机制后，人机耦合度便因之递进，人类不断将自己的身体上载，作为“他身”存在的拟真身体俨然成为人类具身化的“第三持存”。梅洛-庞蒂认为身体是与世界联结的媒介途径，“拥有一个身体，对一个生物体来说就是介入一个稳定的环境，以便参与某些计划或继续置身其中。”[1]因而不断有学者重回物质空间中的身体，从“具身传播”“身体哲学”角度讨论AI虚拟主播未来的可能。如从“离身”与“具身”角度认为，AI虚拟主播未来的发展道路应该是具身与离身相互融合的高阶交互；[2]或者从“建构与驯化”角度分析AI虚拟主播的技术生成路径，指出“智能体设计”应当作为驯化智能技术、维持人主体性地位的手段。[3]

刘明洋、王鸿坤以身体参与传播活动的完整度为标准，将媒介形态的演变划分为“身体媒介”“无身体媒介”“身体化媒介”及“类身体媒介”四个阶段。[4]“身体媒介”的传播主体是生物学意义上的人，肉体在场是此阶段传播活动的必然要求；“无身体媒介”的传播主体是机器与生物学意义的人，“肉体不在场”的传播在这个阶段成为现实，媒介物作为传播介质进入传播活动之中；“身体化媒介”的传播主体是机器和以“数字身体”形式存在的人，传播者借助“数字身体”形成“虚拟在场”的传播活动，肉体虽依旧隐退，但“数字身体”在传播活动中发挥其作为完整的动态平衡系统的作用；“类身体媒介”的传播主体是机器人与“技术身体”形式存在的人，真正具有智能和自我调节能力的机器人在传播活动中扮演主体角色。依托于此，本文将AI虚拟主播的身体呈现方式划分为三个阶段：即“无身体”阶段、“身体化”阶段以及“类身体”阶段。通过考察不同阶段AI虚拟主播的代表性载体，对AI虚拟主播的身体演进历程及呈现方式进行梳理，获取AI虚拟主播在不同发展阶段的身体理念与哲学反思，以助推AI虚拟主播更好地服务于人类自身，同时对人类未来以“数字身体”参与活动进行展望，以期探讨作为“他身”的拟真身体未来发展之可能。

一、“无身体”：作为“模拟”的身体

21世纪初，英国报业联会媒体公司在互联网推出虚拟主持人“阿娜诺娃”，这被学界广泛认为是AI虚拟主播的源起。作为新闻业的“新玩意儿”，“阿娜诺娃”以人类身体为参照，对人类头部仿真化模拟，尽管现在看来，“阿娜诺娃”在外貌、动作等方面都远远落后于当前的AI虚拟主播，但在當时“阿娜诺娃”不仅被誉为“一个可播报各种内容的虚拟播音员，堪比一个有血有肉的主播”[5]，更是被英国报业联会看作“秘密武器”，以期减缓经济危机对其新闻业务的打击。从技术原理看，“阿娜诺娃”通过数字技术制作并模拟真人影像，利用二进制代码进行数据处理、记录，传递矢量数字文本，从而产生人类身体机制的替代功能。[6]从这一角度出发，虚拟主持人似乎大有替代传统主持人的趋势，尤其是与“阿娜诺娃”类似的虚拟主持人“小龙”已成功主持央视电影频道栏目。但由于当时的数字虚拟技术并未成熟，虚拟主持人表情呆板、声音机械，在音、容、笑、貌等方面均无法与传统主持人媲美，此阶段的AI虚拟主播出现不久，受众便由起初的新鲜感转而因其机械、呆板的内容播报产生无聊之感。以“阿娜诺娃”为代表的虚拟主持人尚不能完美替代传统主持人，只能作为辅助进行传统主持人所不能及的播报行为，虚拟主持人与传统主持人共同成为这一阶段的传播主体，且传统主持人在传播中仍占据较大优势。虚拟主持人能力的不足必须用高昂成本进行维持，AI虚拟主播热潮出现不久便因诸多因素相继搁置，随着“阿娜诺娃”在2004年黯然退场，AI虚拟主播的发展也陷入长达十余年的低潮。

早期人工智能受第一代认知科学的引导，始终强调意识在技术的调节下可脱离身体独立存在。受此影响，初代AI虚拟主播的设计也被用以尝试在传统认知和交流中身体可以保持多大程度的离场。因而“阿娜诺娃”出现时，其背后操纵者便一再强调其对传统主持人的替代性，它从外形到动作均以人类身体为参照进行数字模拟，甚至被设计出比传统主持人更加出色的新闻制作与播报能力，这种对人类身体甚至是意识的技术性延伸，呈现了身体存在的另一种方式，搅动了人类的感官平衡。正如麦克卢汉看到报纸、电视、广播对身体的技术化演进提出著名的“媒介延伸论”，声称媒介改变了人类身体及其感官与环境之间的关系，也逐渐改变了人类感官与世界的关系。[7]而AI虚拟主播的出现推动了人类对自己的“物质身体”进行重新思考，重塑了人类对物质身体的认知，“身体在技术上铭写了人的属性，技术也将其独特的结构和逻辑镌刻在具身性个体的感知、行动上”[8]。“阿娜诺娃”让“物质身体”在赛博空间呈现技术态延伸，尽管模拟得尚显粗糙，但已为后人类主义者对身体的想象提供了现实支撑。后人类主义者不禁发问，意识可以上传吗？思维可以脱离身体存在吗？

断言“阿娜诺娃”可成为身体存在的新路径，似乎有些落入“虚无主义”的窠臼。尽管“阿娜诺娃”某些特点可以改变人类衰老、困倦的肉身缺陷，成为对人类不完美身体的补偿机制，但其作为脱胎于人类身体的媒介便不可避免地拥有了人的属性，并在人类心中形成感知形象的拟人化。由于初级阶段的AI虚拟主播只是基于预先设定的语言指令播报新闻的一道程序，无法与人产生对话和交流，一旦进行更深入的传播活动，“阿娜诺娃”就无法越过程序这道围墙，与对话者进行正常的传播与交流。倘若将“阿娜诺娃”感知为“人”，前后强烈的效果反差难免会使人类陷入“恐怖谷”之中。在此种效应之下，人类自我保护的本能反应不断提高，“阿娜诺娃”机械僵硬的动作、似人非人的外貌等缺点被无限放大，人类对“阿娜诺娃”的“同体情感”急转直下，由共情转变为惊恐、厌恶，双方间的交流也便无法有效协同。因此身为初代AI虚拟主播的“阿娜诺娃”受制于当时人工智能的认知与发展水平，只能作为“技术化存在”提供身体呈现的幻想，远不能作为真正的介质承载人类意识。

二、“身体化”：作为“映射”的身体

Web2.0时代，基于语音合成、3D建模而出现的二次元虚拟歌姬异军突起，作为非人的虚拟歌姬却凭借甜美的声音与外貌成为现象级的“符号存在”，在全球收获一众拥趸。受此影响，此阶段AI虚拟主播的身体呈现也朝向二次元形态发展。2016年伴随着人工智能领域获得重大突破，一位自称超级AI的虚拟主播“绊爱”出现在YouTube，与“阿娜诺娃”不同的是，“绊爱”的外貌并没有一味苛刻的仿照真人外形，而是以二次元这一亚文化形象进行赛博空间的身体展演。“绊爱”的动作、神情均由“中之人”穿上动捕设备以将其物质身体映射，在幕后操控其面部表情及身体动态，进而开展直播或录制视频。而在自我呈现上，“绊爱”通过“造客之术”糅合了人类的社会因素、文化因素和技术因素，最终被赋予虚拟的“人设”特质，以梅洛-庞蒂所指称的“意识存在”与人类形成通感。这使得“绊爱”的追逐者在物性与人性的对立之间，转而从AI虚拟主播这一“物性存在”寻求心理慰藉与情感寄托，事实与虚构之间的界限逐渐模糊，作为人的主体性也就此消解。[9]但此阶段AI虚拟主播的身体始终受“中之人”操控，动作展演完全依赖真人提取，在逻辑层面上更像是“人—技联结体”，其展现的身体属性、动作隐喻如同安德鲁·芬伯格所提出的“从属之身”，仅仅是以人类身体为参照所产生的复刻和模拟。

从笛卡尔的机械身体论来看，身体与意识是完全对立的存在，“人类身体中的骨骼、血管、神经、器官等就是人类身体之中的机器，即使意识不在其中，也不会影响它与正常身体一样行动”。[10]这一时期以“绊爱”为代表的AI虚拟主播，身体依靠真人穿戴动捕装备展演动作，但话语表达却通过人工智能程序予以维持；同样作为“中之人”的人类将自己的“物质身体”数据化，并映射至AI虚拟主播的“赛博身体”，其意识却停留在现实世界，身体与意识的双重脱节似乎更加印证了“机械身体论”的残酷事实，这种呈现方式所引起的不仅仅是加深人类对身体泛在化的认同，更是触动了身体的异化。动捕设备如同屏障物一般，隔绝了现实空间中身体与意识的勾连，又如同连接物一般，成为人类进驻赛博空间操纵虚拟身体的联结中介。辩证地看，“媒介延伸了人体，强化了感知能力，另一方面也瘫痪了被延伸的肢体”[11]。倘若人类为融入赛博空间而一味的接受技术具身的影响，这无异于会增强技术对人类的蒙蔽，使人类产生渐趋麻木的技术依赖心理。信息时代，若要在社会求得生存，或者说维持社会性，就必须依靠具身化的移动终端，这就导致肉身与技术的耦合度随之提升，尤其是在拥有AI意识的虚拟主播出现之后，现实中的身体和意识似乎皆可全然抛弃，成就真正的赛博人。在技术不断嵌入人类身体的同时，我们难免会猜测：未来人类身体结构会是怎样？人类是否会从身体异化走向精神异化、人格异化？

有学者指出，技术与人的融合昭示一个颠覆性的事实，即传播的主体已经从掌握工具的“自然人”转变为技术嵌入身体的“赛博人”，媒介融合进入了重造主体的阶段。[12]但倘若我们把“绊爱”作为真正嵌入社会互动的“人格主体”看待时，就会发现处于社会互动中的“绊爱”只能是以“非人行动者”存在，一旦进入更为复杂的交流环境，其作为人工智能程序的本质就会暴露无遗。这是由于作为人工智能的AI虚拟主播并不具备人类的主观能动性，尽管“绊爱”能够凭借人工智能程序产生流畅的交流行为，但无法理解人类文化的情感表达与社会伦理，因此其在传播过程中注定缺乏精神厚度与思想广度，难以触达更深层次的交流活动，甚至会在不同语境中产生负面传播效果。由此观之，AI虚拟主播不仅仅需要身体的“形似”，还需要精神的“神似”，这样在进行传播活动时才能使人的身、心、物以及环境无分别地、自然而然地融为一体，从而致力于维系传播活动的操持。[13]

三、“类身体”：作为“具现”的身体

人工智能专家威诺格拉德认为，程序不在于模拟人类意识的内在运作，而在于人与变动环境的交互。[14]经此思考转向之后，AI虚拟主播背后的技术提供商再次启程，结合神情、動作等多模态信息对AI虚拟主播交互训练，并通过相应技术手段为AI虚拟主播嵌入“虚拟人格”。人格化的赋予让AI虚拟主播向着真正的“人”进化，人类和技术他者之间的关系在此种条件下发生改变，“社会人”这一概念在人工智能技术作用下进一步解构，这标志着人工智能领域进入“塑造主体”阶段。在此阶段，不少“人格化”的AI虚拟主播相继诞生，2018年搜狗与新华社推出基于新华社主持人邱浩的外形，生成全球首个全仿真智能AI主持人“新小浩”。湖南卫视则以CG技术为基础，分析上百位受欢迎女性外貌，最终推出唱歌跑调、酷爱追星的虚拟数字人“小漾”。它们的身体姿态从空间限制、动作固定走向行动自由、实时互动的全真人形象，具有拟真化、人性化的性格人设，其传播内容也不再局限于简单的信息播报，而是拥有了具身化、交互化的内容。凭借高拟真化、人性化，“新小浩”“小漾”等新一代AI虚拟主播具现了现实空间中的人类身体，同时人格化趋势使得它们也因此作为赛博空间中的“人格主体”与人类交流，其所进行的传播活动已犹如肉体在场一般重回“身体媒介”阶段，并借此产生新的“身体在场”方式，即“赛博身体”的在场。

唐伊德在《技术中的身体》中提出了著名的三个身体理论：“人分别有三个身体，即作为人类生存基本条件的生理意义上的‘物质身体；由社会、文化、宗教所建构出具有社会性的‘文化身体；穿越物质身体与文化身体，在与技术的关系中通过技术或者技术化的中介建立起来的‘技术身体。”[15]无论是“阿娜诺娃”还是“绊爱”都受限于技术中枢，在传播活动中仍需要物质的、现实的身体作为本体与技术共生，始终无法完全以技术身体的姿态存在于世，而“新小浩”“小漾”等新一代AI虚拟主播从外貌、动作到声音、语调，均遵循身体机制应有的规则，尽管仍有所束缚，但已可凭借高仿真的身体姿态与人格特质达到传播中肉体回归的交流语境，这使得AI虚拟主播处于赛博空间的技术身体得以与现实空间中的物质身体、文化身体分离，成就出基于二者的“数字孪生”。这也正如保罗·莱文森所预测的那样，尽管人类的传播媒介历经了印刷、广播、电视等媒介形式，且传播中人类的缺场越来越成为常态，但在媒介不断演进的趋势下，传播元素中的人性化趋势终将回归，但这时人类的物质身体与文化身体均已消弥，唯有以数字形式存在的技术身体成为传播中的媒体中介。

AI虚拟主播愈发强大的技术具身能力，整合了肉体与技术的双重逻辑，创造出人类崭新的在场方式——赛博空间的虚拟在场，它甚至可以凭借各种技术模仿人类的神态、语态，为人类提供深入的人机交互，营造出身体在场的真实感觉。“但具身不是简单的技术或情感加诸于身体，当然也不是一般意义上的移情，而是人在某一活动中达到一种与周围环境相融的物我合一。”[16]

尽管AI虚拟主播的身体呈现已与“社会人”无异，但社会情境瞬息万变，如果用“情境认知”来衡量当前的AI虚拟主播的具身能力，我们就会发现，AI虚拟主播难以根据社会情境的变化做到及时更改交流内容。它如何面对直播时所遇到的语言攻击、水军霸屏？在面对紧急性、突发性情境时，AI虚拟主播如何感知、思考？它是否能够流下人性的“仿生泪”？在交流时，它如何用动作、眼神等身体符号传递情绪、感情？梅洛-庞蒂对于情境与身体的关系这样看待，情境是内在的，不是外在的，具身的情感受制于情境的约束，因此认知互动必须观照情境的流动，而不是对情境的单向映射。[17]因此，AI虚拟主播仍需遵循“人性化趋势”将“情境认知”“社会认知”融入内在，走向更高级的认知交互，如情感进化、身体符号等具身能力，以此实现肉体与心灵的双重在场。在拥有人格和情感之后，AI虚拟主播便不仅仅是弥补人类肉体缺陷、传达社会信息的工具化存在，而是一个有温度、有性格的“人”，能够作为人类文化实践的结构要素，嵌入既有的社会情境之中。

四、结语

第一代认知科学受身心二元论的影响，不断尝试离开人类肉体进行精神交流，因此產生了所谓的“计算主义”，即意识可单独存在，或者心灵可被计算，但不论是意识抑或心灵与计算机皆有着本质差别，因而受第一代认知科学引领的AI虚拟主播始终无法突破生理上的身体，达到意识在场的“离身传播”。而在经过第二代认知科学的转向之后，“具身认知”成为人工智能领域的新思潮，计算主义转而关注人机传播中的交互作用，进而产生“新计算主义”。“新计算主义”不再倡导认知可被计算和唯算法论，而是开始思考系统底层的交互逻辑，这也引导着人工智能领域更加重视技术的具身性和交互性。[18]因此AI虚拟主播也重新走向具身传播、人机交互这一新进路，从“新小浩”到“小漾”无一不是沿此进路设计，这使得人与技术之间不断消除传播隔阂，从中建立起信息的流动与联结，达成赛博空间的“异质网络关系”。但就目前现状来看，AI虚拟主播仍有诸多不足存在，AI虚拟主播还需沿巡人性化趋势完善其社会与情境认知，统筹物质与心灵，从而以“绝对主体”的身份打破“现实世界”与“赛博世界”的博弈与对抗，成为真正的“社会行动者”。

【本文系重庆市教育科学“十四五”规划课题重点项目“乡村振兴背景下数字教育推动重庆城乡义务教育均衡发展路径研究”（项目编号：2021-GX-112），重庆师范大学研究生科研创新项目“AI虚拟主播赋能红色教育的功能向度与实践路径研究”（项目编号：YZH23018）的阶段性成果】

参考文献：

[1]莫里斯·梅洛-庞蒂.知觉现象学[M].姜志辉，译.北京：商务印书馆，2001：116.

[2]於春.传播中的离身与具身：人工智能新闻主播的认知交互[J].国际新闻界，2020，42（05）：35-50.

[3]周勇，郝君怡.建构与驯化：人工智能主播的技术路径与演化逻辑[J].国际新闻界，2022，44（02）：115-132.

[4]刘明洋，王鸿坤.从“身体媒介”到“类身体媒介”的媒介伦理变迁[J].新闻记者，2019（05）：75-85.

[5]郭全中，黄武锋.AI能力：虚拟主播的演进、关键与趋势[J].新闻爱好者，2022（07）：7.

[6]邬建中，杨帆，李清鑫.溯源、反思与展望：AI主播的技术具身[J].青年记者，2023（04）：61.

[7][加]麦克卢汉.理解媒介——论人的延伸[M].何道宽，译.北京：商务印书馆，2000：83-84.

[8]刘婷，张卓.身体-媒介/技术：麦克卢汉思想被忽视的维度[J].新闻与传播研究，2018，25（05）：55.

[9]王毅，黄文虎.论“二次元虚拟偶像”的后人类呈现[J].未来传播，2021，28（04）：71.

[10]李琍.身体的权利——试论笛卡尔机械论身体观的哲学动机[J].世界哲学，2013（06）：44.

[11]刘婷，张卓.身体-媒介/技术：麦克卢汉思想被忽视的维度[J].新闻与传播研究，2018，25（05）：56.

[12]孙玮.赛博人：后人类时代的媒介融合[J].新闻记者，2018（06）：5.

[13][16]芮必峰，孙爽.从离身到具身——媒介技术的生存论转向[J].国际新闻界，2020，42（05）：10-11.

[14]徐献军.论德雷福斯、现象学与人工智能[J].哲学分析，2017，8（06）：11.

[15]杨庆峰.物质身体、文化身体与技术身体——唐·伊德的“三个身体”理论之简析[J].上海大学学报（社会科学版），2007（01）：14.

[17]李恒威，黄华新.“第二代认知科学”的认知观[J].哲学研究，2006（06）：95.

[18]於春.传播中的离身与具身：人工智能新闻主播的认知交互[J].国际新闻界，2020，42（05）：41.

作者简介：姚宇航，重庆师范大学新闻与传媒学院新闻与传播专业硕士研究生；黄勇军，重庆师范大学新闻与传媒学院教授、博士、硕士生导师

编辑：白洁

新闻论坛2023年5期

新闻论坛的其它文章: 县级融媒体中心短视频叙事策略分析; 他者视角下纪录片讲好中国故事叙事策略; 基于SWOT分析的民族团结主题电影传播策略探析; 边疆民族地区建设新型主流媒体路径探索; 试论新疆题材纪录片《巴扎》的创作特色; 创新理论视角下格萨尔史诗的传承与传播