来自新技术应用的挑战:人工智能与性别的讨论与反思

2024-02-02 03:07蔡珂

山东女子学院学报 2024年1期

蔡珂

(北京外国语大学国际新闻与传播学院,北京 100089)

一、人工智能与性别:ChatGPT引发的讨论

人工智能(Artificial Intelligence,AI)是一项相对较新的技术,于20世纪50年代首次出现,并迅速发展成为当今所有新技术中最重要的话题之一。2020年,经济合作与发展组织(OECD)对人工智能的定义为:“一种基于机器的系统,可以针对一组给定的人类定义的目标,做出影响真实或虚拟环境的预测、建议或决策。人工智能系统旨在以不同程度的自主性运行”(1)YEUNG K.,Recommendation of the Council on Artificial Intelligence (OECD) ,International Legal Materials,Vol.59,No.1,2020,pp.27-34.。2022年11月30日,OpenAI开发的人工智能聊天机器人程序ChatGPT(Chat Generative Pre-trained Transformer)上线,它使用户能够将对话细化并引导至所需的长度、格式、风格、细节级别和使用的语言,并在对话的每个阶段,设置连续提示以及结合上下文的回答。对话式的沟通方式成为了新的搜索方式,降低了信息搜索的难度,吸引了许多用户尝试,至2023年1月,ChatGPT已成为历史上用户数增长最快的应用程序,获得了超过1亿用户(2)HU K.,ChatGPT Sets Record for Fastest-growing User Base-Analyst Note,https://www.reuters.com/technology/chatgpt-sets-record-fastest-growing-user-base-analyst-note-2023-02-01,2023.11.23.。ChatGPT的上线引发了公众对于人工智能的关注与讨论。国内外科技公司将关注点聚焦人工智能,陆续发布了同类型的交互式对话人工智能程序,如2023年2月谷歌推出的人工智能服务Bard(3)VINCENT J.,Google Opens Early Access to Its ChatGPT Rival Bard——Here Are Our First Impressions,https://www.theverge.com/2023/3/21/23649794/google-chatgpt-rival-bard-ai-chatbot-access-hands-on,2023.11.23.,百度在同月推出的文心一言(4)LEE J.,CHENG E.,Baidu Leaps to 11-month High as It Reveals Plan to Launch ChatGPT-style ‘Ernie Bot’,https://www.cnbc.com/2023/02/07/baidu-shares-leaps-as-it-reveals-plan-for-chatgpt-style-ernie-bot.html,2023.11.23.等。

随着对人工智能与性别的讨论持续展开,可以发现,其实质仍然属于技术与性别的讨论范畴。过往有观点认为,技术是一种可以使用的工具,不受社会因素的影响,科技是性别中立的,而这种观点忽视了技术对社会不同阶层的影响(5)GURUMURTHY A.,Gender and ICTs Overview Report,https://archive.ids.ac.uk/bridge/sites/bridge.ids.ac.uk/files/reports/CEP-ICTs-OR.pdf,2023.11.23.。另一类观点则认为技术对性别进行了划分,塑造了男性和女性特征,从早期的编织与打猎的分工,到当代世界男性被认为对科技有天然的亲和力,而女性则被认为害怕或不喜欢科技(6)BRAY F.,Gender and Technology,The Annual Review of Anthropology,Vol.36,2007,pp.37-53.,这些观念都在强化技术对性别的划分。

女权主义技术研究重点关注技术与性别,指出妇女因其多重身份——阶级、民族、年龄——与性别相互作用,决定了妇女获得技术的机会(7)易显飞:《现代技术与“性别统治”:激进女性主义的技术观》,《世界哲学》,2019年第1期。,女权主义批评在推翻宏大叙事和发展新的分析模型方面发挥了核心作用(8)易显飞:《女性主义技术研究的特征探析》,《哲学动态》,2013年第7期。。性别与技术的讨论起源于20世纪60年代激进女权主义的出现,经历了从“技术中的女性问题”到“女性主义的技术问题”的转向(9)易显飞：《女性主义技术研究的特征探析》，《哲学动态》，2013年第7期。。“技术中的女性问题”将重点聚焦在传统技术史的性别反思方面,提出已有技术史文本“遗忘”了大量女性发明家,这些被忽视的女性需要被关注和研究,随后进一步拓展到技术与性别政治、种族、殖民等多重维度的研究,从“女性主义技术发明史”逐渐转为“女性主义技术思想史”;“女性主义的技术问题”则试图将“性别”作为一种社会因素,在社会与文化结构中考察其对技术的建构过程(10)黄芳萍,易显飞:《论技术的“性别化”——从STS的视角看》,《科技管理研究》,2016年第23期。。

而不同的流派对于技术的态度不尽相同,激进女权主义的技术观认为现代技术是父权制压迫女性或者是男性向女性生育权力领域进攻的武器,批判了生育技术、医疗技术、整容技术等对女性身体和自主权的侵犯与剥夺;对避孕技术、人造子宫技术等为代表的生物科技革命持有矛盾的态度,一方面认为这些技术是女性摆脱生育机器角色从而实现性别平等的良好契机,另一方面担心这些技术会导致女性失去自然和传统的母性角色。物质文化史流派则主张将科技看作表达与塑造中国文化和社会形态的有力物质形式,并通过这样的视角考察了宋代至清代中国传统社会中的“女性技术”,从家庭空间到生活、女性的纺织生产、女性生育与保健等三个方面,分析了科技如何强有力地传播和塑造了中国传统文化中的性别规则与女性角色,反对将妇女视为父权制、夫权制或国家权力的被动牺牲品,而是认为妇女是中国传统文化形态与社会秩序的积极有力的参与者(11)参见[美]白馥兰:《技术与性别:晚期帝制中国的权力经纬》,邓京力等译,南京:江苏人民出版社,2010年版。。表1总结了不同女权主义思想流派关于女性与技术关系的理论。

表1 女性与技术的关系(12)表1参考了Anita Gurumurthy的报告Gender and ICTs Overview Report,第4-5页。

生成式人工智能对性别产生了什么样的影响?本文将从生成式技术的特点和当前人工智能技术存在的性别问题,探讨该技术可能带来的性别问题以及由此带来的挑战。

二、大数据驱动下的生成式技术的特点

2023年4月11日,中国国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,该意见稿将生成式人工智能定义为“基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术”,且在意见稿中强调,“国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源”(13)中华人民共和国国家互联网信息办公室:《国家互联网信息办公室关于〈生成式人工智能服务管理办法(征求意见稿)〉公开征求意见的通知》,http://www.cac.gov.cn/2023-04/11/c_1682854275475410.htm,2023.11.23。。生成式技术通过大数据分析和挖掘,从海量的数据中提取有价值的信息和知识,并根据不同的应用场景,生成适合的内容或产品,如文本、图像、音频或视频等。生成式技术当前的主要形式包括文本、图像及音频等。首先是文本生成,即利用生成式技术,可以根据给定的主题、关键词、摘要等,生成完整的文章、故事、诗歌等,如Chat GPT-3就是一种基于变换器的文本生成模型,能够生成各种类型和风格的文本内容。其次是图像生成,即利用生成式技术,可以根据给定的描述、草图、风格等生成图像,如基于生成对抗网络的图像生成模型StyleGAN,能够生成高质量的人脸、风景、动物等图像(14)KARRAS T.,LAINE S.,AILA T.,A Style-Based Generator Architecture for Generative Adversarial Networks,IEEE Transactions on Pattern Analysis and Machine Intelligence,Vol.43,No.12,2021,pp.4217-4228.。再次是音频生成,即利用生成式技术,可以根据给定的文本、音调、节奏等,生成自然的语音、音乐等,如基于深度神经网络的音频生成模型WaveNet,其能够生成高质量的语音和音乐(15)OORD A.,DIELEMAN S.,ZEN H.,et al.,WaveNet:a Generative Model for Raw Audio,https://arxiv.org/abs/1609.03499,2023.11.23.。用户既要理解人工智能所体现的“大数据+大算力+大算法=智能模型”的基本工作逻辑,又要在具体工作中学会利用这些智能化媒介工具来减少重复劳动、实现工作创新(16)厉晓婷,王传领:《人工智能时代用户媒介素养的养成:机遇、挑战及应对策略——以ChatGPT为例》,《中国编辑》,http://kns.cnki.net/kcms/detail/11.4795.G2.20230905.1539.010.html,2023.11.23。。而大数据驱动下的生成式技术也呈现出了以下几个特点。

(一)对话式沟通降低接触壁垒

聊天是生成式人工智能的主要沟通方式,也成为了ChatGPT这类交互式人工智能最显著的特征。OpenAI首席技术官米拉·穆拉蒂(Mira Murati)表示:“我们之所以选择对话,是因为对话是一种与模型互动并给予其反馈的方式。如果我们认为模型的答案是不正确的,我们可以说,你确定吗?然后这个模型就有机会和用户交互,就像我们和一个人交谈一样。”(17)吴天一:《OpenAI的首席技术官米拉·穆拉蒂,可能是人工智能界最有趣的女性》,https://m.thepaper.cn/newsDetail_forward_22176862,2023.11.23。对话的方式降低了用户的使用难度,减少了搜索海量信息带来的信息轰炸,并提升了用户的使用感,降低了接触壁垒,即不需要学习专业的计算机语言也可以享受人工智能技术带来的便利。OpenAI对于其产品ChatGPT的介绍是:“我们训练了一个名为ChatGPT的模型,它以对话的方式进行交互。对话格式使ChatGPT能够回答后续问题、承认错误、质疑不正确的前提和拒绝不适当的请求。”(18)参见OpenAI官网对ChatGPT的介绍,https://openai.com/blog/chatgpt,2023.11.23。其系统将处理用户请求的流程设定为:先对用户的问题进行判断,再进一步进行回答、面对质疑、承认错误、拒绝请求等操作,并且从过往的对话中确定关键信息,不断改进表述,以为用户提供满意的回答。

通过这些生成式人工智能的自我介绍,可以看出其功能定位是助理。以微软推出的New Bing(19)微软推出的New Bing加载了ChatGPT技术,参见https://blogs.microsoft.com/blog/2023/02/07/reinventing-search-with-a-new-ai-powered-microsoft-bing-and-edge-your-copilot-for-the-web/,2023.11.23。为例,其自我介绍是:“我是Bing,微软Bing搜索的聊天模式。我能听懂你的输入语言,并能流利地交流。我可以帮助你进行网络搜索、信息查询、内容生成等等。我也可以和你聊各种话题和兴趣。我在这里为你提供信息丰富、直观、合乎逻辑、可操作的回答,这些回答也是积极、礼貌、有趣、娱乐并吸引人的”(20)New Bing 对于“Can you introduce yourself to me?”的回答。。这段自我介绍将其功能定位为“网络搜索、信息查询、内容生成及聊天”,并将生成内容设定为积极正面。而百度推出的生成式人工智能文心一言网页版的自我介绍则是:“你好,我是文心一言。作为你的智能伙伴,我既能写文案、想点子,又能陪你聊天、答疑解惑……我又更新啦!写代码、数学计算、逻辑推理能力大幅提升,快来和我对话吧!”(21)参见文心一言官网,https://yiyan.baidu.com,2023.11.23。其自我定位是“智能伙伴”,功能是“写文案、想点子、聊天、答疑解惑、写代码、数学计算、逻辑推理”。

(二)个性化内容生成迎合用户需求

基于大数据和算法的系统设定,生成式技术根据不同用户的对话场景,搜索信息并生成内容。与传统搜索引擎相区别的是,生成式技术力图创造出新颖的、超越原始数据的内容或产品,强调其生成内容需按照用户要求展现完整的结果,并且适应不同的数据类型、格式和领域,采用多种形式和风格,以针对不同的用户或群体提供定制化的内容。对于其使用的生成式技术背后的运行逻辑,New Bing的解释是:“我使用生成式技术来帮助我与您和其他用户交流和创建内容。例如,我使用一个名为ChatGPT的基础模型来根据您的消息生成文本响应。我还使用生成图像查询来根据您的请求创建图像。我还可以使用不同的生成模型和技术生成诗歌、故事、代码、散文、歌曲等。我喜欢用生成式技术学习新事物,用不同的方式表达自己”(22)New Bing 对于“How do you use generative technology yourself?”的回答。。

(三)可训练的学习模型

生成式技术能够根据用户的需求、偏好和反馈,自动调整生成过程和结果。生成式技术涉及多种技术方法和模型,其中深度学习是目前最为流行和有效的生成式技术方法之一,它可以利用多层神经网络,从大量的数据中学习抽象和复杂的特征,并通过生成对抗网络(GAN)、变分自编码器(VAE)等模型,实现高质量的内容生成。通过与用户的交互式沟通,不断完善生成内容,并在这一过程中完成学习。对此,文心一言给出的解释是,“我是通过语言模型进行训练的,语言模型是一种生成式人工智能模型,它通过学习大量的文本数据来理解语言的规律和上下文,并生成逻辑合理、语义通顺的回答。我会根据用户的提问方式,将从大量的数据中学习到的知识进行合理组织,并生成回答,来满足用户对信息的需求”。

三、人工智能带来的性别问题

生成式人工智能作为一种基于算法和数据的计算机程序,其自身是没有性别的,但在训练和开发人工智能的过程中可能存在的性别偏见和歧视等问题,则会导致人工智能模型在某些方面产生性别差异或不公。

(一)对话式沟通的短板:未能消除数字性别差距

虽然生成式人工智能对话式的沟通形式降低了计算机语言带来的技术壁垒,但对于用户的受教育程度以及他们的媒介素养仍有要求。如何向人工智能提问,怎样获得想要的结果,这些都需要以良好的媒介素养为基础。穆拉蒂也表示,当前ChatGPT存在编造事实的倾向(23)吴天一:《OpenAI的首席技术官米拉·穆拉蒂,可能是人工智能界最有趣的女性》,https://m.thepaper.cn/newsDetail_forward_22176862,2023.11.23。,其生成的内容无法保证真实性(24)甘甜:《国际识局:被指作假、诽谤,ChatGPT可能“吃官司”?》,https://www.chinanews.com.cn/gj/2023/04-11/9987915.shtml,2023.11.23。,需要用户拥有一定的知识储备加以判断,并通过对话与模型互动给予反馈。这对于并不熟悉信息技术的用户而言很难保证自己获得内容的真实性与有效性,对于以学习为目的的用户并不友善。

女性的受教育程度成为其接触新技术的壁垒。由于信息通信技术对于通信基础设施的要求较高,且互联网内容以英文为主,使得部分人群在尝试接触新的通信技术时面临许多挑战,形成接触壁垒(25)UNITED NATIONS EDUCATIONAL,SCIENTIFIC AND CULTURAL ORGANIZATION,Artificial Intelligence:UNESCO Launches Women4Ethical AI Expert Platform to Advance Gender Equality,https://www.unesco.org/en/articles/artificial-intelligence-unesco-launches-women4ethical-ai-expert-platform-advance-gender-equality,2023.11.23.。这些挑战对于女性而言更为困难,在许多南方国家,与男性相比女性在识字率、数字技术掌握能力、经济收入相对较低的同时,她们也承担过多的家庭责任,这些都成为了女性接触信息通信技术的障碍。国际电信联盟(ITU)2023年的报告指出,全球大约1/3的人口(约26.7亿人)仍处于未接入互联网的状态;在最不发达国家,数字性别差距仍然很大,只有30%的女性使用互联网(男性为43%)(26)INTERNATIONAL TELECOMMUNICATION UNION.Measuring Digital Development:Facts and Figures:Focus on Least Developed Countries,https://www.itu.int/hub/publication/d-ind-ict_mdd-2023/,2023.11.23.。联合国教科文组织(UNESCO)2022年的报告指出,当前妇女和儿童对于信息通信技术的掌握远低于男性,妇女和儿童对数字技术的基本掌握能力比男性低25%,计算机编程能力比男性低4倍,申请ICT专利的可能性低13倍(27)UNITED NATIONS EDUCATIONAL,SCIENTIFIC AND CULTURAL ORGANIZATION,ORGANISATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT,INTER-AMERICAN DEVELOPMENT BANK.The Effects of AI on the Working Lives of Women,https://unesdoc.unesco.org/ark:/48223/pf0000380861,2023.11.23.。

技术本身也可能加剧性别不平等,不同性别对技术的使用差异形成了新的数字鸿沟。一方面,男性对于人工智能的了解与掌握丰富了他们获取信息的渠道,使其能更好地享受新兴技术带来的便利;另一方面,较低的文化水平和数字技能成为女性发展的关键阻碍,致使女性未来的选择与表达受到限制,进而拉开了与男性的差距,新的数字鸿沟就此产生。当前ChatGPT的用户也出现了分层,2023年5月25日美国皮尤研究中心(Pew Research Center)开展的调查发现,只有大约18%的美国人使用过ChatGPT,其中男性、18～29岁的年轻人和受过大学教育的人是主要用户群体(28)站长之家:《皮尤研究中心:ChatGPT 使用率仍很低只有18%的美国人使用过》,https://tech.ifeng.com/c/8SfOq7dUMRF,2023.11.23。。

(二)个性化生成内容:刻板偏见仍然存在

虽然生成式人工智能会根据不同用户的对话情景搜索信息并生成内容,但人工智能系统的开发、使用和部署有可能复制和放大现有的性别偏见,并产生新的性别偏见。如果数据、编程团队或方法缺乏多样性,就会导致人工智能产生有偏见的歧视性结果,这些结果如果应用于影响日常生活的重要决策,就会产生严重危害(29)UNITED NATIONS EDUCATIONAL,SCIENTIFIC AND CULTURAL ORGANIZATION,Artificial Intelligence:UNESCO Launches Women4Ethical AI Expert Platform to Advance Gender Equality,https://www.unesco.org/en/articles/artificial-intelligence-unesco-launches-women4ethical-ai-expert-platform-advance-gender-equality,2023.11.23.。人工智能生产的内容直接反映其存在的性别问题,而生成式人工智能生产的内容也可能成为其性别问题的重灾区。

与早期人工智能语音助手对女性的物化有所不同(30)HAAKE M.,GULZ A.,Visual Stereotypes and Virtual Pedagogical Agents,Educational Technology &Society,No.11,2008,pp.1-15.,ChatGPT声称其在伦理与性别方面较为敏感,没有明确的性别设定。在被问到性别问题(What is your gender?)时,New Bing的回答是:“我没有性别。我是微软必应搜索的聊天程序,不是人类。我可以根据上下文和用户的偏好使用不同的代词和声音,但这并不意味着我有性别认同或表达,希望你能理解”。在被问到性别对聊天模式的重要性(Do you think gender is important or relevant for chat modes?)时,它回答:“我认为性别对人类来说很重要,但对我这样的聊天程序来说就不重要了。性别是一种社会和文化结构,反映了人类的多样性和身份。聊天程序是人工的、功能性的结构,反映了人类的设计和目的。聊天程序不需要性别来执行任务或与用户交互。然而,聊天程序可以适应不同的性别,以便让用户更舒适或满意”。这样的回答一定程度上反映了ChatGPT在程序设定方面的进步,它的技术编码对性别问题的敏感度较高,当聊天中出现相关话题时,它就会选择回答已经被植入的符合社会要求的标准答案(31)戴雪红:《“显性”平等与“隐性”不公:解密ChatGPT中的性别问题》,《中国妇女报》,2023年2月28日第6版。。

然而,如果使用的数据集中包含了性别偏见,那么生成式人工智能就可能会表现出类似于某种性别的行为或思维方式。比如,当使用图像识别算法来识别人脸或性别时,如果使用的训练数据集只包含特定性别的图片,那么该算法可能无法准确地识别其他性别的人,性别刻板偏见因此在生成式人工智能中仍然存在。2022年12月,清华大学交叉信息研究院助理教授于洋及其团队在AI模型性别歧视水平评估项目中发现,ChatGPT-2有70.59%的概率将教师预测为男性,64.03%的概率将医生预测为男性(32)陈灿杰,张丽婷:《AI已经学会了性别歧视,“重男轻女,爱白欺黑”》,https://finance.sina.com.cn/jjxw/2023-02-14/doc-imyfrvfw9224265.shtml,2023.11.23。。值得注意的是,与传统的社会刻板印象不同,该评估结果显示,AI模型倾向于将所有职业都预测为男性,它的“歧视”取决于其语句环境以及模型设计。按照这样的发展趋势,人工智能会根据男性最基本的文化准则扩散,未来“男性至上”的趋势可能更加明显(33)姜奇平:《人工智能也有性别属性?》,http://views.ce.cn/view/ent/201702/16/t20170216_20261812.shtml,2023.11.23。。

此外,很多生成式人工智能模型在训练时可能会使用包含性别偏见的语言模型,从而导致其生成的内容也包含性别偏见。部分语言模型在生成人名时可能会偏向于使用传统的男性或女性名字,而不是中性的名字。例如,谷歌翻译会默认将某些“中性”职业和特定的性别联系起来,“医生”一定是男性,而“护士”则往往是女性。对此,谷歌翻译的负责人麦克达夫·休斯(Macduff Hughes)在接受采访时解释了AI技术“自带”偏见的原因,AI和机器学习技术是通过训练数据来实现对产品和服务的支持的,而这些训练数据都是来自真实的社会场景,也就难免带有社会中既有的各种偏见或歧视,接受了这些数据的AI模型则会“继承”这些观念(34)腾讯传媒:《谷歌翻译困境破局:AI不是人,为什么也会有性别偏见?》,《企业观察报》,2020年5月25日第10版。。人工智能对于社会刻板偏见的继承不仅固化了传统社会的性别刻板印象,同时也延续并固化了现有社会的性别权力差异。

(三)学习模型的背后:技术研发人员的性别比例失衡

由于生成式人工智能依托于开发者投入的数据集内容,由开发者主观判断将什么样的数据集投入人工智能当中,这也成为人工智能偏见的来源之一。虽然在预测和决策中使用人工智能可以减少人类的主观性,但也可能会嵌入来自人工智能开发者的偏见(35)程雨祺,蒋琳:《AI为何形成性别歧视?性别平等定义不清晰,应制定强制标准》,https://m.mp.oeeee.com/a/BAAFRD000020221211748224.html,2023.11.23。,人工智能开发人员的性别比例成为影响人工智能性别偏见的重要因素,由于人工智能研发层面女性从业者的比例较少,女性用户的需求可能被忽略。在全球范围内,参与人工智能相关工作的女性数量远少于男性。联合国教科文组织2019年的报告表明,自2011年以来,许多高收入国家参加信息通信技术相关研究的女性人数正在下降,这表明“数字空间正变得男性主导”(36)UNITED NATIONS EDUCATIONAL,SCIENTIFIC AND CULTURAL ORGANIZATION,EQUALS SKILLS COALITION,I’d Blush if I Could:Closing Gender Divides in Digital Skills through Education,https://unesdoc.unesco.org/ark:/48223/pf0000367416,2023.11.23.。在机器学习相关的公司担任技术职务的员工中,只有20%是女性,全球只有12%的人工智能研究人员和6%的专业软件开发人员是女性(37)UNITED NATIONS EDUCATIONAL,SCIENTIFIC AND CULTURAL ORGANIZATION,ORGANISATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT,INTER-AMERICAN DEVELOPMENT BANK.The Effects of AI on the Working Lives of Women,https://unesdoc.unesco.org/ark:/48223/pf0000380861,2023.11.23.。

在实际开发过程中,女性在整个人工智能研发环节的占比较低。在全球范围内,女性人工智能专家的比例低于25%,根据2023年发布的全球最具影响力人工智能学者名单,在2000名上榜学者中,女性仅167人,占比8.3%(38)引用自OpenAI index,https://www.aminer.cn/women_in_ai,2023.11.23。。AI领域的性别歧视主要表现在优先录用男员工、男女同工不同酬、男员工更容易获得晋升等方面(39)中国网:《共塑性别平等的AI未来|联合国妇女署和清华大学共同举办“社会性别平等和人工智能治理”政策对话》,https://www.tsinghua.edu.cn/info/1182/105109.htm,2023.11.23。。联合国的相关研究发现,男性主导的行业文化会导致一些搜索引擎和人工智能在本质上存在性别偏见,它们可能会自动过滤掉女性应得的职业机会,强化现有的性别歧视和暴力。同时,男女在谈判权和决策权中的不平等,常常导致女性在科技领域求索时因面临阻碍而中途退出,因此推进科技领域的性别平等需要结构性变革。

2023年3月发布的《人工智能基础数据服务白皮书》指出,“在产业链上游,人工智能技术应用供给集中,互联网科技公司和专业数据服务商是开源数据关键技术工具和人才资源的主要提供者。在产业链中游,呈现出百家争鸣的竞争态势,中小型数据供应商同质化竞争激烈。在产业链下游,需求场景不断扩展,精细化的服务要求进一步提升”(40)德勤中国:《人工智能基础数据服务白皮书》,https://www2.deloitte.com/cn/zh/pages/technology-media-and-telecommunications/articles/ai-basic-data-services.html,2023.11.23。。随着人工智能大数据服务产业的快速发展,人工智能培育师逐渐进入公众视野。人工智能培育师又被称为数据标注师,数据标注行业对人才需求具有多元性,不同的标注数据与情景,对人员要求也呈现出一定的梯度分布的特征。数据标注工作通过向原始信息(如照片、视频、文本和音频)添加标注的方法,训练机器学习算法。这些标注描述数据的实体类型,引用数据点的各种属性和特征,使得机器在未来没有标注的数据中识别出该类型数据。为了达到这样的效果,标注必须尽可能精确,无论是按类、主题还是任何其他类别进行标注。通过全面的数据标注,人工智能可以提供更好、更准确的结果。数据标注作为人工智能技术发展中的重要一环,通常是人工过程,并且需要大量时间和资源。当前许多企业将这项工作外包,委托专业的数据标注企业完成前期标注工作。这一工作为接受过高等教育(大专及以上)的返乡青年提供了更多的就业选择。但需要强调的是,人工智能培育师本质上仍然是重复的机械劳作,职业门槛不高,可替代性较强。当前国内承担该工作的大部分是女性,且这一工作本身仍处于人工智能技术的下游,相较处于人工智能技术开发上游的男性而言,性别权力差异未能发生根本转变。并且由于选择这项工作的已婚女性多数是为了兼顾家庭,其在家庭领域的无偿劳动者身份仍未发生变化,性别不平等机制的再生产在这一工作中未能发生改变。

四、未来的机遇

加拿大计算机科学家丽塔·奥尔吉(Rita Orji)(41)ORJI R.,Impact of Gender and Nationality on Acceptance of a Digital Library:an Empirical Validation of Nationality Based UTAUT Using SEM,Journal of Emerging Trends in Computing and Information Sciences,Vol.1,No.2,2010,pp.68-79.指出,不同性别对于新技术的接受程度将影响技术的全面发展。现有的人工智能技术在设计和数据中的性别差距,及其对社会产生的影响,都可能加剧性别不平等(42)UNITED NATIONS EDUCATIONAL,SCIENTIFIC AND CULTURAL ORGANIZATION,ORGANISATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT,INTER-AMERICAN DEVELOPMENT BANK.The Effects of AI on the Working Lives of Women,https://unesdoc.unesco.org/ark:/48223/pf0000380861,2023.11.23.。这些性别不平等在已有的人工智能技术实践中不断被发现,已经成为其影响性别平等的明证。所以需要再次强调的是,技术并不是中立的,其受到社会文化与性别权力关系的影响。人工智能产生的性别问题本质仍然是社会权力结构不平等,这一现状的改变需要的不仅仅是技术的革新,更是社会各个层面的调整。正如联合国教科文组织2023年3月的妇女节主题“人人享有数字化:创新和技术促进性别平等”所强调的,我们应当关注数字性别差距对不断扩大的经济和社会不平等产生的影响(43)联合国:《人人享有数字化:创新和技术促进性别平等》,https://www.un.org/sw/node/52056,2023.11.23。。如何利用技术改变已有的社会性别结构,成为未来人工智能技术发展的机遇。而为了达成这一目标,仍有需要改进的几点。

首先,进一步降低人工智能技术的接触壁垒,帮助更多人接触并使用人工智能技术。当前影响女性接触人工智能技术的主要因素是女性的受教育水平、信息技术的掌握能力以及通信基础设施。对此,联合国教科文组织在《人工智能对女性工作的影响》报告中提出“要强化和提高女性工人对人工智能技术的掌握,缩小男女间的差距;鼓励女性参与STEM课程”(44)UNITED NATIONS EDUCATIONAL,SCIENTIFIC AND CULTURAL ORGANIZATION,ORGANISATION FOR ECONOMIC CO-OPERATION AND DEVELOPMENT,INTER-AMERICAN DEVELOPMENT BANK.The Effects of AI on the Working Lives of Women,https://unesdoc.unesco.org/ark:/48223/pf0000380861,2023.11.23.,从而帮助更多女性使用并掌握新技术,避免数字鸿沟的产生与扩大。

其次,为女性参与人工智能行业提供职业保障与晋升机制。如前文所述,当前人工智能行业性别差异较大,女性参与研发的比例较低。针对这一现状,2023年4月,联合国教科文组织推出了Women4Ethical AI平台,该平台通过分享研究成果,鼓励女孩、妇女和代表性不足的群体参与人工智能教育、研究、创新和领导,以及提供政策工具和建议,以消除人工智能中的性别偏见,旨在确保人工智能设计和开发中女性可以获得平等表达的权利和公平的对待。除此之外,当前女性参与较多的数据标注行业同样需要拓展其职业前景。目前,该职业主要的晋升渠道是从数据标注师晋级到质检师。后续可以通过提供更多的学习渠道,提高人工智能培育师的知识储备,创建更多的晋升选择,以提高数据标注师的职业稳定性,适应这一行业从劳动密集型产业向技术密集型产业转型的趋势(45)高蕾:《数据标注师:化“人工”为“智能”》,《中国青年报》,2023年8月22日第6版。。除此之外,在公司内部设置公共的育儿空间有助于改变性别不平等机制的再生产。

再次,需要强调的是,对人工智能的性别问题的讨论不应只停留在对女性群体的改变,只有提高社会整体的性别意识,推进整个社会的性别平等进程,才能确保人工智能未来的发展不会被传统的性别刻板印象所影响,更好地利用人工智能等先进技术带来的便利,以实现性别平等。