“百模大战”之后,国内AIGC产业“大浪淘沙”

2024-03-05 03:43金姬
新民周刊 2024年8期
关键词:文心算力人工智能

金姬

上海交通大学人工智能研究院副院长马利庄告诉《新民周刊》,国内的不少AI大模型其实是拿了国外公开的成果做微调和修改,大多以应用层面为主,而不是具有开创性的基础大模型,这并不是一个好现象。

从ChatGPT到Sora,AIGC(AI-Generated Content,“生成式人工智能”)无疑是这两年的科技顶流。在国家语言资源监测与研究中心发布的2023年度“十大新词语”中,“生成式人工智能”赫然居于榜单,可见这一技术对于中国的影响力。

AIGC,是指基于预训练大模型、生成式对抗网络(GAN)等人工智能技术,通过已有数据寻找规律,并通过释放泛化能力生成相关技术的内容。简而言之,AIGC是基于算法、模型、規则生成文本、图片、声音、视频、代码等内容的技术。其中,大模型对于AIGC尤为重要。

2023年,中国AI界掀起了一场“百模大战”——据统计,2023年前11个月,国内发布了238个大模型,几乎平均每天都有一个大模型问世。但很多大模型只是“看上去很美”。

上海交通大学人工智能研究院副院长马利庄告诉《新民周刊》,国内的不少AI大模型其实是拿了国外公开的成果做微调和修改,大多以应用层面为主,而不是具有开创性的基础大模型,这并不是一个好现象。“大约五六年前,其实中国的AI科学家不比美国少,但现在双方的差距已经拉大了,很可惜。”

业内普遍认为,算力、算法和数据是一款大模型研发的三大核心要素,缺一不可。

最近,OpenAI被曝出单月收入超20亿美元,但仍处在亏损状态,可见成本之巨大。这是因为大模型要发挥出能力,需要庞大的数据和算力,这些都很烧钱。而据微软统计,光是GPT-3.5在Azure AI超算基础设施上消耗的总算力就需七八个耗资30亿美元投资规模的数据中心来支持运行。

对于国产AI大模型而言,算力是一个关键问题。近年来,随着“东数西算”、算网融合等发展,全国算力网络正在加速建设,算力正在成为AI竞争的新焦点,也成为数字经济发展的新引擎。我国算力产业规模排名全球第二,仅2022年增长率就已经接近30%。

尽管如此,在日趋激烈的竞争中,各家企业对算力的巨大需求仍然难以满足。更有不少业内人士直言:缺乏强大的芯片等算力支持,是制约我国AI大模型发展的一大瓶颈。

科大讯飞董事长刘庆峰则认为,未来大模型的发展方向将不是一味地增加更大的算力和更大的模型,而是把各个子模型联动起来,并通过提升算法来优化其能力。

当前AI算力竞争的主战场之一在云计算。中国工程院院士郑纬民在2023移动云大会上指出,国内云计算产业存在三方面突出问题:从核心技术的角度来看,云计算的硬件技术自主可控性仍是薄弱环节;从生态构建角度来看,云计算的互操作性成为影响构建统一生态和发展创新的瓶颈;从行业应用的角度来看,公有云上行业应用类型单一是突出问题。

在算力层面,从头部互联网企业到人工智能公司都在积极筹备,大模型的算力需求也让国内云计算市场重新活跃了起来,仅以2023年4月为例——

2023年4月14日,腾讯云正式发布新一代高性能计算集群,算力性能和上一代相比提升3倍,服务器接入带宽从1.6T提升到3.2T,是目前国内性能最强的大模型计算集群。

2023年4月18日,字节跳动发布大模型训练云平台,包括自研DPU等系列云产品,推出新版机器学习平台,支持万卡级大模型训练、微秒级延迟网络,弹性计算可节省70%算力成本,主要为大模型公司提供算力支撑等服务。

2023年4月19日,云知声智能科技股份有限公司与优刻得科技股份有限公司达成了战略合作,联合打造融合AIGC、算力、存储等软硬件功能的私有化智能算力平台。

另一个让业内担忧的问题是AI大模型的污点数据。对于预训练大模型而言,多模态的数据集至关重要,以此才能让模型学习到更加完备的表示。AIGC经过反复专业训练和数据积累,生成答复内容的准确性、个性化将逐步提升,届时再分辨将难上加难。因此,由AIGC引发的人类数据库“污染”问题是渐进式的,隐蔽性强,危害性不易被察觉。

除了“污染”人类数据库,AIGC暗藏的另一个问题就是“自噬”。换言之,知识生成的过程是倒退而非前进的。

根据最新研究,将由人工智能生成的内容反馈给同类模型训练,可能导致模型质量下降甚至崩溃。这种自我吞噬现象被科学家们称为模型自噬。研究人员指出,虽然AIGC算法在图像、文本等领域取得了巨大进展,但持续使用合成数据来训练模型会导致模型变得封闭,并最终失去多样性和准确性。

值得一提的是,在算力提升遭遇瓶颈,训练数据数量、质量有限的情况下,算法在大模型研发中的关键作用愈加凸显。以科大讯飞为例,算法优势是讯飞星火大模型的核心竞争力,能够弥补目前国内大模型研究在算力和数据方面的不足。

“没钱,没卡,没人才,差距在拉大。”AIGC业内人士做了这样一句概括,在他看来,前两者的客观环境也在一定程度上限制着人才的回流,造成中国的AIGC产业很难在短时间内奋起直追。

因此,“百模大战”之下的中国企业主攻应用层面,也就情有可原了。

根据财华社统计,作为AIGC最佳落地场景,社交、游戏、教育和电商领域的头部企业均有在积极研发并推出了AIGC产品,借此机遇提升用户体验和企业创收能力。

在社交领域,腾讯、知乎、微博和美图等企业均发布了各自的AIGC/大模型产品。

游戏行业方面,AI游戏成为未来发展的大方向,通过AI可为游戏公司实现降本增效,尤其是美术制作上可大幅提高生产效率。伽马数据发布的《中国游戏产业AIGC发展前景报告》显示,超六成头部国内游戏企业明确布局AIGC领域,海外代表性AI企业中,超八成来自美国。

以腾讯、网易为代表的游戏厂商均自研并发布了自身的大模型,其中,网易利用AIGC技术,发布了“首款AI游戏”《逆水寒》,其表示,该游戏中有大量NPC都被植入了人工智能,这些NPC不再固定地站在某个位置等待玩家触发任务对白,而是变得有记忆、有性格,像个“真人”一样,生活在游戏主城中。

电商赛道也是AIGC落地的一大场景,2023年以来,AIGC技术在电商行业的广告、内容、社媒、用户增长、创新等各个方面快速渗透。其中的营销正成为AIGC的第一着陆点,在2023年“双11”购物节,AIGC技术实现了首次大规模落地。

据悉,京东的言犀大模型打造了业界首个大规模商用的情感机器人京小智,已涵盖了售前、售中、售后、物流等全链路服务。在2024年甲辰龙年春节期间,京东利用言犀大模型的AIGC文生图能力创作了八张剪纸年画,言犀虚拟主播、智能客服、智能外呼等也是京东AIGC的典型应用。

教育行业因为其个性化学习诉求强、数据丰富度高、付费意愿强,成为人工智能的优质落地領域。如网易有道的“子曰”、学而思的“MathGPT”可面向公众开放,标志着我国“AI+教育”发展再获新进展。

据悉,音频创作、视觉创作和文本创作是科大讯飞AIGC的三大模块。科大讯飞在AIGC方面产品创新也有一些探索,例如讯飞智作App,可结合音频、视频、文本等AIGC能力,打造一个音视频内容的AI创作基地。第二个是讯飞音乐的词曲家平台。通过AI的辅助作词作曲,可以帮助创作者提高生产力。文本创作方面,依托讯飞星火认知大模型,推出了讯飞写作及星火内容运营大师等应用。其中,星火内容运营大师可实现文章智能写作、精准配图与一键发布,通用稿件30分钟共创生成,深度稿件编辑效率翻番。

与此同时,另一些通用大模型也开始取得了成果。根据东吴证券的报告,百度推出“文心大模型”,是目前国内预训练大模型应用端生态最好的大模型之一。而基于文心大模型推出的文心一言,自2023 年 8 月 31 日向全社会开放以来,用户规模已经突破 1 亿,基于文心一言的创新应用超过 4000 个。2023 年 12 月,文心一言与上海辞书出版社深化合作,《辞海》的庞大数据融入文心基座大模型。

此外,阿里发布通义千问2.0,专业维度能力较强;vivo发布BlueLM大模型,应用的场景广泛;月之暗面发布Moonshot大模型,目前位于第一梯队。

而云从科技2023年5月推出的多模态大模型——从容大模型,宣称可以解决诸多AI应用的痛点,应用于金融、安防、政务、交通、能源、教育、医疗、文娱等行业领域。

“为企业打通大模型落地最后一公里”是竹间智能科技(上海)有限公司(下称“竹间智能”)的口号。然而,这家曾估值10亿元的AI独角兽,却在近期被爆出将停工停产长达六个月。很快,竹间智能辟谣表示,目前正对于部分亏损业务进行优化,其中涉及部分岗位的工作重组计划,进行了少部分岗位的停工,而非全面停工停产。

作为AIGC最佳落地场景,社交、游戏、教育和电商领域的头部企业均有在积极研发并推出了AIGC产品,借此机遇提升用户体验和企业创收能力。

作为NLP(自然语言处理)赛道的明星企业,竹间智能一度受到投资人的追捧。公开资料显示,竹间智能由前微软(亚洲)互联网工程院副院长简仁贤于2015年创办。据报道,简仁贤在微软任职期间,曾带领了“微软小冰及小娜”的产品技术研发,成功在中国及日本落地。在2017至2023年间,竹间智能连续获得了7轮融资,融资总额已超过10亿元人民币。

2023年,在ChatGPT掀起生成式AI狂潮之后,竹间智能推出了大模型工厂(LLM Factory)。简仁贤曾在2023年6月表示,大模型工厂(LLM Factory)可以在短时间内,快速且低成本地帮助企业构建自己的大模型,将其部署到本地并与现有系统融合,从而协助企业进行业务的升级。未承想,这样的独角兽企业会在2024年2月被迫宣布“部分停工停产”。

竹间智能的今天,也许就是国内不少AIGC企业的明天。

全联并购公会信用管理委员会专家安光勇表示,大量企业的涌入导致了行业的过度竞争和资源的过度消耗,加剧了行业的内卷现象。此外,市场需求可能会进一步萎缩,对AI企业的商业模式和盈利能力提出了更高的要求。

萨摩耶云科技集团首席经济学家郑磊则表示,目前国内人工智能初创企业既有专攻大模型研发的,也有一些在从事大模型应用方面的研究,但是由于在基础模型、训练数据和算力、人才、资金等方面的限制,初创企业很难承担大模型开发所需的巨额资金和大量资源投入,创业失败风险很高。

而对于那些互联网大厂而言,大模型还处于商业化早期阶段,很多盈利模式并不清晰。

目前来看,大模型的商业化无非就是在C端和B端两头进行。C端商业化一般是通过大模型为用户提供新产品和工具实现盈利。不过,除非有颠覆性的技术或者产品带来创新体验,否则很难吸引C端付费用户。扪心自问,你原意为一张文生图片或者一段文生视频支付多少钱?

大模型在B端的应用场景则更为广泛。华为任正非曾提到,“人工智能软件平台公司对人类社会的直接贡献可能不到2%,98%都是对工业社会、农业社会的促进,AI服务普及需要5G的连接”。任正非表示,大家要关注应用,尤其是工业、农业社会的应用,模型的应用有时比模型本身还有前途。

百度推出“文心大模型”,是目前国内预训练大模型应用端生态最好的大模型之一。

2023年7月8日,AIGC大模型应用闪耀2023世界人工智能大会,技术发展让机器人、数字人虚拟主播不再是摆设而更聪明高效。

遗憾的是,目前国内有名的大模型,大多都在C端赚吆喝……

猜你喜欢
文心算力人工智能
基于网络5.0的重叠网形态算力网络
卫星通信在算力网络中的应用研究
中国电信董事长柯瑞文:算力成为数字经济的主要生产力
基于SiteAI算力终端的交通态势感知系统
2019:人工智能
人工智能与就业
冬天来啦
文心杂记
请不断修炼你的“文心”