电商平台汽车玻璃水产品评价文本数据分析应用

2023-08-02 10:58高夏薇北京蓝星清洗有限公司
品牌研究 2023年24期
关键词:差评赠品词频

文/高夏薇(北京蓝星清洗有限公司)

一、前言

根据中国汽车工业协会统计分析,2022 年3 月,中国品牌乘用车表现明显好于整体市场,销量环比和同比均呈快速增长趋势,至2023 年1 月中国品牌乘用车市场占有率较2022 年同比提升5.6 个百分点。

玻璃水产品是传统汽机油乘用车和新能源乘用车的日用必备消耗品之一,与汽车保有量高度相关。随着国内乘用车市场保有量和销售量的稳步上升,且玻璃水产品需求不仅局限于车的类型,也普遍用于新能源车和商用车,从这个方面来说玻璃水整体市场发展趋势将持续向好。

汽车玻璃水是汽车挡风玻璃清洗剂的俗称,属于汽车日常使用中的易耗品。主要由去离子水、酒精、乙二醇、缓蚀剂及多种表面活性剂组成,能够对汽车挡风玻璃起到清洁、防冻、防雾、防眩、润滑等功效。

相对于柴机油汽车用品以线下消费为主,玻璃水产品则以乘用车消费群为主体,在线上渠道蓬勃发展。线上电商平台积累了大量消费者电商评论数据,成为消费者的主要舆论场之一,并且对后续消费者购买决策产生持续影响。一方面,作为消费决策的重要指标,品牌销售方如能积极地进行差评回复与应对,产品销售商便可获得更优于竞争对手的利润优势,如对差评消费者的差评敏感度过低,则会对品牌商和销售商造成不利影响;另一方面,由于疫情中物流和用车生活场景的减少,电商利润和销量均处于低位,虽然后疫情时代,电商经济呈现复苏态势,但消费者购买习惯已趋向更加保守、理性,冲动购买的概率下降;并且在从众心理的驱使下,购买者会将电商评论作为消费决策的重要参考指标。为此,品牌商和渠道商对于差评的研究分析显得尤为重要。从企业经营角度来说,销量排头的产品共性好评主词也可以作为产品开发的重要参考维度。

二、理论概述

潜在狄利克雷分布是一种非监督机器学习技术,作为基于贝叶斯学习的话题模型,是潜在语义分析、概率潜在语义分析的扩展。在文本数据挖掘、图像处理、生物信息处理等领域被广泛应用。用来识别大规模文档集或者语料库中潜藏的主题分析。它在语料中挖掘一系列的词袋,每个词袋就是一组词,这若干个词在某个话题范围内具有相近的语义联系。该模型是一个生成式的三层贝叶斯模型,分别包含文档、话题、词三层结构。在该模型中,分析结果仅考虑文本的词频,不对词语在文本中出现的先后顺序及其约束关系做关联。一个文本文件有多个话题组成,一个话题对应一个相关词项集合,而狄利克雷分布描述了“文本文件-话题”层面的概率分析。

三、数据分析过程

(1)评价采集:本文对产品评价没有采用传统的用户问卷、电话抽样、随机采访等调查方式,而是通过“八爪鱼”工具对京东平台的评价内容进行批量采集形成语料库。

首先,从相同规格汽车玻璃水中,选取销量排名靠前且评价数均高于5000 条的玻璃水产品,共10 个SKU,可归类为3 个不同的品牌,下文将产品品牌做匿名处理,分别用甲品牌、乙品牌、丙品牌来代表。然后使用八爪鱼工具,通过上述选定的产品购买链接,各抓取2000 条评论信息并采集维度包括会员级别、评价星级、评价内容、评价时间、点赞数、评价关键词等,保存成数据文件集合,形成语料库。

需要说明的是,因消费者需要根据环境温度来选择不同冰点玻璃水产品进行使用,本文将玻璃水产品分为冬季型和夏季型两类,为避免去除虫胶、树胶、油膜等特殊功效型产品的特性数据形成干扰数据,本次没有将特殊功效产品列入统计样本。

图1 头部主评好词总数汇总树状图

(2)数据处理:观察抓取到的数据,筛除非相关产品评价、重复自动评价等无效评价,再通过词频和词性进行分析,进而绘制词云图对头部好评和差评语料库进行情感和关联度分析。将其中评价星级为一星和两星的评价定义为差评,将4 星和5 星定义为好评。在大量的文档中分析发现隐含的主题结构信息,并用可视化图表将关键话题和语义表达出来。最终找出各品牌产品好评主词和差评关键词的共性和差异性,从而对企业优化产品和经营战略给出指导。

(3)好评主词数据分析(见表1)

表1 主评好词汇总分

从图2 树状图中可以看出:冬季型产品的防冻性能是区别于夏季型的首要需求,而夏季型产品则在清洁度和易用性等用户体验上需求更多。

图2 品牌甲关键词关系图

从表2 可以看出:品牌甲的独有好评词相对集中,且“高效快捷”属性,共被标记53 次,占据总数的60%,表明其在综合服务方面可能更盛一筹;品牌乙的好评词相对分散,主要归因于其SKU 较多,产品组合复杂,促销手段多样;品牌丙没有好评主词,某种程度上表明其在数据资产方面还没有形成吸引消费者的特质。

表2 各品牌主评好词独特性分析

(4)差评数据分析。

针对10 款SKU 并从甲乙品牌中各选取一款销量较高的冬季型玻璃水,筛选出差评数据,进行产品属性主题分析,通过词云工具构建两产品的词云关系图:产品A 的差评价数为396次,产品B 的差评价数为151 次,样本数均超过30 个,属于大样本数据。

从表3 的词频统计分析可以看到:京东平台消费者对产品质量方面有最多的评论,其次是价格,也对物流、包装和客服有较高的关注度和感知度。以上5 个方面对于产品销量有着至关重要的影响。产品B 价格差评比率是产品A 的两倍,其余主题指标差评比率,产品B 均低于产品A。另外,从京东购买链接中可以看到,产品A 的销量明显高于产品B,从一个侧面可以分析得出,产品A 采取薄利多销战略,价格是电商平台用户购买决策的重要考量指标。

表3 主题汇总(次)及词频汇总(%)

结合图2 和图3 的词云图可以看出:在负面词中,虽然产品A 的差评数是产品B 的两倍以上,但关于防冻质量的评价均在60%左右,结冰抱怨同样突出;在特征词中,与玻璃水产品强相关的汽车零部件,如“挡风玻璃”和“雨刮片”频繁出现,“冻住”“不干净”等词汇出现效率较高。

图3 品牌乙关键词关系图

产品A 的“赠品”抱怨词频异常突出,相较产品B 无赠品差评。通过查看具体评价词条,发现产品A 的“赠品”抱怨主要来自赠品发放不及时、数量不一致等原因,品牌甲需要在赠品促销环节提升服务能力;而产品B很少赠品抱怨,表明其在“赠品”方面服务较为到位,品牌乙可适当加大赠品的多样性和频次,将关于赠品作为提升销量的重要手段,与购物节前后价格折扣上下浮动相结合来拉动市场需求。

四、结语

本文通过抓取分析京东平台玻璃水产品评论语料库数据,得出产品精细化管理和注重用户体验是品牌吸引潜在消费者、促进复购的关键。首先,差评数会随着销量提升和促销活动有一定程度增加并且差评率呈现下降趋势,差评和好评的高频词能够反映消费者关注的重点方向,为企业经营优化产品体验提供风向标;其次,消费者购买决策时,除销量排名是主要参考外,差评数据是重要参考,品牌方或者销售方在电商平台运营时应做好差评客户的满意度管理和客户追踪,将反馈问题作为产品重点优化方向;最后,独有的主评好词是消费者体验产品过程中沉淀出的“独一无二”品牌语言,企业要引起关注和加强维护力度从而增强产品竞争软实力。

猜你喜欢
差评赠品词频
从差评垫底到好评第一
基于词频分析法的社区公园归属感营建要素研究
“赠品”等十二则
赠品
涉县“差评被拘”是法治中国的反面典型
如何让赠送的赠品更体现它的价值?
差评
词频,一部隐秘的历史
云存储中支持词频和用户喜好的密文模糊检索
以关键词词频法透视《大学图书馆学报》学术研究特色