基于消费行为特征的在线用户价值度量方法实践研究

2016-10-12 03:01博士生李玉萍副教授首都经济贸易大学北京100070北京联合大学北京100101郑州师范学院数学与统计学院郑州450044
商业经济研究 2016年16期
关键词:用户群总金额度量

■ 赵 玮 博士生 李玉萍 副教授(1、首都经济贸易大学 北京100070 2、北京联合大学 北京 100101 、郑州师范学院数学与统计学院 郑州 450044)

基于消费行为特征的在线用户价值度量方法实践研究

■ 赵玮1,2博士生李玉萍3副教授(1、首都经济贸易大学 北京100070 2、北京联合大学 北京 100101 3、郑州师范学院数学与统计学院 郑州 450044)

基于消费行为的用户特征分析在网络营销领域得到广泛关注。大数据环境背景下,将传统领域的成熟方法提炼改进后应用于新场景,能够更好地满足网络营销领域应用的需求。本文基于数据分析对用户特征进行量化,采用分批迭代的方法并在此基础上对该方法进行拓展,通过各种指标进行独立和组合研究,实现用户价值度量,使其结果能够有效地适用于多种网络营销领域的应用。

用户特征 用户价值 度量 在线消费

用户价值度量指标概述

对用户特征进行分析,是为了深入了解用户,可以从用户的人口统计特征、消费行为特征等多个角度完成。而基于消费行为的用户特征分析广泛应用于网络营销领域,其主流分析思路和技术是基于数据分析的用户特征分析。基于数据分析的方法可以对用户特征进行量化,量化结果可以准确有效地指导营销领域的应用,这个过程可以通过度量用户价值来实现。首先需要选取和确定衡量用户价值的指标,常用的指标包括:

第一,用户最近消费时间:用户在某个周期内最近一次消费的时间。第二,用户消费频率:用户在某个周期内所消费的次数。第三,用户消费总金额:用户在某个周期内消费的金额。第四,用户消费最高单价:用户在某个周期内消费的商品最高价格。第五,特价商品消费比重:用户在某个周期内消费的特价商品的金额在其消费总金额中的比重。第六,高单价商品消费比重:用户在某个周期内高单价商品消费数量占其消费商品总数量的比重。

用户价值度量方法分析

用户价值可以通过上述指标进行单项分析,也可以组合在一起进行综合分析,尽可能多角度全面地度量用户价值。本文结合应用场景和数据基础,选取前三个指标进行单项和组合研究。

(一)用户价值度量基础

以用户的最近消费时间(R)、消费频率(F)、消费总金额(M)为例,若考察单项指标,用户的最近消费时间最短、消费频率最高、消费总金额最大代表用户的价值越大;若考察指标组合,需要通过确定各指标权重计算综合值,来度量用户的价值。对于权重的确定,以往研究多采用层次分析法,但此方法受到专业主观因素的影响。吉林大学段书勇从数据出发,提出通过数据分批迭代计算指标权重的方法,客观合理度量了用户价值。该方法的核心思想是:

1.以消费总金额为参考标准确定最有价值用户。将某年度第六个月的消费用户按照消费总金额划分为3个等级,处于最高等级的用户为最有价值用户。

2.计算过去某段时间内不同等级消费用户占最有价值用户的比例。将某年度前五个月的消费用户按照消费金额分为7个等级,对每个等级用户再按消费频率分为7个等级,这样前五个月消费用户被分为49个等级。计算最有价值用户在49个等级中的比例。按照此方法确定最近消费时间、消费频率和消费总金额对最有价值用户的影响程度。

3.依据最近消费时间、消费频率和消费总金额对最有价值用户的影响程度。采用数据分批迭代方法计算指标权重a、b、c,再根据公式计算用户价值:RFM_SCORE=a×R_SCORE+b×F_ SCORE+c×M_SCORE。其中,RFM_ SCORE为用户价值;R_SCORE、F_ SCORE、M_SCORE为用户在最近消费时间、消费频率和消费总金额指标上的等级;a、b、c为指标权重。

本文关于用户价值的度量需要结合实际场景和应用,才能有效和准确的对用户价值度量,需要在借鉴该方法的基础上进行拓展,包括:第一,定义多个角度的最有价值用户的标准,除消费总金额外,也分别选择消费频率、最近消费时间以及三者组合作为标准,从不同的角度对用户价值进行度量。第二,面对不同类型的商品,用户的消费特征不同,由此产生的用户价值可能不同。因此,需要针对不同类型、不同层次商品的消费,对用户价值进行深入评价和度量。

(二)用户价值度量路径

1.定义最有价值用户标准,确定最有价值用户群。确定最有价值用户群,要对指标数据进行离散化,有两种方式:

第一,独立式离散化。按照最近消费时间(R_14) 对用户进行降序排列并按数量进行等分,比如等分为3份。对于消费频率(F_14)和消费总金额(M_14)两个指标也分别采用降序排列和等分的方法将用户等分,这样可以得到在最近消费时间(R_14)、消费频率(F_14)和消费总金额(M_14)指标下的用户等级。

第二,嵌套式离散化。先按照最近消费时间(R_14)将用户等分为3份;在此基础上,对3份用户中的每1份用户按照消费频率(F_14)再划分为3份,得到9份用户集合;在此基础上,对9份用户中的每1份用户再按消费总金额(M_14)划分为3份,最终得到27份用户集合。

在本文中采用独立式离散化方法,选取2014年1月某网站用户群A的消费数据,按照最近消费时间(R_14)、消费频率(F_14)和消费总金额(M_14)指标对用户群A数据分别进行离散化(得分分别用R_14_SCORE、F_14_SCORE、M_14_SCORE表示),将用户划分为“高”、“中”、“低”三个级别,用“3”、 “2”、“1”标注。

表3 用户群记录数数据说明

数据离散化完成后,针对用户群A,分别选择最近消费时间(R_14)、消费频率(F_14)和消费总金额(M_14)作为参考标准,定义最有价值用户群*_MVU_ A(依据参考标准不同,*代表R_14、F_14、M_14、RFM_14),如表1所示。

当以R_14作为参考标准,最有价值用户群R_14_MVU_A为R_14_SCORE取值为“3”对应的用户集合,即用户群A中最近消费时间等级为3的用户集合。

当以F_14作为参考标准,最有价值用户群F_14_MVU_A为F_14_SCORE取值为“3”对应的用户集合,即用户群A中消费频率等级为3的用户集合。

当以M _14作为参考标准,最有价值用户群M _14_MVU_A为M _14_SCORE取值为“3”对应的用户集合,即用户群A中消费总金额等级为3的用户集合。

当以RFM_14作为参考标准,最有价值用户群RFM_14_MVU_A为R_14_ SCORE、 F_14_SCORE、 M_14_SCORE至少两项取值为“3”对应的用户集合,指的是:

{R_1 4_S C O R E=3,F_1 4_ SCORE=1,M_14_SCORE=3}{R_14_ SCORE=3,F_14_SCORE=2,M_14_ SCORE=3}、{R_14_SCORE=3,F_14_ SCORE=3,M_14_SCORE=3}、{R_14_ SCORE=2,F_14_SCORE=3,M_14_ SCORE=3}、{R_14_SCORE=1,F_14_ SCORE=3,M_14_SCORE=3}、{R_14_ SCORE=3,F_14_SCORE=3,M_14_ SCORE=1}、{R_14_SCORE=3,F_14_ SCORE=3,M_14_SCORE=2}对应的用户集合。即用户群A中满足消费时间、消费频率、消费总金额中有两项等级为3的用户集合;或用户群A中消费时间、消费频率、消费总金额中等级均为3的用户集合。

2.确定用户在最有价值用户群中的比例。选取2013年1月-12月某网站用户群B的消费数据,按照最近消费时间(R_13)、消费频率(F_13)和消费总金额(M_13)指标分别对用户群B进行离散化(得分分别用R_13_SCORE、F_13_SCORE、M_13_SCORE表示),将用户划分为“高”、“中”、“低”三个级别,分别用“3”、“2”、“1”标注。对用户群B,分别按照最近消费时间(R_13)、消费频率(F_13)、消费金额(M_13)划分的3个等级,计算处于不同等级的用户群B中的用户在最有价值用户群*_MVU_A中出现的人数(#_Ct_ BMA)占用户群B人数(#_Ct_B)的比例(#_Res_Rate)。以最近消费时间(R_14)作为标准划分的最佳用户群R_14_MVU_ A进行#_Res_Rate计算为例(依据划分标准不同,#_代表R、F、M),计算要素如表2所示(其他参考标准的最有价值用户群的#_Res_Rate计算,同理)。

3.确定各指标对最有价值用户的影响程度。在表2中,对各等级的R_Res_Rate、F_Res_Rate、M_Res_Rate进行降序排列,等级为3的R_Res_Rate、F_ Res_Rate、M_Res_Rate排列结果反映了R、F、M对最有价值用户的影响程度。4.确定指标权重,按照公式RFM_SCORE=a×R_SCORE+b×F_ SCORE+c×M_SCORE计算用户综合价值。假定由(3)得到F_Res_ Rate>R_Res_Rate>M_Res_Rate,按照RFM_SCORE=a×R_SCORE+b×F_ SCORE+c×M_SCORE计算用户综合价值的方法步骤如下:

第一,将R_SCORE、F_SCORE、M_SCORE标准化。第二,计算a、b、c权重值。根据假定F_Res_Rate>R_ Res_Rate>M_Res_Rate,得到b>a>c,并且a+b+c=1。那么,满足这两个条件的权重组合有:{a=0.2,b=0.7,c=0.1}{a=0.3,b=0.6,c=0.1}{a=0.4,b=0.5,c=0.1}{a=0.3,b=0.5,c=0.2}。第三,假定选择最近消费时间(R_14)作为参考标准,找到同时出现在最有价值用户群R_14_MVU_ A和用户群B中的用户,应用第二步中的四组权重,计算RFM_SCORE,其结果按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、[0.75,1]分成4组。其中,[0.75,1]对应的用户群人数记为Ct_RFM_MVU_A。第四,应用第二步中的四组权重计算用户群B的RFM_SCORE,按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、 [0.75,1]分成4组。其中,[0.75,1]对应的用户群人数记为Ct_ RFM_MVU_B。第五,计算W_Rate=Ct_ RFM_MVU_A/ Ct_RFM_MVU_B,最高值对应的权重组合为最佳权重。第六,按照公式RFM_SCORE=a×R_SCORE+b×F_ SCORE+c×M_SCORE计算用户综合价值。

5.针对不同类型和层次的商品进行用户价值计算。将商品分类,针对不同类型和层次商品对应的用户集重复上述步骤,计算参考商品类别划分的用户价值。

表1 最有价值用户群定义

表2 Res_Rate计算要素

表4 Res_Rate计算结果

用户价值度量实验

(一)实验数据说明

根据用户价值度量思路,选取某网站2014年1月用户数据作为用户群A,选取2013年1月-12月用户数据作为用户群B。结合商品分类,其对应的用户群记录数如表3所示。

(二)实验结果与分析

1.基于不同最有价值用户群针对单一类型商品的指标权重定义分析。本实验选择“日用百货”类商品消费对应的用户进行价值度量分析。依据度量思路,呈现其中两个重要的结果:

一是计算Res_Rate。参照最有价值用户群,计算Res_Rate,根据其结果判断权重值a、b、c的大小关系。针对用户群A,在商品分类情况下,以最近消费时间(R_14)做参考标准为例,确定最有价值用户群R_14_MVU_A。针对用户群B,按最近消费时间(R_13)、消费频率(F_13)、消费总金额(M_13)计算R_ Res_Rate、F_Res_Rate、M_Res_Rate。

从表4中得到:

等级3:F_Res_Rate(0.029)>R_ Res_Rate(0.028)>M_Res_Rate(0.024)

等级2:F_Res_Rate(0.013)>R_ Res_Rate(0.012)=M_Res_Rate(0.012)

等级1:M_Res_Rate(0.010)>F_ Res_Rate(0.009)>R_Res_Rate(0.006)

选择等级为3的结果作为判断权重大小的标准,进而得到权重b>a>c,并且a+b+c=1,a、b、c取值步长定义为0.1。满足上述条件的组合有{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2}。

二是计算a、b、c权重值。以最近消费时间(R_14)作为参考标准,找到同时出现在最有价值用户群R_14_ MVU_A和用户群B中的用户,分别应用四组权重组合{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2},计算RFM_ SCORE,其结果按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、[0.75,1]分成4组。其中,[0.75,1]对应的用户群人数记为Ct_RFM_ MVU_A。

接下来,应用四组权重组合{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}、{a=0.4,b=0.5,c=0.1}、{a=0.3,b=0.5,c=0.2},计算用户群B的RFM_SCORE,按照[0,0.25)、[0.25,0.5)、[0.5,0.75)、 [0.75,1]分成4组。其中,[0.75,1]对应的用户群人数记为Ct_RFM_ MVU_B。

计算W_Rate=Ct_RFM_MVU_A/ Ct_RFM_MVU_B,最高值对应的权重组合为最佳权重,结果如表5所示。在表5中,从依据四组权重计算W_ Rate的结果看到,{a=0.4,b=0.5,c=0.1}和{a=0.3,b=0.5,c=0.2}对应的W_Rate(0.032)相等并且大于{a=0.2,b=0.7,c=0.1}、{a=0.3,b=0.6,c=0.1}对应的W_ Rate。因此,以{a=0.4,b=0.5,c=0.1}和{a=0.3,b=0.5,c=0.2}两组平均值{a=0.35,b=0.5,c=0.15}作为最佳权重进行用户价值的度量。

(三)基于不同最有价值用户群针对不同类型商品的权重综合比较分析

本实验分别按照最近消费时间、消费频率、消费金额及三项综合指标定义最有价值用户群,针对不分类商品和分类后的4类商品按照用户价值度量思路,进行a、b、c权重计算,对权重进行综合分析和比较,结果如表6所示。得到如下结论:

第一,无论是在商品分类还是不分类情况下,针对不同类型的最有价值用户群,消费金额对最有价值用户群的影响是最弱的。在20组权重比较结果中,有14组最近消费时间对最有价值用户群的影响最大,消费频率的影响次之。第二,在商品不分类的情况下,针对不同类型最有价值用户群,各指标的影响程度是一致的,即最近消费时间影响最大;消费频率次之;消费金额最弱。

第三,在商品分类的情况下表现出如下特征:一是针对不同类型最有价值用户群,面向“电脑整机”和“家用电器”两类商品的8组权重比较中,影响力排名第一的是最近消费时间;有7组显示影响力排名第二的是消费频率,只有1组消费金额影响力第二;有2组消费频率和消费金额的影响力相同。二是针对不同类型最有价值用户群,面向“日用百货”和“手机数码”两类商品的8组权重比较中,有7组影响力排名第一的是消费频率;有6组显示影响力排名第二的是最近消费时间。

表5 权重选择结果

表6 综合比较结果

结论

用户价值度量满足了网络营销领域对基于消费行为的用户特征量化的需求。本文基于数据分析的方法对用户特征进行量化,先用定性方式确定最近消费时间、消费频率和消费总金额对用户价值的影响程度;再用数据分批迭代的定量方式确定三个指标的权重值。并在此基础上对其进行拓展,选择不同最有价值用户群作为参考标准,结合商品分类,从多个角度和层次对用户价值进行度量,以得到最佳度量结果,使其结果能够有效的适用于多种网络营销领域的应用。

2.段书勇.基于客户价值细分的推荐方式研究[D].吉林大学,2011

3.闫学元,张蕊.我国网络消费行为影响因素实证研究[J].商业时代,2014(33)

4.廖卫红.移动互联网环境下消费者行为研究[J].科技管理研究,2013(14)

5.范秋英,方醒.基于层次分析法的网上消费者行为分析[J].物流工程与管理,2013,35(1)

6.黄飞.大学生网络消费偏好识别及影响因素研究[D].中南大学,2013

7.张晓东,朱敏.网络口碑对消费者购买行为的影响研究[J].消费经济,2011(3)

8.王召义,雷丽丽.基于改进RFM模型的协同过滤推荐算法研究[J].安阳工学院学报,2015,14(2)

9.邓峰,张永安.基于多属性效用的协同过滤推荐系统[J].计算机应用,2015,35(7)

10.王渊.基于RFM模型的协同过滤算法及其在个性化推荐中的应用[D].杭州电子科技大学,2013

11.蒋国瑞,刘沛,黄梯云.一种基于AHP方法的客户价值细分研究[J].计算机工程与应用,2007,43(8)

F724.6

A

猜你喜欢
用户群总金额度量
鲍文慧《度量空间之一》
模糊度量空间的强嵌入
从资源出发的面向用户群的高校图书馆资源推荐模型分析
迷向表示分为6个不可约直和的旗流形上不变爱因斯坦度量
哪些电影赔了钱
地质异常的奇异性度量与隐伏源致矿异常识别
公共图书馆的用户群和服务人员的分析
主要刊期的期刊出版数量
我校 46个项目获得 2010年度国家自然科学基金批准立项