基于数据挖掘理论的网购顾客关联产品购买意向分析

2015-12-24 03:46李东辉舒煜贵州师范大学经济与管理学院
商业文化 2015年18期
关键词:置信度店铺数据挖掘

文/李东辉 舒煜 贵州师范大学 经济与管理学院

随着互联网的全国性普及,物流业的蓬勃发展,网络购物以其更加低廉的价格、更多的商品选择等优势渐渐代替了实体购物。作为网络店铺主体,揣测消费者对关联产品的购买意向,在很大程度上能帮助网络商家进行更好的网络营销。本文基于大数据背景,充分结合数据挖掘理论中的相关技术,利用对以往顾客进行网络购物时的关联产品购买数据,进行数据信息挖掘,拟判断顾客的相关产品购买意向。本文仅仅以示例的形式从数据挖掘角度进行顾客购买意向的预判,并未进行大量实体验证,因此,文章所列内容只作为供参考的理论基础。

数据挖掘/关联产品/购买意向

一、前言

随着信息技术的普及、互联网的迅速发展、网络覆盖度的大幅提升,中国已经进入了网络时代。同时,中国实体营销也向网络营销迈出了长远的一步,网上宣传、网上策划以及网上促销等等一些列商家活动,都获得了很大的成功。网络支付方便快捷,网上产品丰富多彩,网上价格更加优惠,这些因素也成功吸引了购物者的眼球,使更多的人参与到网购行列中来。网上店铺的风靡与大批量现存及潜在的网购顾客成功开辟了市场营销的第二条路径,并且发展迅猛。

但是,网络商家间的竞争却也日益激烈,除了以更好的品质、低廉的价格、优质的服务来赢得更多的忠诚顾客外,还应对顾客的购买意向进行较为深入的感知与挖掘。在本文中,核心针对网络商品的关联产品网购意向进行举例式数学模拟分析(即以手机配件、屏幕保护膜及耳机等作为手机的关联商品,进行分析),并由此对一般性网络商品的关联产品的营销提出相关策略。

二、相关理论基础

(一)数据挖掘

数据挖掘(Data mining)是数据库知识发现中的一个步骤,是一个逐渐演变的过程,通过这个过程,可以把商业经验以及生活中的知识与海量数据进行对应结合,使得人们将抽象复杂的问题通用简单数字信息表现出来。利用数据挖掘技术,可以使人们更准确的认识问题,更深入的发现市场机遇,也可以做出更明智的决策。

商业活动中的数据挖掘可以这样理解:数据挖掘作为一种商业信息的处理方法,通过数据挖掘中诸多方法中的可适用方法,来进行商业信息数据的深层次剖析,从而进行抽取、转换、分析以及运用其他一些模型化处理方法,目的是获取能辅助进行商业决策的重要关键数据和关键的依托关系等重要隐含信息。

(二)关联规则

数据挖掘中的关联规则,也通常可以称作关联模式,它是单向的,是指某类项目或特征与另一类项目或特征间所存在的单向影响关系[1]。关联规则挖掘技术用于发现数据库中的属性之间的隐含联系,这和传统的生产方式规则不同,关联规则可以有一个或多个输出属性,同时,一个规则的输出属性可以同时是另一个规则的输入属性[2]。由关联分析方法的性质可以看出,该方法非常适合类似于购物篮类问题的分析解决。

以关联的角度来进行分析,能挖掘大量数据信息中隐藏起来的联系,这种被挖掘出来的联系就可以用关联规则来表示。即通过对以往数据信息进行汇总,将其作为数据挖掘的数据仓库,并利用数据挖掘类软件进行操作,便可得出相应的关联规则,再将挖掘出来的关联规则经过解释和评估,验证其可靠性,最后得出结果并应用。

三、关联产品的数据挖掘处理流程

鉴于网络市场的独有性质,对于客户的访问、消费、回馈等信息都能够很好的进行统计和存储,因此,网购顾客数据进行挖掘更加方便,应用更加高效。

当网购顾客访问某一个购物网站的时候,网络商家通过相应合理的数据统计工具对顾客的可统计信息进行数据类汇总,形成一个大型的顾客信息数据库。其中,针对本文所研究涉及的领域与内容,进行初步的数据筛选,获得具有针对性的初级数据源,为接下来的数据挖掘做好准备。

由于数据挖掘需要标准的数据来进行操作,因此,还需要对已经进行过初次筛选的数据整理,统一标准后才可以形成能进行数据挖掘操作的数据仓库。然后,对数据仓库运用数据挖掘技术进行深层次挖掘,获得更为重要的信息或关联规则。接下来对这些挖掘结果进行合理的解释评估,得到数据挖掘结果。数据挖掘结果不能直接作为数据挖掘模型终端,在进行结果应用的同时,要进行应用效果反馈,以持续调整数据挖掘算法,争取获得更为优化的数据挖掘算法,使挖掘成效最大化。鉴于以上描述,可以构建一个具体的据挖掘处理模型(如图1),通过模型中的步骤逐步进行数据分析与处理,最后预判网购顾客对关联产品的购买意向。

图1 关联产品购买意向的数据挖掘处理模型

四、关联产品购买意向的具体应用案例

关联规则作为本文中的一项重要规则,与传统的分类规则不同,关联规则中的各个属性可以重复出现在下一轮规则联系中。因此,在网购顾客购买任意产品或产品组合时,可以利用这一规则推断其关联产品的购买可能性和意愿强度。

经调研某专卖移动设备的网络商家发现,其产品主要可以分为手机和手机配件系列两大模块。其中,手机可以分为高端手机和普通手机,手机配件系列在本文中仅以手机护具和耳机作为主要案例资料。手机护具主要分为手机膜和手机防护外壳。以该商家的某月购物顾客访问后具体购买数据为例,获得其初步筛选后的数据表如下:

备注:为便于计算,以十位为最小单位,四舍五入保存数值

从上表中的数据及信息看起来比较混乱,因此,整理成较为直观同时更容易理解的二维交叉表形式,见下表:

手机Y1 Y X单独购买 合计高端手机Y11普通手机Y12耳机X1 440 300 120 860手机配件系列手机护具系列X2手机膜X21 510 260 300 1070手机防护外壳X22 310 210 80 600单独购买 150 200 总交易数:2410合计 1410 970

根据交叉表中的数据,可以挖掘出很多关联规则,例如:手机膜和高端手机之间的关系(X21——Y11)。关联规则有着两个重要的属性:支持度和置信度。

1.3.2 学生对案例教学法的反馈 讨论课全部结束后,教师集体讨论并设计问卷调查表,要求实验组从对教学方法满意度以及是否促进自主学习、学习能力、学习兴趣、与教师交流等方面,对病例讨论教学法的效果进行评价。共发出问卷151份,收回问卷151份,问卷回收率、有效率为100.00%。

(1)支持度(support):某项目集的支持度就是指在所有事物集数据库中,包含该项目集的所有事物占整体所有事物的比例。因此,手机膜与高端手机关联规则的支持度可以按如下计算:

S u p(X 2 1——Y 1 1)=X 2 1、Y 1 1 同时出现次数/事件总数=P(X21Y11)=21.16%。

(2)置信度(confidence)是指在事物数据库中,购买了一类商品,同时又购买了另一类商品的交易概率,可以按照概率统计中的条件概率进行计算:

Conf(X21——Y11)=P(Y11/X21)=P(X21Y11)/ P(X21)=X21、Y11出现次数/X21出现次数=47.66%。

根据以上关联规则的计算方法,可以通过SAS Enterprise Miner等软件获得大量的关联规则。以本例中高端手机对各类手机配件关联规则的支持度和置信度数据表格,如下表:

组合 关联规则 支持度% 置信度%高端手机—耳机 Y11—X1 18.25 51.16高端手机—手机膜 Y11—X21 21.16 36.17高端手机—手机防护外壳 Y11—X22 12.86 21.98

五、基于数据挖掘技术的关联产品网络营销策略

基于关联规则的数据挖掘方法,可以对网购顾客的关联产品购买意向进行深层次的剖析,因此,可以将这一理论应用在具体的网络营销中,提出相应实用的网络营销策略。

(一)以支持度为核心的网络营销策略

通过关联规则数据挖掘可知,一个购物组合支持度的高低,表明在所有购物搭配中,该组合被选中出现的概率高低。因此,通过进行大量的数据挖掘,可以在网络店铺所有购物数据中,将各种组合的支持度按照从高到低的次序排列。借助这个可以获知的排序,来安排产品搭配促销策略,一捆绑销售的模式提高产品的销售量。这样做还可以大大缩减购物者单独购买而产生的额外附加费用,如二次物流费、人工费、包装费用等等。对于购买者而言,还可以享受独有的购物组合优惠。总之,以支持度为核心的网络营销策略可以实现网络店铺与购物者之间的双赢。

(二)以置信度为核心的网络营销策略

在网络店铺中,置信度表示的是购买店铺内任意产品后,购买另一产品的交易概率,也可以理解成为购物者对置信度高的关联产品购买意向更加强烈。因为网络店铺往往都是一些相关产品或者是替代产品的集群,产品之间存在着或多或少的互补或搭配的关系,所以对于置信度较高的关联产品组合来说,更容易受到消费者的青睐。

经过数据挖掘分析,某关联产品组合的置信度高,即当购物者购买某一种产品时,立即自动推送与其相关联的高置信度产品。在对店铺内的所有产品销售数据进行数据挖掘后,关联规则中的置信度排序也呈现出来,那么消费者购买任意产品,都可以按照置信度从高到低排序,推送产品。这种信息推送方式就彻底颠覆了原有了同类替代产品信息推送模式,因为原有的替代品推送模式仅仅能在选择的时候提供多一种选择,究其根本对销售量没有提高,而以置信度为核心的网络营销策略却能大大提高销售量。

(三)综合支持度和置信度营销策略

在没有进行关联产品销售数据挖掘的网络店铺,对于店铺内的产品的融合度并不十分了解。对于某一产品,假如与任何产品关联组合的支持度和置信度都较低(不同店铺内高低水平不同,需具体参照),且该产品独自销售的概率或者利润偏低,那么该产品可以被视为该店铺内的不融合产品,在进行产品更新的时候,可以首选作为淘汰对象。

这种更新店铺重塑销售产品的方法也可以作为一种营销策略,作用不在于扩大销售,而在于提高店铺整体的销售效率和质量,是一种战略型营销策略。

以上三种营销策略是基于数据挖掘理论对网购顾客关联产品购买意向进行分析后,所得出的具有针对性的主要营销策略。这些策略充分利用了网络店铺信息数据获取易、产品信息推送方便、产品更新便捷等优势,同时结合数据挖掘关联规则的可应用性。但对于这些策略的具体成效还待检验,暂时仅仅为可执行的参考性营销策略。

六、结束语

在本文中,利用数据挖掘技术在网络销售方面的应用空间,重点将关联规则应用于网络关联产品是否购买的预判,进而有效帮助网络商家采取针对性的销售策略和产品推荐。

鉴于本文篇幅有限,虽然以一个具体案例进行验证说明,但并没有专门针对大型网络店铺数据库进行数据挖掘,因此需要实践者,应用所构建的关联产品数据处理模型中的调整数据挖掘算法的循环步骤,不断优化数据挖掘算法以及逐步剔除数据库中的杂质数据,使得数据挖掘结果更加可靠。同时,也希望更多学者对本文理论及思想进行不断的拓展和补充,获得更多的研究价值。

[1]安建华.数据挖掘技术在零售业中的应用研究[D].东北财经大学,2005年12 月.

[2]Richard J.Roiger,Michael W.Geatz 著. 翁 敬 农 译.Data Mining A Tutorial-Based Primer[M].北京:清华大学出版社,2003 年11 月.

[3]廖芹,郝志峰,陈志宏.数据挖掘与数学建模[M].北京:国防工业出版社,2012 年2 月.

[4]Xindong Wu,Vipin Kumar著.李文波,吴素研译.数据挖掘十大算法[M].北京:清华大学出版社,2013 年5 月.

[5]欧阳圣,数据挖掘在消费行为分析中的应用[D],湖南大学,2011年4月.

猜你喜欢
置信度店铺数据挖掘
基于数据置信度衰减的多传感器区间估计融合方法
改进支持向量机在特征数据挖掘中的智能应用
一种基于定位置信度预测的二阶段目标检测方法
老店铺杂事
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
苏轼的店铺
正负关联规则两级置信度阈值设置方法
软件工程领域中的异常数据挖掘算法
校核、验证与确认在红外辐射特性测量中的应用