随着互联网络在全球范围内的飞速发展,人们发布和获取信息的方式发生了翻天覆地的变化,网络被认为是继报纸、广播、电视之后的“第四媒体”。Web2.0的出现更是为普通用户自由发表观点和看法提供了全新的平台。消费者越发频繁地通过各种意见反馈系统发表其产品使用体验,形成了新形式的产品口碑信息。网络调查显示44%的受访者在Web平台上发表过自己的观点;而另一项调查显示82%的受访者在购买产品或服务时会参考网上评论信息。[1]
产品在线评论承载了消费者最直接的产品体验,是一个庞大而且信息丰富的数据集,蕴含了大量的管理和决策支持信息,是最具影响力的信息资源之一。其价值可以从消费者和商家两方面来分析:①对于消费者而言:首先,由于产品在线评论是一种无偏的产品信息,消费者对它的可信度大大高于商家的促销信息,所以产品口碑对潜在客户的购买决策有指导作用;其次,这种口碑信息使消费者能够以更积极的态度影响产品的销量和价格,形成良性循环。②对于商家来说,合理有效地分析产品口碑数据集可以观测到用户在不同产品周期(导入-成长-成熟-衰退)的关注热点,从而为产品的导入、营销和持续改进提供决策支持信息,这是一种比传统市场调研更经济和快捷的方式。
聚类就是将数据对象分为多个类,达到同类中的对象具有较高的相似度,不同簇中对象差别较大的效果。在许多应用中,可以将一个簇中的数据对象作为一个整体来对待。聚类在模式识别、图像处理、数据分析以及市场研究等领域有广泛的应用。
独立成分分析(ICA是信号处理领域在20世纪90年代发展起来的一种新的统计方法[2],自从1998年Back和Weigend将ICA的研究推广到金融领域后,ICA方法用在高维时间序列方面的研究便得到了广泛的关注[3]。在许多领域,ICA逐渐显示出重要的应用价值。尽管其在国外发展的较早,也较快,而在中国国内则刚刚兴起,但国内对其的关注程度也在逐渐提高,对其的研究也取得了一些有意义的结果。但是,ICA的研究中还存在着许多问题,有待于进一步的研究和发展。
基于以上分析,笔者提出了“基于ICA的产品在线口碑活跃度的时间聚类分析”,通过纵向视角的口碑活跃度演化研究:一方面,在理论上可以丰富在线评论挖掘和利用的管理学研究视角,为将在线口碑活跃度信息引入营销管理与决策提供理论模型和技术方案,并力争达到国际领先水平;另一方面,在应用上本项目的研究成果可应用于在线交易平台的产品比较和产品推荐,以及产品供应商的市场分析和营销策略制定,有效提升企业的在线口碑营销管理能力。
二、高维时间序列数据的聚类算法ICA K-Means (一) ICA及Fast ICA算法实现 (1) ICA概述盲源分离指的是在源信号和传输通道参数未知的情况下,仅由观测到的源信号的各个独立成分分析的过程。ICA作为盲源分离中最有效的一种方法,它的目的就是分解观察出来的数据,使分解出来的成分尽量相互独立。[4]ICA假设存在n个相互统计独立的源信号
(1) |
其中:T是源信号各分量的线性混合,即
(2) |
其中: A∈Rn×n为未知非奇异混合矩阵。ICA的实质是在无先验知识的前提下寻求分离
(3) |
其中: T∈Rn×n。
进而得到
(4) |
其中:
(5) |
且使得y(t)中的各分量尽量相互统计独立,从而获得独立的估计,即
(6) |
所以它可以深层次地挖掘出隐藏在现象背后的原因。
由于独立成分正是隐藏在现象背后深层次的公共因素,故可以认为其混合矩阵中的权重代表了序列的特征。[5]为了减少计算的开销,文章利用对权重的聚类来代替对原始时间序列数据的聚类。
(2) Fast ICA算法Fast ICA算法是由芬兰赫尔辛基工业大学计算机与信息科学实验室的Hyvarinen及其合作者提出来,又称固定点算法,该算法不需要设置学习速率,采用了定点迭代的优化算法,使得收敛快并且稳健,是ICA算法中最典型的算法之一。[6]
Fast ICA算法基于非高斯性最大化原理,使用固定点(fixed-point)迭代理论寻找W^T x的非高斯性最大值,该算法采用牛顿迭代算法对观测变量x的大量采样点进行批处理,每次从观测信号中分离出一个独立分量,是独立分量分析的一种快速算法。该算法的非高斯性度量函数为
(7) |
为了减少算法需要估计的参数,简化算法的计算,在运行Fast ICA算法之前往往需要对数据进行预处理过程,即去均值和白化过程。
(3) 利用Fast ICA获取混合矩阵流程为了使对庞大的原始数据的聚类更加简便,首先要对原始数据进行Fast ICA分析。分析得到的混合矩阵较原始数据实现了降维降噪,并完整地保留了重要的特征。
其步骤如下:
步骤1.中心化和白化观测数据x(t),得到z(t)。
Wi∈Rn,i=1,2,…,n的初值,使其范数为1,如步骤4正交化矩阵W。
步骤3.对每个i=1,2,…,n,
(8) |
其中:g为根据数据的高斯性选非线性函数。
步骤4.对称正交化矩阵W
(9) |
步骤5.如果不收敛,返回步骤3[7]。
(二) 时间序列数据聚类ICA K-Means算法设计针对高维时序数据特征,文章提出了一种基于ICA的K均值聚类方法--ICA K-means。
(1) ICA K-Means算法的基本思想普通的K-均值聚类用于时间序列聚类时,由于数据维度大,会产生较大的开销,也会使效率偏低,造成聚类效果不好等。 所以为避免用K-均值算法对时间序列进行聚类的这一缺陷,可以先利用ICA方法首先提取静态特征数据,然后利用K-均值算法对所提取的静态特征数据进行聚类,从而完成了对原始时间序列数据的聚类,由此便得到了一种新的基于ICA的时间序列聚类方法。ICA K-Means算法流程如图 1所示。
(2) ICA K-Means算法的流程
xi为第i个样本的时间序列,X={x1,x2,…,xn}为数据集,n为样本个数,K为聚类数目,
ICA K-Means算法由两步实现:
步骤1.实现独立成分分析,提取特征矩阵。
输入的数据集为样本矩阵,采用Matlab7.1仿真软件,利用fastICA2.5工具箱对样本进行ICA分析。将提取的特征矩阵存入access数据库。
步骤2.利用java语言编写的程序,对特征矩阵进行K-均值聚类。
步骤1得到的特征矩阵作为输入,采用在eclipse编写的实现K-均值算法的程序来完成这一步,得到聚类结果。
三、基于ICA K-Means算法的产品口碑演化聚类 (一) 信息反馈平台的选择介绍对比分析亚马逊、淘宝和京东商城这三大零售网站。从网站知名度、网站响应速度、网站评论活跃度、网站会员评论可信度和网站信誉度5个方面进行综合比较,以重要程度为标准每个属性赋予一个权值,用专家评分法计算总分,选择总分最高的网站作为信息采集平台。结果显示选择亚马逊为信息反馈平台。
作为中国电子商务领袖,亚马逊中国为消费者提供图书、音乐、影视、手机数码、家电、家居、玩具、健康、美容化妆、钟表首饰、服饰箱包、鞋靴、运动、食品、母婴、运动、户外和休闲等28大类、超过260万种的产品,通过“购物免运费”服务以及“货到付款”等多种支付方式,为中国消费者提供便利、快捷的网购体验。
通过亚马逊中国的不懈努力和消费者的大力支持,亚马逊中国每年都保持了高速增长,用户数量也大幅增加。在未来的发展中,亚马逊中国将进一步丰富产品种类,加强用户体验,力争以最丰富的选品、最具竞争力的价格和最优质的客户体验成为中国消费者的首选网上商城。
(二) 样本数据集的构建研究对象均选择生命周期大约在3~4个月的产品,且研究对象都为刚刚上市,便于在研究期内观察到其全部的生命周期。产品包括两大类:功能类和体验类。功能类包括电子产品和日用品。
电子产品的代表为手机、CPU和耳机。日用品代表为化妆品和服装。体验类包括书籍和碟片,书籍包含教辅类、小说类和人文社科类。碟片分为游戏软件、唱片和影片。
文章最终共选择了37个样本,每个样本取100天的在线评论数作为一个时间序列。最终得37×100的一个矩阵为样本X。
(三) 产品在线口碑活跃度的演化聚类实验平台是Window 7,Intel2.2 GHz CPU,6GB内存。
根据上文介绍的基于ICA K-Means聚类方法,可对37个产品100天的在线评论数做时间序列聚类分析。
首先将37×100的样本矩阵输入Matlab,利用Fast ICA2.5工具箱,经过FASTICA的ICA得到混合矩阵w;将混合矩阵w作为输入,运行执行K-均值算法的程序,得到的聚类整理结果如表 1所示。
综合得到的8个聚类结果,评价法则为组合在一起出现频度高于4的组合确定归为一类,其余定为不具代表性,则不予考虑,因此,得到聚类最终结果如表 2所示。
(四) 口碑演化模式与产品生命周期分析
众所周知,产品的口碑活跃度越高,说明产品的销售量越高,受到的关注度越高;产品的口碑活跃度很低,销量也一定持续低迷,产品将慢慢不再受到关注。由此可见,产品在线口碑的活跃度的趋势在一定程度上反映着产品生命周期(product life cycle)的趋势。
(1) 产品生命周期概述产品生命周期是指产品从进入市场开始,直到最终退出市场为止所经历的市场生命循环过程。产品如同人的生命一样,它会由诞生到成熟,最终走向衰亡。产品在投入市场以后,其销量和利润都会随时间推移而改变,呈现一个由少到多再由多到少的过程,这就是产品的生命周期现象。产品只有经过研究开发、试销,然后进入市场,它的市场生命周期才算开始。产品退出市场,则标志着生命周期的结束。[8]
最典型的产品生命周期一般可分为4个阶段,即引入期、成长期、成熟期和衰退期。
产品生命周期是一个很重要的概念,它和企业制定产品策略以及营销策略有着直接的联系。作为一名管理者,他的目标之一就是使他的产品销售周期尽量延长,这样才能使之赚取的利润足够来补偿在产品推出时的成本和风险,所以管理必需深入研究以及合理运用产品生命周期理论。对于营销人员,产品的生命周期理论也可作为产品市场运作的有力指导工具。[9]但是,产品生命周期理论也有局限性。首先,由于产品生命周期是产品生命趋势的反映,也是营销策略的结果,所以产品生命周期理论的运用不能运用在市场营销战略开发的过程中。其次,在预测产品性能时产品生命周期的运用也受到限制。
(2) 口碑演化的典型模式和产品生命周期分析聚类结果可演化为5类比较具有代表性的生命周期模型。每一类选出一种数据代表性比较好的产品,选择的产品序号对应如表 3所示。
对每一种产品的100天的评论数进行数据预处理,即中心化。根据中心化后的数据画出的生命周期曲线如图 2~图 6所示。
第一类类生命周期曲线与最典型的生命周期曲线趋于一致,有着引入期的低迷,成长期的增长,成熟期的长期走高,衰退期的减少,但在衰退期的最后有一小波的销量增长。
第二类生命周期曲线,在一开始投入市场就有非常好的销量,但经过一小波高潮后,就持续走低,之后一直维持在很低的销量水平,可以说有了很好的引入时期,使起点很高,但后劲不足,销量在高潮后迅速下降,且下降幅度很大,可以说生命周期非常短暂。
第三类生命周期曲线,与第二类类似,但不同的是在产品推出后先经过了一段销量低靡的时期,之后有了很大的销量增长,直至巅峰,但维持时间很短,就又恢复了销量低靡的时期,最后直至退出市场,此类生命周期也很短暂。
第四类生命周期曲线在前期引入期很顺利,销量波动走高,直到进入成熟期。但成熟期结束后,销量迅速下降,并之后一直持续降低到比最初引入期还要低的水平。
第五类生命周期曲线综合了前面的第一类和第二类生命周期曲线的特征。首先像第二类生命周期一样在投入市场之后,就有了非常好的销量,之后回到了比较正常的第一类生命周期轨道,经过了引入期、成长期、成熟期,最终停留在衰退期。
四、全生命周期下的产品口碑营销策略 (一) 产品口碑的营销渠道与营销模式分析 (1) 口碑营销口碑营销就是以口碑传播为途径的营销方式,即企业运用各种有效的手段,引发企业的顾客对其产品、服务以及企业整体形象的谈论和交流,并激励顾客向其周边人群进行介绍和推荐的营销方式和过程。[10]
口碑营销的概念源于网络。如今,博客、微博以及论坛这种互动性的社会化媒体平台逐渐壮大,已经渐渐发展为网络舆论产生和发展的源头,其传播效应和影响力远远超过了任何一种媒体。同时,网络社会化媒体有着比传统媒体成本低和互动性强的优点,所以文章将主要分析基于社会化媒体平台的网络口碑营销模型。
(2) 营销模型营销模型主要包括营销的传播途径和传播的方法两个方面,即传播渠道和营销策略。[11]
(1) 传播渠道
对于传播渠道的选择主要是由产品目标用户群特征决定,除了传统媒介和网络媒体一些门户网站,最具有影响力和最适合开展口碑营销策略的渠道是博客、微博、论坛以及一对一传播。
如今,由于博客具有自媒体的特点,博客已经逐渐成长为最具有网络影响力社会化媒体网络平台。制造话题、发现热点是博客和微博最大的特点,此外,微博和博客还可以对网络热门的话题和对象进行跟踪以及放大,从而逐渐形成一定规模的舆论效应,并且随着影响力的扩大,还能够对传统媒体和门户网站造成影响,最终达到对事件产生实质性的影响的效果。对于微博和博客而言,每一位用户所发表的内容都代表着自己独有的观点,并且每个用户都拥有固定的读者群,包括朋友、亲戚、同事、同行业者和粉丝。所以利用博客和微博进行的口碑营销,具有传播信任度高、目标用户覆盖率广、人与人直接互动的特点。
论坛在某种意义上与博客较为类似,因为它也具有制造话题、发现热点,并且最终影响事件的功能。但是论坛产生于互联网早期,在那个年代论坛营销确实是网络营销的一种常用方法。但随着互联网的发展,人们对单纯的广告发帖回帖产生抵触,有些论坛版主甚至会将广告贴一律删除,将发布广告者封号。所以网民的抵触情绪也使得论坛的口碑营销策略要不断地改进。论坛的口碑营销策略需要更加隐蔽,更加具有艺术性,这无疑对广告的创意执行提出了更高的要求。
一对一传播指的是点对点的信息交互,如短信、QQ、MSN、邮件和微信等。这种营销方式无疑是传播速度最快最直接的方式。但是由于信息大爆炸造成的信息超载,人们利用各种方式过滤垃圾短信和垃圾邮件。这种方式的营销效果已经极其有限。
(2) 营销策略
一直以来,营销策略多种多样,如事件营销、病毒营销、整合营销等。但管理者所面对的问题不是抉择使用哪一种营销策略,而且如何能够将营销策略整合在一起,全局掌控产品的消费者反馈以及产品的销量。
知名饮料品牌王老吉就曾成功地整合了多种营销策略。王老吉在CCTV宣布捐款一亿元利用了事件营销,然后通过论坛营销把这一事件进行放大,通过博客、论坛、E-mail进行病毒式营销,同时又使用了标题策略、短缺效应、互惠原理等策略,是一次典型的跨媒体整合营销案例。
(二) 生命周期阶段的口碑营销策略口碑营销是口碑传播者不断向外扩散口碑的过程,这是一个不断变化的过程。因为产品处于不同的生命周期阶段,其营销方法和传播者是不同的,所以传播渠道和营销策略在整个产品周期过程中需要不断地进行修正和调整。
(1) 产品引入期在新产品初期投入市场的时候,只有两种产品销售渠道,首先是商家周围的社交圈以及商家以前积累的用户资源。其次是在产品销售初期的第一批用户。这两类用户组成了产品引入期的主要目标用户群,称为初期用户。
初期用户是最初的口碑传播者,也是口碑产生的原点。这类用户一般是乐衷于尝试新鲜事物并且乐于将使用经验分享给他人的人。在产品引入期,商家需要快速定位初期用户并将产品扩散到这类群体中,形成初期小范围的影响。
(2) 产品成长期当产品在初期用户群中得到了正面的反馈,积累了一些固定的传播者之后,可以通过口碑营销策略从引入期迈入成长期。在产品成长期这个阶段,传播者数量不断地积累和壮大,此时传播渠道和营销策略也将不再适应成长期的需求,商家需要根据用户的需求进行完善和升级。
此外,引入品牌概念是在产品成长期一项重要的目标。商家在与买家进行互动和沟通中,初见形成自己的品牌文化,因此,口碑营销的作用将渐渐削弱,品牌营销将替代口碑营销成为主要的营销方式。
(3) 产品成熟期在产品成熟期,主要营销方式应该为品牌营销。但是值得注意的是口碑营销的特殊作用,它不仅可以起到扩大品牌影响力、巩固品牌地位的作用,还能延长产品生命周期。同时如果商家把握住此时机,合理地与买方进行沟通与互动,积极获取消费者建议、掌握消费需求趋势、巩固用户群等,还可以增强品牌影响力,甚至能够发现新市场与新机遇。
(4) 产品衰退期事实上,产品真正经历衰退期并且最终退出市场的情况很少。因为在产品衰退期的早期甚至还未迈入衰退期的时候,商家就会推出取代旧产品的新产品,使此系列产品重新进入上升通道,重新进入口碑营销、品牌营销的正向循环。
综上所述,随着社会环境、网络坏境的不断变化,营销的策略也应不断变化。目前,传统营销逐渐乏力、消费者也逐渐对广告感到麻木,所以若单纯地利用传统营销模式必定难以在日渐激烈的竞争中脱颖而出,营销的创新是必由之路。在网络从媒体时代进入个人媒体时代的背景下,在博客、论坛、微博主宰网络舆论导向的情况下,口碑营销成为个人媒体时代最具有自媒体特性的营销方法。
(三) 生命周期不同模式的口碑营销策略针对上文提出的5种生命周期曲线提出口碑营销策略如图 7~图 10所示。
从图 7可知,AB段有一段销量较低的阶段,在成长期阶段有一段销量不升反降,说明此阶段产品在成长过程中遇到了销量低潮期,这是对产品的成长非常不利的。如果借助口碑营销的手段,则可将AB阶段的时间缩短,甚至使此阶段彻底消失。
在A点,产品销量较之前有了大幅度的下降,此时对于商家来说,可以采取营销手段使销量继续上升。
从图 8可知,引入期非常短暂,在产品一面市就已经有了非常高的销量,但是从C点开始就走出了成熟期,开始衰退。所以为使产品的生命周期更长,应从C点就开始加大口碑营销的策略,使销量能长时间维持在高点。
由于第二类和第三类的成熟期以后走势相同,只存在引入期长短的差异,所以在此不予赘述。
第四类生命周期曲线(图 9)在引入期和成长期都很符合正常的生命规律,但成熟期时间非常短暂,并且很快衰退,降低至比刚面市还要低的销量水平。如若想改变这种局面,使销量维持在成熟期的高水平,并能慢慢衰退直至退出市场,那么就要在D点开始或加大口碑营销手段。
第五类生命周期曲线(图 10)可以说是比较成功的生命周期,在一开始投入可能因为很强的营销手段或者促销使销量急速上升,营销或促销结束之后,就回到了正常的生命周期。但为了使销量增多,理想的是在前期达到销量巅峰时就使之维持在这一水平。所以也就是要在E点使用或加大口碑营销。
在以上提到的口碑营销点A、C、D、E可采用如下口碑营销手段:
(1) 无偿使用产品最普通的手段是商家给博客用户提供免费的试用品,经博客用户试用后,他们会将对产品使用的体验写成文章,分享给关注他们的人。但是这种策略并不能持续于产品整个生命周期,只能在产品打开市场时使用此策略。
(2) 好评返现经过多年发展,商家又找到一种刺激用户做出正面评价的方法,即好评返现。所谓好评返现就是用户在为产品做出好的正面评价后,商家会返还一部分金额给消费者。这种另类的打折方法刺激了大量的用户在使用后做出正面评价。这种方法是一种“双赢”的策略。商家不但因为好的口碑不断扩大销量,消费者也会因此享受折扣。
(3) 传统营销与口碑营销相结合以传统媒体为依托来进行给口碑营销是一种即能保证口碑的可信度又能保证传播广度的营销手段。近些年来新兴的一种职业酒店试睡员就是源于这样一种营销手段。酒店邀请酒店试睡员到其酒店进行居住体验,试睡员体验过后会写出非常专业的点评发布在各大媒体上,这种测评报告会以较高的可信度征服消费者。在这种情况下口碑营销的策划者采取权威人士的评论发布在传统媒介平台的方式大大提高了口碑的影响力。
五、结语文章用改进的方法对产品在线口碑进行了聚类分析,并根据聚类结果,提出了生命周期的演化模型,并提出了管理学角度的营销建议。
文章的主要贡献是以下三个方面:
第一,提出一种ICA K-Means时间序列聚类算法。
产品的在线评论是时间序列,具有高维复杂性。所以文章提出了一种改进的聚类方法,即基于ICA的K-均值算法。该算法先对数据进行预处理和降维,提取出静态特征,之后对此进行聚类代替对原始大量高维数据聚类,大大提高了效率与准确性。
第二,由聚类结果识别出代表性的生命周期类型。
文章应用ICA K-Means算法对产品口碑活跃度进行了演化聚类分析,识别了口碑演化的典型模式。根据聚类结果,推出了5类比较具有代表性的生命周期类型。
第三,提出了生命周期不同模式阶段的产品口碑营销策略。
文章应用生命周期理论和营销理论,对每种生命周期类型的趋势进行分析,且提出了口碑营销点和相应的口碑营销建议,以延长产品的生命周期。
[1] | 余传明. 从产品评论中挖掘观点:原理与算法分析[J]. 情报理论与实践,2009,32 (7) :124–128. |
[2] | WANG Z. Fixed-point algorithms for constrained ICA and their applications in fMRI data analysis[J]. Magnetic Resonance Imaging, 2011, 29 (9) :1288–1303 . doi:10.1016/j.mri.2011.07.017 |
[3] | BACK A D, WEIGEND A S. A first application of independent component analysis to extracting structure from stock returns[J]. International Journal of Neural Systems, 2011, 8 (4) :473–484 . |
[4] | 段哲民, 马裕, 彭斌, 等. 基于盲源分离的商业销售计算机仿真分析[J]. 计算机仿真,2009 (11) :308–311. |
[5] | 苏木亚, 郭崇慧. 基于主成分分析的单变量时间序列聚类方法[J]. 运筹与管理,2011 (6) :66–72. |
[6] | 唐珊珊, 孙路路. 基于FastICA算法的混合图像分离方法[J]. 宿州学院学报,2010,25 (2) :52–54. |
[7] | 戴庆辉, 魏红丽. 基于产品生命周期的顾客满意度与产品理想度研究[J]. 科技创新与应用,2014 (3) :17–18. |
[8] | 田大明. 基于产品生命周期面向运营商服务策略研究[J]. 市场周刊:理论研究,2009 (9) :55–56. |
[9] | 刘玉明. 在线口碑信息对消费者购买决策影响的研究[J]. 价格理论与实践,2010 (3) :77–78. |
[10] | 胡雪飞. 口碑营销——零售企业营销制胜的利器[J]. 中小企业管理与科技,2012 (4) :30–32. |
[11] | 刘艳. 论口碑传播销售策略[J]. 中国商贸,2010 (12) :27–28. |