日本口红批发社区

作品赏析|基于电商企业运营数据的商品定价策略研究

长风大数据2018-12-15 16:05:45



提出问题

Online-to-Offline(简称O2O)——电子商务模式,是一个连接线上用户和线下商家的多边平台商业模式.O2O商业模式将实体经济与线上资源融合在一起,使网络成为实体经济延伸到虚拟世界的渠道;线下商业可以到线上挖掘和吸引客源,而消费者可以在线上筛选商品和服务并完成支付。这些由用户创造的海量数据远远超越了目前人力所能处理的范畴.庞大的数据量使得数据过载、数据冗余、数据捕获成本快速增长、数据价值不易获得成为电子商务面临的新问题.根据相关统计显示,如今世界已经进入到大数据时代,电子商务中用户数据每年增长约60%,企业平均捕获其中的25%~30%,但数据的利用一般不足其5%,用户数据作为O2O电商核心资源的商业价值远未被挖掘。

在当前的环境下,电商卖家往往因为把握不住市场的价格规律而只能获得较少的收益,具体体现在一方面卖家不知道如何对商品进行合理的定价,虽然销量高,但是价格较低,因而盈利较少,价格过高的会影响销量,最终获得的收益也不高;另一方面,卖家在进行进货时,不知道哪些商品可以为他们带来高的销售利润,导致进的货卖不出去和商品挤压的现象。基于此,本课题对大数据环境下用户购买商品的数据进行了挖掘及应用分析,一方面希望综合卖家的店铺等级,商品的价格区间和商品自身的评论好坏来给出卖家一个相对合理的价格定位,为卖家带来收益;另一方面,希望通过对市场大趋势下的价格分析,找出收益高的产品为商家推荐。

分析问题


图-技术路线


情感分析

将经过预处理的评论生成商品id、具体评论的数据表

pythonjieba分词模块进行分词处理部分结果如下

从上图可以看出,通过分词,将句子分为了一个一个的词。

对权值和情感词的极值进行计算

得到具体的分词结果之后,导入情感词极值库,将每条品评论所分出来的词与情感词库中的词做比较,极值相加最终的到每条评论所对应的极值表。

最后统计情感极值,按照比例将评论的等级分为了五个等级

决策树分类与预测

基于决策树的商品分类

我们认为产品的销售额与店铺等级、价格等级以及评论等级之间存在一定的关联,所以我们用着3个属性对销售额进行了决策树分类预测。在分类之前,我们根据销售额的分布的密集程度将其划分为13个区间,进行了划分,划分之后每个产品的销售额将对应一个销售额区间,即对应一个类,然后利用决策树分类算法,产生一个分类模型,帮助商家根据自身店铺情况,预测产品在不同价格上会带来多少销售收益。

图-价格区间

图-销售额大于1000的产品示例

图-决策树可视化

图-决策树分类结果摘要

根据决策树可视化图,可以看到,在不同的价格、评论、和店铺等级下,分别产生了不同的节点。可以通过对应特征的匹配,得出预测销售额区间。决策树分类的正确率有百分之61.7245,存在一定的指导作用。

基于决策树的价格模型分析

在官方给的数据集中,我们发现不同的商品的销售额是不一样的,但是哪些因素会影响这些爽肤水的销售额,我们选取了其中的店铺等级、价格等级、评论等级三个维度,分析它们对销售额有什么影响。

首先对所有爽肤水在不同的店铺等级下的销售额分布进行了统计,发现部分店铺等级下销售的爽肤水的数量较多,而部分店铺等级下销售的爽肤水的数量较少,因此选取两个存在较大差距的店铺等级下的爽肤水进行分析比较,因而选择了店铺等级为12和7的两组数据进行分析比较。

图-不同等级销售额的分布

再用Python下pandas数据分析包对所有数据进行处理,选择出店铺等级为12和7的店铺,并根据这些爽肤水的价格与销售额进行预测。把这些数据进行分割,用这些数据的70%作为训练集,用于对该决策树模型进行模拟训练,剩下的30%作为测试集,用于根据之前用训练集训练模拟出来的模型对接下来的数据进行预测,从而实现决策树预测的算法。

从上图中可以看出,在店铺等级很低的时候,不论销售的数量还是销售额都很低,在店铺等级比较高的时候,销售额和销售的数量并不是很高,只有店铺等级在中间位置的时候,销售额和销售的数量都比较高,更受消费者的青睐。

图-店铺等级为12的爽肤水的价格与销售额的关系

中红色的圆表示在这个价位上真实的销售额,而绿色的圆表示在该价位上根据训练集模拟出来的预测的销售额。

从上图可以看出,当店铺等级为12的时候,大部分的销售额都集中在1500元及以下的区间中。而在图4.16中,当店铺等级为7的时候,由于店铺等级比较低,在此类店铺下爽肤水的销售额都比较低,主要集中在500元及以下的区间中,而且购买此类店铺下的爽肤水的人数相比于购买店铺等级为12的人数也是比较少的。

其次对所有爽肤水在不同的价格等级下的销售额分布进行了统计,发现部分价格等级下销售的爽肤水的数量比较多,而部分价格等级下销售的爽肤水的数量比较少,因此选取有一定差距的两类爽肤水进行统计,分别为价格等级为4和19的店铺,并根据这些爽肤水的价格与销售额进行预测。并把这些数据进行分割,用这些数据的70%作为训练集,用于对该决策树模型进行模拟训练,剩下的30%作为测试集,用于根据之前用训练集训练模拟出来的模型对接下来的数据进行预测,从而实现决策树预测的算法。

图-不同等级销售额的分布

从上图中可以看出,销售量大的商品主要集中在价格比较低的区间,比较符合大众消费者的心理。

图- 价格等级为4的爽肤水的价格与销售额的关系

图中红色的圆表示在这个价位上真实的销售额,而绿色的圆表示在该价位上根据训练集模拟出来的预测的销售额。

从上图可以看出,在价格等级为4时,即价格区间在30到40之间,由于爽肤水的单价较低,因而整体的销售额都不是很高,主要集中在500元及以下的区间中。

图-价格等级为19的爽肤水的价格与销售额的关系图

图中红色的圆表示在这个价位上真实的销售额,而绿色的圆表示在该价位上根据训练集模拟出来的预测的销售额。

从上图可以看出在爽肤水的价格等级为19时,即价格区间在210到230时,销售的爽肤水的价格的数量比较少,虽然销售的爽肤水的数量并不多,但是由于价格比较高,因而通过决策树预测的销售额相对图4.18中的结果并不低。

最后对所有爽肤水在不同的评论等级下的销售额分布进行了统计,发现不同评论价格下销售的爽肤水的数量不同,因此选取有一定差距的两类爽肤水进行统计,为评论等级为5和2的店铺根据这些爽肤水的价格与销售额进行预测。并把这些数据进行分割,用这些数据的70%作为训练集,用于对该决策树模型进行模拟训练,剩下的30%作为测试集,用于根据之前用训练集训练模拟出来的模型对接下来的数据进行预测,从而实现决策树预测的算法。

图-不同等级销售额的分布图 

从上图中可以看出,随着评论等级的增加,销售的数量和销售额都有了明显的增加,因而可见商品的评论等级对销售的数量和销售额有着显著的影响,消费者更倾向于好评居多的商品。

 图-评论等级为5的价格与销售额的关系图 

图中红色的圆表示在这个价位上真实的销售额,而绿色的圆表示在该价位上根据训练集模拟出来的预测的销售额。

从上图中可以看出,评论等级为5的爽肤水的实际价格和通过决策树预测的价格都主要集中在400元以下的区间中,而评论等级为5的且价格较高的爽肤水的数量较少。

 图-评论等级为5的价格与销售额的关系图 

图中红色的圆表示在这个价位上真实的销售额,而绿色的圆表示在该价位上根据训练集模拟出来的预测的销售额。

从上图中可以看出,在评论等级为2的情况下,价格不仅在180元以下的区间内,而且销售额也不高,销售的爽肤水的数量也比较低。因而在评论比较差的情况下,消费者很少去购买这些商品。

基于决策树的价格预测

采用python模块sklearn包中的决策树回归算法,对选中的某高档和中档的产品在数据中的真实价格预测其相邻区间内的价格与销售额的变化关系,分析其定价是否合理。

 图-某高档产品销售额与价格预测曲线

上图中的虚线上的点表示在这个价位实际的销售额,我们在这个实际的销售额为中心点,取一定的区间长度,预测这一段区间的价格和销售额之间关系。图为我们对高端品牌Lancome/兰蔻中一个爽肤水产品的价格与销售额做的预测曲线,由上图可推测,当价格降低10元左右或者升高到190多时,其销售额会比原来定价时的销量要高很多。首先这个品牌的口碑应当是比较好的,当价格降低时,消费者会认为其性价比高,其销量也会上升。

图-某中档产品销售额与价格预测曲线

上图中的虚线上的点表示在这个价位实际的销售额,我们在这个实际的销售额为中心点,取一定的区间长度,预测这一段区间的价格和销售额之间关系。由图中可以看出,此产品原本定价在78元左右,销量一般。观察预测结果可以看出,当产品在82元的时候会有更加多的利润。

 图-中档产品销售额与价格预测曲线

上图中的虚线上的点表示在这个价位实际的销售额,我们在这个实际的销售额为中心点,取一定的区间长度,预测这一段区间的价格和销售额之间关系。图为某一低端大众品牌下的一款产品,通过观察预测曲线可知,其定价定在26元,拥有较好的销售额,但是当定价在28元左右的时候会有更加好的销售额,所以,我们推荐此款产品的定价为28元。

解决问题

通过以上分析,我们研究了价格,商家店铺等级,商品评论好坏程度对商品的销售量的影响。对于商品来说,评论等级对商品销售存在影响,评价较低的商品往往销售额也会较低,分析原因是因为用户在购买商品时会有查看商品评论的习惯。其次店铺的等级对商品的销售也存在影响,由于店铺等级过低,可能会得不到消费者的信任,致使购买的人数较少从而导致了销售额也比较低;对于价格来说,价格偏中段的护肤品销售额较高,符合大多数人的消费习惯。之后,通过价格和销量的关系,我们可以看出当确定了价格等级、商品评价后,在哪个价格区间中商品卖的较好,可以以此为依据为商家提供可以带来收益更大的商品的价格区间。最后,当确定了价格区间后,我们对特定的价格区间进行了预测处理,实现精确定价推荐。

作       者:山东科技大学-SSG

团队成员:刘金朔、万征征、李宇扬、褚立鹏

指导老师:孙琳、

近期长风大数据公众号将于每周一、三、五定期推出2017大数据分析专业竞赛作品赏析系列,评论里留下你想看到的作品,小编会努力满足你的要求哦

同时,竞赛的优秀作品集也在密集整理当中,想要获取免费赠送名额的小伙伴,点赞转发一下呗

声明:微信文章为独家原创,欢迎个人用户分享到朋友圈;其他任何形式的转载,请联系本公号取得授权,否则将追究法律责任。长风大数据(微信号:cf-dsj)隶属于Logis北京络捷斯特科技发展股份有限公司,简称:络捷斯特,证券代码:834832。

长风大数据(微信号:cf-dsj基于多行业的海量数据资源,为企业运营和院校科研提供先进的数据挖掘分析工具,帮助用户释放数据价值、捕获深层信息。

联系电话:010-65568598转8013

电子邮箱:cfdsj@logis.cn

网址:http://www.cfdsj.cn



长风大数据 一个有逼格的平台
长按,识别二维码,加关注

Copyright © 日本口红批发社区@2017