引言
随着网络时代的发展,在线购物已经成为人们日常生活必不可少的一部分,电子商务技术近年来已经发展的十分完善,诸如阿里,京东,亚马逊,eBay等都是靠着电子商务起步。在线购物必然产生着海量的交易数据,这些海量的数据(数据杂 数据多)已经不能像以前一样交给人来处理,海量数据使人工处理不具可行性。商品利润等于商品价格与其销量之积减去成本,商品的交易成功与否首先在于它的价格,同一类型的商品,在其他条件(口碑,质量,品牌影响力等)差距不大的情况下,价格越低,销量越多。但是价格的降低可能导致利润降低,于企业经营的不利。而价格过高时,销量自然减少,同样不利于企业的发展。基于此,我们提出了一种基于电商数据的商品价格管理系统的设计方案,凭借计算机处理大量的电商交易数据来给商品定价提供一定的价格参考。
关键词
电商数据 价格管理 数据建模
数据挖掘
我们这里使用的数据集是通过爬虫抓取的淘宝服装交易数据,每条数据里包含品牌、商品描述、颜色、尺寸、大小、价格及销量等信息。
- 数据预处理
在我们的数据里,有销量为0的数据,销量为0对价格预测没有任何意义,所以我们过滤掉了这些数据并对数据做了一些其他的规整化处理。 -
数据可视化
我们先直观感受一下某些商品数据的价格和销量的分布情况
T shirt.jpg
knitting shirt.jpg
suit.jpg
以T shirt为例,由于数据过去密集,我们将数据集中的地方进行局部放大再次观察
T shirt enlarged.jpg
模型
a | b |
---|---|
0.00735377 | -0.12423986 |
非线性回归
在实际数据中,一个价格x可能会对应多个销量y1,y2,y3等等,为了模型的简单,先假设销量仅与价格有关,即一个x对应一个y,所以我们要先将一个价格x所对应销量yi(i=1,2,3...)求和并取其平均值。以T shirt为例,简化后的数据分布如下:
Simplified T shirt.jpg
双曲函数
y = x/(ax+b)
双曲函数曲线图如图所示:
据此模型对数据进行拟合后,得出
Curve fit Data.jpg
此时
a | b |
---|---|
0.00735377 | -0.12423986 |
对其进行R平方误差分析R2=0.76,说明数据拟合有一定的合理性和正确性
此时,我们得到了形如y = x/(ax+b)的函数关系式,当给予一个x,会得出一个y,
结论与改进
在本论文中,我们实现了给定的价格区间的商品销量区间的预测,并且将能够对商品定价指导提供一定的指导。
这里只是简单的考虑了商品价格和销量的关系,实际情况中,商品的品牌,大小,颜色等都会影响销量,一种解决办法是,在原有模型的基础上,再以特定的某种品牌,某种大小等数据为分析对象,再次进行建模。
参考文献
《机器学习实战》
网友评论