推公式到写代码-BASS模型求解
希望你能像看小说看杂文一样的心情看完这一系列,因为学习不总是枯燥的,希望像聊天一样娓娓道来。
专辑系列的阅读对象是那些懂些高等数学和线性代数,但没有经过编码训练的人。
前言
按照我们计划,第一章讲使用python求解bass模型的参数过程,得到模型参数后,就知道怎么使用bass模型解决现实问题了。在这一讲中,我不要求大家能看懂全部的代码,前面也说了,这里只是给大家提信息,希望能通过这一讲的内容引起大家的兴趣,同时让大家知道,只要不是大规模复杂性问题,求解这类问题还是很简单的,现成的工具就能解决,大家不要担心。
这一讲,我们的学习目标是:
1.了解python的基本用法。
2.了解最小二乘法求解参数
3.了解scipy的optimize
bass模型简介
下面关于bass模型简介摘自《双渠道供应链的优化与协调研究》刘铮,徐琪
bass模型最早是由美国Frank Bass提出,是一个用来预测消费品销售情况的模型,Bass模型对消费者购买新产品的决策时间进行了分析,它认为新产品的购买者受到外部或内部因素的影响,因此将新产品的潜在使用者分为两类,第一类称为创新群体,该群体易受外部影响,及大众媒体的影响,第二类称为模仿群体,易受到内部影响,即口碑的影响。模型的核心思想是创新群体群体的购买决策独立于社会系统其他成员,而模仿群体购买新产品的时间受到社会系统的影响,并且这种影响随购买人数增加而正价,因为模仿群体的购买决策时间受到社会系统成员的影响。
使用bass模型,省略推导过程,最终的形式如下,其中0<=p<=1
表示创新群体系数,0<=q<=1
表示模仿群体系数,m
为潜在购买量,n(t)
为当期销量。
从上面的公式可以看出,只要我们知道了
m,p,q
的值,就可以预测t+1
的销量了。
最小二乘求解参数
下面介绍最小二乘法求解参数。同样的,这是也是简介,因为我们假设阅读专辑的人是知道基本的高数以及线性代数的。
最小二乘的原理也很简单,就是找到几个参数值,比如上面的m,p,q
,使得计算出来的n(t)
值和实际值的误差最小。
定义:最小二乘法(又称最小平方法)是一种数学优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。
作用:利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
原则:以”残差平方和最小”确定直线位置(在数理统计中,残差是指实际观察值与估计值之间的差)
基本思路:对于一元线性回归模型, 假设从总体中获取了n组观察值(X1,Y1),(X2,Y2), …,(Xn,Yn),对于平面中的这n个点,可以使用无数条曲线来拟合。而线性回归就是要求样本回归函数尽可能好地拟合这组值,也就是说,这条直线应该尽可能的处于样本数据的中心位置。因此,选择最佳拟合曲线的标准可以确定为:使总的拟合误差(即总残差)达到最小。
参数求解
好了,经过前面的介绍,我们可以开始实用scipy的optimize进行参数求解了。还是那句话,第一讲就有这么多代码是有点突兀,没关系,我希望你能照着代码敲一边,有个初步印象,这一讲的目标就基本达到了。
# 最小二乘法
from math import e # 引入自然数e
import numpy as np # 科学计算库
import matplotlib.pyplot as plt # 绘图库
from scipy.optimize import leastsq # 引入最小二乘法算法
# 样本数据(Xi,Yi),需要转换成数组(列表)形式
ti = np.array([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
yi = np.array([8, 11, 15, 19, 22, 23, 22, 19, 15, 11])
# 需要拟合的函数func :指定函数的形状,即n(t)的计算公式
def func(params, t):
m, p, q = params
fz = (p * (p + q) ** 2) * e ** (-(p + q) * t) # 分子的计算
fm = (p + q * e ** (-(p + q) * t)) ** 2 # 分母的计算
nt = m * fz / fm # nt值
return nt
# 误差函数函数:x,y都是列表:这里的x,y更上面的Xi,Yi中是一一对应的
# 一般第一个参数是需要求的参数组,另外两个是x,y
def error(params, t, y):
return func(params, t) - y
# k,b的初始值,可以任意设定, 一般需要根据具体场景确定一个初始值
p0 = [100, 0.3, 0.3]
# 把error函数中除了p0以外的参数打包到args中(使用要求)
params = leastsq(error, p0, args=(ti, yi))
params = params[0]
# 读取结果
m, p, q = params
print('m=', m)
print('p=', p)
print('q=', q)
# 有了参数后,就是计算不同t情况下的拟合值
y_hat = []
for t in ti:
y = func(params, t)
y_hat.append(y)
# 接下来我们绘制实际曲线和拟合曲线
# 由于模拟数据实在太好,两条曲线几乎重合了
fig = plt.figure()
plt.plot(yi, color='r', label='true')
plt.plot(y_hat, color='b', label='predict')
plt.title('BASS model')
plt.legend()
参数求解(其他)
对Python熟悉的朋友,可以看看我写的另一篇文章《scipy数值优化与参数估计》[http://blog.csdn.net/suzyu12345/article/details/70046826 ],大致汇总了scipy的optimize数值优化和参数估计的常用方法,比如非线性最小二乘,l-bfgs,共轭梯度等等等,读书参数求解的经典方法。
讲到这里,这一篇就差不多讲完了,讲到这里,大家应该能明白基本的参数求解方法了。下一章,我们开始将python基础,会分几个小节来讲,包括Python基础,数值分析库numpy基础,数据分析库pandas基础。
我们下期再见。
Master苏
2017-12-2
参考:
最小二乘:https://www.cnblogs.com/lc1217/p/6514734.html
scipy数值优化与参数估计:http://blog.csdn.net/suzyu12345/article/details/70046826
网友评论