1.线性最小二乘法
曲线拟合问题的提法是,已知一组(二维)数据,即平面上的个点,,互不相同,寻求一个函数(曲线)使在某种准则下与所有数据点最为接近,即曲线拟合得最好。
线性最小二乘法是解决曲线拟合最常用的方法,基本思路是,令:
其中是事先选定的一组线性无关的函数,是待定系数。拟合准则是使,与的距离 的平方和最小,称为最小二乘准则。
1.1.系数的确定
记:
为求使达到最小,只需利用极值的必要条件,得到关于的线性方程组:
即:
记:
方程组(2)可表为:
当线性无关时,列满秩,可逆,于是方程组(3)有唯一解:
1.2.函数的选取
面对一组数据,用线性最小二乘法作曲线拟合时,首要的、也是关键的一步是恰当地选取容易确定。若无法知道与之间的关系,通常可以将数据作图,直观地判断应该用什么样的曲线去作拟合。人们常用的曲线有:
(1)直线:
(2)多项式:(一般,不宜太高)
(3)双曲线(一支):
(4)指数函数:
对于指数曲线,拟合前需作变量代换,化为对的线性函数。
已知一组数据,用什么样的曲线拟合最好,可以在直观判断的基础上,选几种曲线分别拟合,然后比较,看哪条曲线的最小二乘指标最小。
2.最小二乘法的Matlab实现
2.1.解方程组方法
在上面的记号下,
Matlab中的线性最小二乘的标准型为:
命令为:
例1 用最小二乘法求一个形如的经验公式,使它与下表所示的数据拟合。
19 | 25 | 31 | 38 | 44 | |
---|---|---|---|---|---|
19.0 | 32.3 | 49.0 | 73.3 | 97.8 |
解:编写程序如下
x=[19 25 31 38 44]';
y=[19.0 32.3 49.0 73.3 97.8]';
r=[ones(5,1),x.^2];
ab=r\y%求出最小二乘的系数
x0=19:0.1:44;
y0=ab(1)+ab(2)*x0.^2;
plot(x,y,'o',x0,y0,'r')
这里没有用任何函数,笔者也是第一次知道反斜杠可以直接算出最小二乘算法的系数。
2.2.多项式拟合方法
如果取,即用次多项式拟合给定数据,Matlab中有现成的函数:
a=polyfit(x0,y0,m)
其中输入参数为要拟合的数据,为拟合多项式的次数,输出参数为拟合多项式的系数
例2 某乡镇企业 1990-1996 年的生产利润如下表
年份 | 1990 | 1991 | 1992 | 1993 | 1994 | 1995 | 1996 |
---|---|---|---|---|---|---|---|
利润(万元) | 70 | 122 | 144 | 152 | 174 | 196 | 202 |
试预测1997年和1998年的利润:
解:做已知数据的散点图:
x0=[1990 1991 1992 1993 1994 1995 1996];
y0=[70 122 144 152 174 196 202];
plot(x0,y0,'*')
发现该乡镇企业的年生产利润几乎直线上升。因此,我们可以用作为拟合函数来预测该乡镇企业未来的年利润。编写程序如下:
x0=[1990 1991 1992 1993 1994 1995 1996];
y0=[70 122 144 152 174 196 202];
a=polyfit(x0,y0,1)
y97=polyval(a,1997)
y98=polyval(a,1998)
求得,预测1997年的利润为233.4286万元,1998年的生产利润是253.9286元。
网友评论