在网上看别人的经历
一 最小二乘法的基本原理
总的来说,近似函数与数据点相同(i=0,1,…,m)误差(i=0,1,…,m)常用的方法有三种:一是误差(i=0,1,…,m)绝对值的最大值,即误差 向量的∞—范数;二是误差绝对值的和,即误差向量r的1-范数;三是误差平方和的算术平方根,即误差向量r的2-范数;前两种方法简单自然,但微分操作不方便 ,后一种方法相当于考虑 2-范数的平方,此误差平方常用于曲线拟合 度量误差(i=0,1,…,m)整体大小。
具体的数据拟合方法是:给定数据 (i=0,1,…,m),在取定函数类中,请求误差(i=0,1,…,m)平方和最小,即
=
从几何意义上说,它是寻求和给定点(i=0,1,…,m)距离平方和最小曲线(图6-1) 求拟合函数的方法称为曲线拟合的最小二乘法。
函数类在曲线拟合中有不同的选择方法.
6—1
二 多项式拟合
假设给定数据点(i=0,1,…,m),对于所有次数不超过的多项式函数类,现在求一,使得
(1)
拟合函数为多项式时,称为多项式拟合,满足式(1)称为最小二乘拟合多项式。特别是,当n=1时,称为线性拟合或直线拟合。
显然
因此,上述问题是为了寻求极值 问题。获得多元函数求极值的必要条件
(2)
即
(3)
(3)是关于线性方程组,用矩阵表示
(4)
(3)或(4)称为正规方程组或法方程组。
可以证明方程组(4)系数矩阵是对称正定矩阵,因此存在唯一的解决方案。从公式(4)中解决(k=0,1,…,n),从而获得多项式
(5)
可以证明,公式(5)中的满足公式(1)是所需的拟合多项公式。我们记录了最小二乘拟合多项公式的平方误差
由式(2)可得
(6)
多项拟合的一般方法可概括为以下步骤:
(1) 函数粗略的图形-散点图由已知数据绘制,以确定拟合多项式的次数n;
(2) 列表计算和;
(3) 写正规方程组,求出;
(4) 写拟合多项式。
在实际应用中,或;当时所得的拟合多项式就是拉格朗日或牛顿插值多项式。
例1 在温度下测量铜线(℃)当电阻如表6-1时,电阻R和温度 T近似函数关系。
i
0
1
2
3
4
5
6
(℃)
19.1
25.0
30.1
36.0
40.0
45.1
50.0
76.30
77.80
79.25
80.80
82.35
83.90
85.10
解开散点图(图6-2),可见测得的数据接近一条直线,所以取n=1.拟合函数为
列表如下
i
0
19.1
76.30
364.81
1457.330
1
25.0
77.80
625.00
1945.000
2
30.1
79.25
906.01
2385.425
3
36.0
80.80
1296.00
2908.800
4
40.0
82.35
1600.00
3294.000
5
45.1
83.90
2034.01
3783.890
6
50.0
85.10
2500.00
4255.000
245.3
565.5
9325.83
20029.445
常规方程组为
解方程组得
故得R与T拟合线为
铜线的电阻值可以通过上述关系类型来预测。例如,由R=0得T=-242.5.预测温度T=-242.5℃铜线无电阻。
6-2
已知实验数据如下表所示
i
0
1
2
3
4
5
6
7
8
1
3
4
5
6
7
8
9
10
10
5
4
2
1
1
2
3
4
试用最小二乘法求其二次拟合多项式。
拟合曲线方程的解设为
列表如下
I
0
1
10
1
1
1
10
10
1
3
5
9
27
81
15
45
2
4
4
16
64
256
16
64
3
5
2
25
125
625
10
50
4
6
1
36
216
1296
6
36
5
7
1
49
343
2401
7
49
6
8
2
64
512
4096
16
128
7
9
3
81
729
6561
27
243
8
10
4
100
1000
10000
40
400
53
32
381
3017
25317
147
1025
获得正规方程组
解得
因此,拟合多项式为
*三 最小二乘拟合多项式的存在是唯一的
定理1设置节点互异,法方程组(4)的解存在是唯一的。
克莱姆法则证明了方程组(4)系数矩阵是非奇怪的。
如果方程组(4)系数矩阵奇怪,则相应的齐次方程组
(7)
非零解。类型(7)可写为
(8)
乘以将式(8)中的第j方程(j=0,1,…,n),然后是新的n 方程的左右两端分别有一个方程 相加,得
因为
其中
所以
(i=0,1,…,m)
多项式,次数不超过n,有m 1>n一个不同的零点,由代数基本定理,必须有,与齐次方程组有非零解假设矛盾。所以正规方程组(4)必须有唯一的解决方案 。定理2是正规方程组(4)的解决方案,是满足型(1)最小二乘拟合多项式。
证书只需要证明,恒有是由任何组数组成的多项式
即可。
因为(k=0,1,…,n)是正规方程组(4)的解,所以满意度(2),所以有
因此,最小二乘拟合多项式。
*克服正规方程组病态的四多项拟合
在多项拟合中,当多项拟合的次数较高时,其正规方程组往往是病态的。而且
①正规方程组系数矩阵的阶数越高,病态越严重;
②拟合节点分布的区间偏离原点越远,病态越严重;
③(i=0,1,…,m)的数量级相差越大,病态越严重。
为了克服以上缺点,一般采用以下措施:
①尽量少作高次拟合多项式,而作不同的分段低次拟合;
②不使用原始节点作拟合,将节点分布区间作平移,使新的节点关于原 点对称,可大大降低正规方程组的条件数,从而减低病态程度。
平移公式为:
(9)
③对平移后的节点(i=0,1,…,m),再作压缩或扩张处理:
(10)
其中,(r是拟合次数)(11)
经过这样调整可以使的数量级不太大也不太小,特别对于等距节点,作式(10)和式(11)两项变换后,其正规方程组的系数矩阵设 为A,则对1~4次多项式拟合,条件数都不太大,都可以得到满意的结果。
变换后的条件数上限表如下:
拟合次数
1
2
3
4
=1
<9.9
<50.3
<435
④在实际应用中还可以利用正交多项式求拟合多项式。一种方法是构造离散正交多项式;另一种方法是利用切比雪夫节点求出函数值后再使用正交多项式。这两种方法都使正规方程 组的系数矩阵为对角矩阵,从而避免了正规方程组的病态。我们只介绍第一种,见第三节。
例如 m=19,=328,h=1, =+ih,i=0,1,…,19,即节点 分布在[328,347],作二次多项式拟合时
① 直接用构造正规方程组系数矩阵,计算可得
严重病态,拟合结果完全不能用。
② 作平移变换
用构造正规方程组系数矩阵,计算可得
比降低了13个数量级,病态显著改善,拟合效果较好。
③ 取压缩因子
作压缩变换
用构造正规方程组系数矩阵,计算可得
又比降低了3个数量级,是良态的方程组,拟合效果十分理想。
如有必要,在得到的拟合多项式中使用原来节点所对应的变量x,可写为
仍为一个关于x的n次多项式,正是我们要求的拟合多项式。