精品文档
第6章曲线拟合的最小二乘法
61拟合曲线
通过观察或测量得到一组离散数据序列
,当所得数据比较准确时,
可构造插值函数逼近客观存在的函数
,构造的原则是要求插值函数通过这些
数据点,即
。此时,序列
与
是相等的。
如果数据序列
,含有不可避免的误差(或称“噪音”),如图61
所示;如果数据序列无法同时满足某特定函数,如图62所示,那么,只能要求所做逼近函
数最优地靠近样点,即向量
与
的
误差或距离最小。按与之间误差最小原则作为“最优”标准构造的逼近函数,称为拟合函数。
图61含有“噪声”的数据精品文档
f精品文档
图62一条直线公路与多个景点插值和拟合是构造逼近函数的两种方法。插值的目标是要插值函数尽量靠近离散点;拟合的目标是要离散点尽量靠近拟合函数。
向量与之间的误差或距离有各种不同的定义方法。例如:
用各点误差绝对值的和表示:
用各点误差按模的最大值表示:
用各点误差的平方和表示:
或
(61)
其中称为均方误差,由于计算均方误差的最小值的方法容易实现而被广泛采用。按均方误差达到极小构造拟合曲线的方法称为最小二乘法。本章主要讲述用最小二乘法构造拟合曲线的方法。
在运筹学、统计学、逼近论和控制论中,最小二乘法都是很重要的求解方法。例如,它是统计学中估计回归参数的最基本方法。
精品文档
f精品文档
关于最小二乘法的发明权,在数学史的研究中尚未定论。有材料表明高斯和勒让德分别独立地提出这种方法。勒让德是在1805年第一次公开发表关于最小二乘法的论文,这时高斯指出,他早在1795年之前就使用了这种方法。但数学史研究者只找到了高斯约在1803年之前使用了这种方法的证据。
在实际问题中,怎样由测量的数据设计和确定“最贴近”的拟合曲线?关键在选择适当的拟合曲线类型,有时根据专业知识和工作经验即可确定拟合曲线类型;在对拟合曲线一无所知的情况下,不妨先绘制数据的粗略图形,或许从中观测出拟合曲线的类型;更一般地,对数据进行多种曲线类型的拟合,并计算均方误差,用数学实验的方法找出在最小二乘法意义下的误差最小的拟合函数。
例如,某风景区要在已有的景点之间修一条规格较高的主干路,景点与主干路之间由各
具特色的支路联接。设景点的坐标为点列
;设主干路为一条直线
,即拟合函数是一条直线。通过计算均方误差(见图62)。
最小值而确定直线方程
线性拟合
62线性拟合和二次拟合函数
给定一组数据
,做拟合直线
,均方误差为r