全球旧事资料 分类
矿脉分布的回归模型建立与选择
摘要
本文主要研究的是矿脉分布的模型建立,通过对已知数据的分析,作出散点图,然后建立合适的回归模型,如:线性模型、二次模型、双曲线模型、对数模型等。运用MATLAB软件,通过对建立模型的剩余标准差比较,选择出最合适的回归模型为二次模型。通过对论文的研究,熟悉MATLAB软件的应用以及在模型建立中对模型选择的认识。关键词:散点图回归模型剩余标准差
1
f一、问题重述
一矿脉有13个相邻样本点,人为地设定一原点,现测得各样本点对原点的距离x,与该样本点处某种金属含量y的一组数据如下(附录表21),画出散点图观测二者的关系,试建立合适的回归模型,如二次曲线、双曲线、对数曲线等。
二、问题分析
由于本问题中没有给出明确的模型选择,我们先画出其散点图,然后对其分析,建立合适的回归模型。从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些系数,只是它们的一个(点)估计,应该对它们作区间估计或假设检验,如果置信区间太大,甚至包含了零点,那么系数的估计值是没有多大意义的。另外也可以用方差分析方法对模型的误差进行分析,对拟合的优劣给出评价。具体地说,回归分析在一组数据的基础上研究这样几个问题:(1)建立因变量与自变量QUOTEx;(2)1x2LQUOTExmxm之间的回归模型(经验公式)对回归模型的可信度进行检验;(3)判断每个自变量对y的影响是否显著;(4)诊断回归模型是否适合这组数据;(5)利用回归模型对y进行预报或控制。
三、模型假设
假设各样本点对原点距离x测量无误。
四、模型建立
Matlab统计工具箱用命令regress实现多元线性回归,用的方法是最小二乘法,用法是:bregressYX
y1其中X,Y是按照QUOTEYMy2y1,QUOTEYM式排列的数据,b为y2
回归系数估计值为QUOTE0,1Lm利用通过MATLAB建立回归模型。
五、模型求解
结果比较通过对几个模型的比较可得,二次模型的剩余标准差最小。不过几个模型的差别很小。如表(31)
2
f线性模型01635
二次模型01213
双曲线模型01487
对数模型01324
结果分析第一个点的讨论。纵观四个模型,第一个点都属于异常点,需要剔除。但什么样的点必须剔除?对于这个问题,不合理的点固然要剔除,但同时点数的减少又将使得样本的容量变小,信度降低,这就需要使用者的判断。向本题中的第一个数据,很明显不符合任何模型,严重干扰回r
好听全球资料 返回顶部