研究生地理数学方法(实习) Part1电子表格 Excel 用实测残差频率计算累计值,用基于标准正态曲线计算的参考值计算预期累计频率,然 后以实测累计频率为横轴,以预期累计频率为纵轴,画出坐标图,图中的散点越是趋近于对 角线,表明残差越是接近正态分布(图1-3-14)。 紧0.8 ◆正态累计频率 0.6 一观测累计频率 0.4 0.2 0.5 观测累计频率 图1-3-14实测累计残差一预期累计残差坐标图 由于样本太小,本例的残差正态分布规律不明显,但与标准正态曲线对照可以看出,基 本的钟形对称特征还可以有所显示的。顺便说明,这里给出的残差频率分布图及其累计对照 图与SPSS给出的标准残差频率分布柱形图( histogram)以及正态概率图,在原理上是一样 的。不过SPSS在对残差进行标准化的过程中,进行了一些技术性的处理,与 Excel给出的 标准残差不一样,并且计算频率的间隔取法与本例也稍有差别,故其图形显示形态与图 1-3-13、图1-3-14不尽一致 §14预测分析 除了DW检验之外,各种统计检验都可以通过。由于样本点不足,DW检验不能十分 肯定地下结论。从残差图看来,模型的序列似乎并非具有较强的自相关性,因为残差分布比 较随机。因此,可望利用上述模型进行预测分析。现在假定:有人在1981年初(约为早春) 测得最大积雪深度为27.5米,他怎样预测当年(约为夏季)的灌溉面积? C 年份最大积雪深度x(米)灌溉面积仟千亩。计值 Coefficients 28.6 [Intercept 最大积雪深1.8129211 1973 1974 186 35.6 1975 26 48.9 1976 234 1977 13.5 29.2 1978 19.1
研究生地理数学方法(实习) Part1 电子表格 Excel 22 用实测残差频率计算累计值,用基于标准正态曲线计算的参考值计算预期累计频率,然 后以实测累计频率为横轴,以预期累计频率为纵轴,画出坐标图,图中的散点越是趋近于对 角线,表明残差越是接近正态分布(图 1-3-14)。 0 0.2 0.4 0.6 0.8 1 1.2 0 0.5 1 观测累计频率 预期累计频率 正态累计频率 观测累计频率 图 1-3-14 实测累计残差-预期累计残差坐标图 由于样本太小,本例的残差正态分布规律不明显,但与标准正态曲线对照可以看出,基 本的钟形对称特征还可以有所显示的。顺便说明,这里给出的残差频率分布图及其累计对照 图与 SPSS 给出的标准残差频率分布柱形图(histogram)以及正态概率图,在原理上是一样 的。不过 SPSS 在对残差进行标准化的过程中,进行了一些技术性的处理,与 Excel 给出的 标准残差不一样,并且计算频率的间隔取法与本例也稍有差别,故其图形显示形态与图 1-3-13、图 1-3-14 不尽一致。 §1.4 预测分析 除了 DW 检验之外,各种统计检验都可以通过。由于样本点不足,DW 检验不能十分 肯定地下结论。从残差图看来,模型的序列似乎并非具有较强的自相关性,因为残差分布比 较随机。因此,可望利用上述模型进行预测分析。现在假定:有人在 1981 年初(约为早春) 测得最大积雪深度为 27.5 米,他怎样预测当年(约为夏季)的灌溉面积?
研究生地理数学方法(实习) PartI 子表格 Excel 图1-4-1数据预备 下面给出Exce2000的操作步骤 (1)数据预备:在图1-2-6所示的回归结果中,复制回归参数(包括截距和斜率),然 后粘贴到图1-1-1所示的原始数据附近:并将1981年观测的最大积雪深度27.5写在1980年 之后(图1-4-1)。 (2)构造计算式:将光标至于图1-4-1所示的D2单元格中,按等于号“=”,点击F2 单元格(对应于截距a=2356…),按F4键——将相对单元格变成绝对单元格,按加号“+”, 点击F3单元格(对应于斜率b=1.812…),按F4键—将相对单元格变成绝对单元格,按 乘号“*”,点击B2单元格(对应于自变量x1),于是得到表达式“=$F$2+SF$3+B2”(图1-4-2) 相当于表达式 y1=a+b*x1, 回车,立即得到=299128,即1971年灌溉面积的计算值 年份最大积雪深度x(米)灌溉面积(千亩,计算值 officier 15.2 286=$F92+F3*B22.3564379 最大积雪深1.8129211 1973 21 186 35.6 1975 26 48.9 1976 234 977 13.5 29.2 1978 167 1979 24.0 46.7 a输入公式 6 C D EF 年份最大积雪深度x(米)灌溉面积(仟千亩。计值 15 286_2901283 ntercept2.3564379 1972 19.3 大积雪深1.8129211 1973 21.2 40.5 1975 264 48.9 1976 234 45.0 16.7 34 1979 24.0 46.7 b给出结果 图1-42根据回归模型构造计算式 (3)给出预测值:将十字光标置于D2单元格的右下角,当粗十字变成细十字填充柄 以后,按住鼠标左键,双击,或者往下一拉,各年份的灌溉面积的计算值立即出现,其中 1981年对应的D12单元格的数字52212即我们所需要的预测数据,即有
研究生地理数学方法(实习) Part1 电子表格 Excel 23 图 1-4-1 数据预备 下面给出 Excel2000 的操作步骤: (1)数据预备:在图 1-2-6 所示的回归结果中,复制回归参数(包括截距和斜率),然 后粘贴到图 1-1-1 所示的原始数据附近;并将 1981 年观测的最大积雪深度 27.5 写在 1980 年 之后(图 1-4-1)。 (2)构造计算式:将光标至于图 1-4-1 所示的 D2 单元格中,按等于号“=”,点击 F2 单元格(对应于截距 a=2.356…),按 F4 键——将相对单元格变成绝对单元格,按加号“+”, 点击 F3 单元格(对应于斜率 b=1.812…),按 F4 键——将相对单元格变成绝对单元格,按 乘号“*”,点击 B2 单元格(对应于自变量 x1),于是得到表达式“=$F$2+$F$3*B2”(图 1-4-2), 相当于表达式 1 * 1 yˆ = a + b x , 回车,立即得到 yˆ1 = 29.9128,即 1971 年灌溉面积的计算值。 a 输入公式 b 给出结果 图 1-4-2 根据回归模型构造计算式 (3)给出预测值:将十字光标置于 D2 单元格的右下角,当粗十字变成细十字填充柄 以后,按住鼠标左键,双击,或者往下一拉,各年份的灌溉面积的计算值立即出现,其中 1981 年对应的 D12 单元格的数字 52.212 即我们所需要的预测数据,即有
研究生地理数学方法(实习) Part1电子表格 Excel =52.212 千亩(图1-4-3)。 年份最大积雪深度x(米)濯溉面积y(千亩)计算值 Coefficients 1971 28.6 29912838 Intercept2.3564379 0.4 21210817最大积雪深18129211 1973 21.2 40.5 40.790365 18.6 35.6 36.07670 75 26.4 48950217554 176 45.0 4477879 1977 13 292 26830872 1978 32632220 45866543 19.1 374 36.983230 1981 275 52.211767 图1-43全部计算值包括预测值 (4)更多的预测:进一步地,如果可以测得1982年及其以后各年份的数据,输入单元 格B13及其下面的单元格中,在D13及其以下的单元格中,立即出现预测数值。例如,假 定1982年的最大积雪深度为x2=237米,可以算得12=45323千亩;假定1983年的最大 积雪深度为x13=157,容易得到j3=31.819千亩。其余依此类推(图1-4-4) D 年份最大积雪深度x(米)灌溉面积y(千亩)计算值 Coefficients 15,2 28 29.912838 Intercept23564379 1972 10 19321.210817最大积雪深18129211 1973 21.2 40.790365 186 35.6 36076770 26.4 48.9 50.217554 234 45.0 44.778791 26.830872 1978 167 1979 24.0 46.7 45.866543 36.983230 275 52.211767 1982 23.7 45.322667 1983 15.7 30.819299 49,12980L 1985 23.5 44.960083 图1-44更多的预测结果(1981-198) 实际上,对于本例,预测主要是针对当年。因为我们只有在当年早春,或者前年冬 年春的冬春之交观测出最大积雪深度,才能借助模型计算当年的春夏之交或者夏季的冰雪融 水灌溉面积。对于此后的积雪深度我们无法预知,除非借助更多的时间序列预测方法首先预 测出今后的积雪深度
研究生地理数学方法(实习) Part1 电子表格 Excel 24 yˆ11 = 52.212 千亩(图 1-4-3)。 图 1-4-3 全部计算值包括预测值 (4)更多的预测:进一步地,如果可以测得 1982 年及其以后各年份的数据,输入单元 格 B13 及其下面的单元格中,在 D13 及其以下的单元格中,立即出现预测数值。例如,假 定 1982 年的最大积雪深度为 x12=23.7 米,可以算得 yˆ12 = 45.323 千亩;假定 1983 年的最大 积雪深度为 x13=15.7,容易得到 yˆ13 = 31.819千亩。其余依此类推(图 1-4-4)。 图 1-4-4 更多的预测结果(1981-1985) 实际上,对于本例,预测主要是针对当年。因为我们只有在当年早春,或者前年冬、当 年春的冬春之交观测出最大积雪深度,才能借助模型计算当年的春夏之交或者夏季的冰雪融 水灌溉面积。对于此后的积雪深度我们无法预知,除非借助更多的时间序列预测方法首先预 测出今后的积雪深度
研究生地理数学方法(实习) Part1电子表格 Excel (5)快速预测计算:在 Excel I中,有一个函数可以用于基于线性关系的快速预报分析, 那就是 forecast,语法为: forecast(x, known y's, known x3s)。式中x为需要预测的数据点对 应的自变量(已知值), known y's为因变量数组或者数据区域, known x's为自变量数组或 者数据区域。给定x=27.5,对于如图1-1-1所示的数据分布,函数的具体表达如下图所示(图 1-4-5)。回车,立即得到y=52212,与前面的结果完全一样。 」EF 年份最大积雪深度x(米灌溉面积(千亩预测值 1971 15,2 28.6 1972 21.2 1974 18.6 35.6 1975 26.4 48.9 45.0 13.5 292 1978 16.7 1979 24.0 46.7 1981 275 forecast(l2, C2: Cll, B2: Blld a输入公式 D E 年份最大积雪深度x(米)灌溉面积y(千亩)预测值 1972 104 19.3 1973 21.2 40.5 1976 23 45.0 1977 13.5 29.2 1978 16.7 979 240 1980 374 1981 275 52.211767 b预测结果 图1-45利用预测函数进行快速计算的函数表达 那么,这是否意味着,如果仅仅进行线性趋势预测,不必如此繁琐地建立模型和开展回 归分析呢?显然不是。预测函数 forecast的内嵌原理,正是上面介绍的模型预测计算过程, 不过是将整个计算过程公式化了。如果我们不掌握上述建模预测方法,就根本不明白 forecast 的基本内涵。现在我们不仅知道 forecast的基本原理,而且知道它仅能用于线性预测。 我们进行简单的建模练习,主要是为了掌握有关的知识和技巧,为今后完成更为复杂的 研究任务奠定基础
研究生地理数学方法(实习) Part1 电子表格 Excel 25 (5)快速预测计算:在 Excel 中,有一个函数可以用于基于线性关系的快速预报分析, 那就是 forecast,语法为:forecast(x, known_y’s, known_x’s)。式中 x 为需要预测的数据点对 应的自变量(已知值),known_y’s 为因变量数组或者数据区域,known_x’s 为自变量数组或 者数据区域。给定 x=27.5,对于如图 1-1-1 所示的数据分布,函数的具体表达如下图所示(图 1-4-5)。回车,立即得到 y=52.212,与前面的结果完全一样。 a 输入公式 b 预测结果 图 1-4-5 利用预测函数进行快速计算的函数表达 那么,这是否意味着,如果仅仅进行线性趋势预测,不必如此繁琐地建立模型和开展回 归分析呢?显然不是。预测函数 forecast 的内嵌原理,正是上面介绍的模型预测计算过程, 不过是将整个计算过程公式化了。如果我们不掌握上述建模预测方法,就根本不明白 forecast 的基本内涵。现在我们不仅知道 forecast 的基本原理,而且知道它仅能用于线性预测。 我们进行简单的建模练习,主要是为了掌握有关的知识和技巧,为今后完成更为复杂的 研究任务奠定基础
研究生地理数学方法(实习) PartI电子表格Excl 第2章多元线性回归分析 多元线性回归分析是一元线性回归分析的推广,或者说一元线性回归分析是多元线性回 归分析的特例。掌握了一元线性回归分析,就不能学习多元线性回归分析方法了。利用 Excel 进行多元线性回归与一元线性回归的过程大体相似,操作上有些细节方面的微妙差别。不过, 对于多元线性回归,统计检验的内容相对复杂。下面以一个简单的实例予以说明 【例】某省工业产值、农业产值、固定资产投资对运输业产值的影响分析。通过产值的 回归模型,探索影响交通运输业的主要因素。我们想要搞清楚的是,在工业、农业和固定资 产投资等方面,究竟是哪些因素直接影响运输业的发展。薮据来源于李一智主编的《经济预 测技术》。原始数据来源不详。 §21多元回归过程 211常规分析 在 Excel中,多元线性回归大体上可以分为如下几个步骤实现 第一步,录入数据。结果如下图所示(图2-1-1) 1序号年份工业产值农业产值z固定资产投资运输业产值y 1970 57.822705 14.54 3.09 23456789 1971 58.05 28.89 1683 3.40 59.15 1973 63.83 35.23 12.87 3.90 1974 65.36 24.94 11.65 3.22 1975 67.26 32.95 12.87 3.76 1976 609230.35 1080 3.59 38.70 75.65 4799 14.71 4.34 80.57 54.18 17.56 12 1312 1981 80.52 59.85 18.67 504 1982 868 5 1514 1983 9548 7097 2506 6.01 16 1984 10971 81.54 29.69 7.03 1817 1986 138.89 103.23 48.90 10.83 1987 160.56 119.33 60.98 图2-1-1录入的原始数据 第二步,计算过程。比较简单,分为如下若干个步骤 (1)打开回归对话框。沿着主菜单的“工具(T)”→“数据分析(D)….”路径打开
研究生地理数学方法(实习) Part1 电子表格 Excel 26 第 2 章 多元线性回归分析 多元线性回归分析是一元线性回归分析的推广,或者说一元线性回归分析是多元线性回 归分析的特例。掌握了一元线性回归分析,就不能学习多元线性回归分析方法了。利用Excel 进行多元线性回归与一元线性回归的过程大体相似,操作上有些细节方面的微妙差别。不过, 对于多元线性回归,统计检验的内容相对复杂。下面以一个简单的实例予以说明。 【例】某省工业产值、农业产值、固定资产投资对运输业产值的影响分析。通过产值的 回归模型,探索影响交通运输业的主要因素。我们想要搞清楚的是,在工业、农业和固定资 产投资等方面,究竟是哪些因素直接影响运输业的发展。数据来源于李一智主编的《经济预 测技术》。原始数据来源不详。 §2.1 多元回归过程 2.1.1 常规分析 在 Excel 中,多元线性回归大体上可以分为如下几个步骤实现。 第一步,录入数据。结果如下图所示(图2-1-1)。 图 2-1-1 录入的原始数据 第二步,计算过程。比较简单,分为如下若干个步骤。 (1)打开回归对话框。沿着主菜单的“工具(T)”→“数据分析(D)…” 路径打开