地理数学方法(实习) Part1电子表格 Excel 132残差图的解析 回归结果中的图形包括残差图、线性拟合图以及正态概率图三种坐标图,下面注意解释。 (1)残差图( residual plot):以最大积雪深度x为横轴,以残差e为纵轴,作散点图, 可得残差图(图1-3-7)。这个图与Excl自动给出的残差图形完全一样:在图1-3-7的“残 差”选项中选中“残差图”,将在回归结果中自动生成此图。 最大积雪深度(米) Residual plot 3210 0.0 5.010.015.020.025.030.0 最大积雪深度(米) a残差图 最大积雪深度(米) Residual plot y R2=7E-30 3210023 0.5.010.015.020.025.030.0 最大积雪深度(米) b添加趋势线后的残差图 图1-3-7残差图 残差点列的分布越是没有趋势、没有规则,越是具有随机性,回归的结果就越是可靠 在图中添加趋势线并显示公式和R平方值,可见各种参数都近乎为0,这是残差没有趋势的 定量判据之 (2)线性拟合图:用最大积雪深度x为横轴,用灌溉面积y及其预测值ν为纵轴,作 散点图,可得线性拟合图(图1-3-8)。这个图与 Excel自动给出的线性拟合图也是一样的 在图1-2-3的“残差”选项中选中“线性拟合图”,将在回归结果中自动生成此图 预测值点列〔水红色方点)与原始数据点列(深蓝色菱点)匹配的效果越好,表明拟合
研究生地理数学方法(实习) Part1 电子表格 Excel 17 1.3.2 残差图的解析 回归结果中的图形包括残差图、线性拟合图以及正态概率图三种坐标图,下面注意解释。 (1)残差图(residual plot):以最大积雪深度 xi为横轴,以残差 ei 为纵轴,作散点图, 可得残差图(图 1-3-7)。这个图与 Excel 自动给出的残差图形完全一样:在图 1-3-7 的“残 差”选项中选中“残差图”,将在回归结果中自动生成此图。 最大积雪深度(米) Residual Plot -3 -2 -1 0 1 2 3 0.0 5.0 10.0 15.0 20.0 25.0 30.0 最大积雪深度(米) 残差 a 残差图 最大积雪深度(米) Residual Plot y = 7E-16x - 7E-15 R2 = 7E-30 -3 -2 -1 0 1 2 3 0.0 5.0 10.0 15.0 20.0 25.0 30.0 最大积雪深度(米) 残差 b 添加趋势线后的残差图 图 1-3-7 残差图 残差点列的分布越是没有趋势、没有规则,越是具有随机性,回归的结果就越是可靠。 在图中添加趋势线并显示公式和 R 平方值,可见各种参数都近乎为 0,这是残差没有趋势的 定量判据之一。 (2)线性拟合图:用最大积雪深度 xi 为横轴,用灌溉面积 yi及其预测值 i yˆ 为纵轴,作 散点图,可得线性拟合图(图 1-3-8)。这个图与 Excel 自动给出的线性拟合图也是一样的: 在图 1-2-3 的“残差”选项中选中“线性拟合图”,将在回归结果中自动生成此图。 预测值点列(水红色方点)与原始数据点列(深蓝色菱点)匹配的效果越好,表明拟合
研究生地理数学方法(实习) Part1电子表格 Excel 的效果越好。将代表预测值的方点连接起来,就可得到回归趋势线。 最大积雪深度(米) Line fit plot 60.0 50.0 ◆灌溉面积(千亩) 预测灌溉面积(千 10.0 0.0 0.010.020.030.0 最大积雪深度(米) 图1-38线性拟合图 (3)正态概率图:用图1-3-6中最右边两列数据——百分比排位和最大灌溉面积排序 结果——作散点图,可以得到 Excel所谓的正态概率图(图1-3-9)。这个图形与 Excel自动 给出的结果一样:在图1-2-3的“正态分布”选项中选中“正态概率图”,将在回归结果中 自动生成此图。 Normal Probability Plo 中感舞 0 0 20 40 60 80 100 Sample Percentile 图1-3-9正态概率图 图中点列分布应该接近于一条直线(确定型数据),或者围绕对角线呈现S形分布(随 机型变量)。当数据是有序递增或者递减序列(单调增加或者单调减少),正态概率图的点列 为直线分布,这意味着研究对象适合于线性模型的拟合。但是,对于随机变量,正态概率图 应该围绕对角线表现为奇对称的S形分布。如果数据点严重偏离对角线,分布于对角线的 侧,则有如下可能:其一,数据取样不足,应该考虑增加样品;其二,因变量不是随机变 量,没有典型或者特征尺度;其三,变量具有非线性性质,不宜采用线性模型拟合。经验表 明,第二、第三两种情况经常同时出现 补充几点说明如下。第一,多元线性回归与一元线性回归结果相似,只是变量数目m 18
研究生地理数学方法(实习) Part1 电子表格 Excel 18 的效果越好。将代表预测值的方点连接起来,就可得到回归趋势线。 最大积雪深度(米) Line Fit Plot 0.0 10.0 20.0 30.0 40.0 50.0 60.0 0.0 10.0 20.0 30.0 最大积雪深度(米) 灌溉面积(千亩) 灌溉面积(千亩) 预测 灌溉面积(千 亩) 图 1-3-8 线性拟合图 (3)正态概率图:用图 1-3-6 中最右边两列数据——百分比排位和最大灌溉面积排序 结果——作散点图,可以得到 Excel 所谓的正态概率图(图 1-3-9)。这个图形与 Excel 自动 给出的结果一样:在图 1-2-3 的“正态分布”选项中选中“正态概率图”,将在回归结果中 自动生成此图。 Normal Probability Plot 0 10 20 30 40 50 60 0 20 40 60 80 100 Sample Percentile 灌溉面积(千亩) 图 1-3-9 正态概率图 图中点列分布应该接近于一条直线(确定型数据),或者围绕对角线呈现 S 形分布(随 机型变量)。当数据是有序递增或者递减序列(单调增加或者单调减少),正态概率图的点列 为直线分布,这意味着研究对象适合于线性模型的拟合。但是,对于随机变量,正态概率图 应该围绕对角线表现为奇对称的 S 形分布。如果数据点严重偏离对角线,分布于对角线的 一侧,则有如下可能:其一,数据取样不足,应该考虑增加样品;其二,因变量不是随机变 量,没有典型或者特征尺度;其三,变量具有非线性性质,不宜采用线性模型拟合。经验表 明,第二、第三两种情况经常同时出现。 补充几点说明如下。第一,多元线性回归与一元线性回归结果相似,只是变量数目 m
研究生地理数学方法(实习) Part1电子表格 Excel ≠1,F值和t值等统计量与R值也不再等价,因而不能直接从相关系数计算出来。第二,利 用SPSS给出的结果与Exce也大同小异。当然,SPSS可以给出更多的统计量,如DW值。 在表示方法上,SPSS也有一些不同,例如 P Value(P值)用Sig.(显著性)代表,因为 者等价。也存在不少差别,例如正态概率图的表示方法。只要能够读懂 Excel的回归摘要, 就可以读懂SPSS回归输出结果的大部分内容。第三,关于图像的详细分析,可以参阅有关 资料,下面以残差分析为例进行说明进一步的图像分析。 首先,考察残差点列是否有95%以上落入2倍的标准误差带内。对于本例,样本点较 少,直接看标准误差数值即可。如果样本点很多,数点的方法就行不通了,最好作图观察。 以自变量或者观测值序号为横坐标,以标准残差为纵坐标,作散点图。只要绝大多数散点落 入-2~2范围内,就认为残差的变化范围没有问题。下面是以观测值序号为横轴、以标准残 差为纵轴画出的散点图,可以看到标准残差10%落入二倍的标准误差带(图1-3-10a) 湖0.5 类0 ·。 长-0.5 10 观测值序号 a标准残差图 残差 正二倍标准差 10▲负二倍标准差 观测值序号 b残差图 图1-3-10残差图和标准残差图 当然,也可以借助函数 stdev计算出非标准残差的标准差,然后将正负的二倍标准误差 添加到非标准化残差图中,效果一样,但作图过程要麻烦一些(图1-3-10b)。 其次,考察残差分布是否服从正态规律,为此要求作出残差频率分布的柱形图。首先
研究生地理数学方法(实习) Part1 电子表格 Excel 19 ≠1,F 值和 t 值等统计量与 R 值也不再等价,因而不能直接从相关系数计算出来。第二,利 用 SPSS 给出的结果与 Excel 也大同小异。当然,SPSS 可以给出更多的统计量,如 DW 值。 在表示方法上,SPSS 也有一些不同,例如 P Value(P 值)用 Sig.(显著性)代表,因为二 者等价。也存在不少差别,例如正态概率图的表示方法。只要能够读懂 Excel 的回归摘要, 就可以读懂 SPSS 回归输出结果的大部分内容。第三,关于图像的详细分析,可以参阅有关 资料,下面以残差分析为例进行说明进一步的图像分析。 首先,考察残差点列是否有 95%以上落入 2 倍的标准误差带内。对于本例,样本点较 少,直接看标准误差数值即可。如果样本点很多,数点的方法就行不通了,最好作图观察。 以自变量或者观测值序号为横坐标,以标准残差为纵坐标,作散点图。只要绝大多数散点落 入-2~2 范围内,就认为残差的变化范围没有问题。下面是以观测值序号为横轴、以标准残 差为纵轴画出的散点图,可以看到标准残差 100%落入二倍的标准误差带(图 1-3-10a)。 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 0 2 4 6 8 10 12 观测值序号 标准参差 a 标准残差图 -3 -2 -1 0 1 2 3 0 2 4 6 8 10 观测值序号 残差 残差 正二倍标准差 负二倍标准差 b 残差图 图 1-3-10 残差图和标准残差图 当然,也可以借助函数 stdev 计算出非标准残差的标准差,然后将正负的二倍标准误差 添加到非标准化残差图中,效果一样,但作图过程要麻烦一些(图 1-3-10b)。 其次,考察残差分布是否服从正态规律,为此要求作出残差频率分布的柱形图。首先
研究生地理数学方法(实习) PartI 子表格 Excel 借助函数maⅹ和min找出标准残差的最大值和最小值,然后在最大值和最小值之间划分出 适当的间距,考察落入各种间距范围内的残差点的数目,用这个数值除以样品数,就是残差 落入一定范围内的频率。间距不宜太大,否则看不出残差分布规律;也不可太小,否则将会 有很多间距范围内为0。对于本例,由于标准化残差都位于-2~2之间,不妨从-2到2划分 间距,间隔取0.5。为了快速算出每个间隔内出现了多少残差点,可以借助频数函数 frequency 其语法是: frequency(残差点的单元格范围,间距数的单元格范围)。对于如图1-3-11所示 数据,选定与间距数相同的单元格范围,输入公式“= FREQUENCY(D25D34,A37A45)” 然后同时按下Ctrl+ Shift+ Enter键,立即得到各个间距的残差点频数,容易检验其总和为 样品数,即m=10(图1-3-12) 24观测值奎面积(残差标准残差 129.91284-1.31284-0.98136 221.21082-1.91082-1.4286 340.79036-0.29036-0.21705 436.07677-0.47677-0.35639 550.217 64.778790.2212090.165356 726.830872.3691281.770947 832.632221.467781.097181 945.866540.8334570.623017 1036.983230.416770.31154 数目频率 = frequency(D25: D34, A37: A45D FREQUENCY(data_array, bins_array) 40 0.5 图1-3-11计算残差点的分布数 用各个间距内的残差点数除以样本数,得到频率。作为对照,借助标准正态概率密度分 布公式 f(x) 计算正态分布参考值(图1-3-12)。考虑到概率密度离散分布的归一性,不妨在函数前面乘 以1/2。当然,更精确的做法是对借助正态分布数据进行归一化处理
研究生地理数学方法(实习) Part1 电子表格 Excel 20 借助函数 max 和 min 找出标准残差的最大值和最小值,然后在最大值和最小值之间划分出 适当的间距,考察落入各种间距范围内的残差点的数目,用这个数值除以样品数,就是残差 落入一定范围内的频率。间距不宜太大,否则看不出残差分布规律;也不可太小,否则将会 有很多间距范围内为 0。对于本例,由于标准化残差都位于-2~2 之间,不妨从-2 到 2 划分 间距,间隔取0.5。为了快速算出每个间隔内出现了多少残差点,可以借助频数函数frequency。 其语法是:frequency(残差点的单元格范围,间距数的单元格范围)。对于如图 1-3-11 所示的 数据,选定与间距数相同的单元格范围,输入公式“=FREQUENCY(D25:D34,A37:A45)”, 然后同时按下 Ctrl+Shift+Enter 键,立即得到各个间距的残差点频数,容易检验其总和为 样品数,即 n=10(图 1-3-12)。 图 1-3-11 计算残差点的分布数 用各个间距内的残差点数除以样本数,得到频率。作为对照,借助标准正态概率密度分 布公式 2 2 2 1 ( ) x f x e − = π 计算正态分布参考值(图 1-3-12)。考虑到概率密度离散分布的归一性,不妨在函数前面乘 以 1/2。当然,更精确的做法是对借助正态分布数据进行归一化处理
地理数学方法(实习) Part1电子表格 Excel 「距数目频率正态参考线观测累计频率正态累计频率 0.027 0.121 0.213 0.176 0.199 0.5 0.588 0.176 0.1 0.1 0.065 0.950 0.027 0.977 合计 图1-3-12残差概率分布及其预期值的各种计算结果 以间距为横坐标,以频率为纵坐标,作出柱形图(图1-3-12a)。作为参照,可以通过自 定义类型中的线柱图作图法在坐标图中添加正态分布参考线(图1-3-13b)。 0.25 0.2 0.15 0.05 2-1.5-1-0.500.511.52 间距 a残差的频率分布图 0.2 数目 0.1 正态参考线 0.05 2-1.5-1-0.500.511.52 间距 b添加参考线的残差频率图 图1-3-13残差分布的概率密度柱形图
研究生地理数学方法(实习) Part1 电子表格 Excel 21 图 1-3-12 残差概率分布及其预期值的各种计算结果 以间距为横坐标,以频率为纵坐标,作出柱形图(图 1-3-12a)。作为参照,可以通过自 定义类型中的线柱图作图法在坐标图中添加正态分布参考线(图 1-3-13b)。 0 0.05 0.1 0.15 0.2 0.25 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 间距 频率 a 残差的频率分布图 0 0.05 0.1 0.15 0.2 0.25 -2 -1.5 -1 -0.5 0 0.5 1 1.5 2 间距 频率 数目 正态参考线 b 添加参考线的残差频率图 图 1-3-13 残差分布的概率密度柱形图