第一节回归模型 回归分析是研究随机现象中变量之间关系的一种数理统计方法。它的 主要内容是:从一组数据出发,确定这些变量间的关系式,对这些关系式 的可信程度进行统计检验,从影响一个量的许多变量中,判断哪些变量的 影响是显著的,哪些是不显著的,寻找具有较好统计性质的回归设计,利 用所求得的关系式进行预报和控制。 、一元线性回归模型 元回归分析是处理随机变量y和变量x之间关系的一种方法,即通 过分析数据,找出变量x和y间的一种关系。如果两个变量的关系是线性 的,那就是一元线性回归分析所研究问题。 图5-1散点图 那么,怎样建立一元线性回归的数学模型呢? 首先,把观察得到的n对数据(x1,y1),(x2,y2),…,(xm,yn)表示 在平面直角坐标系(图5-1)中,考察这些点的大致分布情况,如果这些 点之间近似存在着线性关系y=a+bx,那么,由最小二乘法可得 b 而 其中 Xi, y 这样回归方程=a+bx也就确定了
第一节 回归模型 回归分析是研究随机现象中变量之间关系的一种数理统计方法。它的 主要内容是:从一组数据出发,确定这些变量间的关系式,对这些关系式 的可信程度进行统计检验,从影响一个量的许多变量中,判断哪些变量的 影响是显著的,哪些是不显著的,寻找具有较好统计性质的回归设计,利 用所求得的关系式进行预报和控制。 一、一元线性回归模型 一元回归分析是处理随机变量 y 和变量 x 之间关系的一种方法,即通 过分析数据,找出变量 x 和 y 间的一种关系。如果两个变量的关系是线性 的,那就是一元线性回归分析所研究问题。 那么,怎样建立一元线性回归的数学模型呢? 首先,把观察得到的 n 对数据(x1,y1),(x2,y2),…,(xn,yn)表示 在平面直角坐标系(图 5-1)中,考察这些点的大致分布情况,如果这些 点之间近似存在着线性关系 y=a+bx,那么,由最小二乘法可得
如果令 Xiy 那么b 通过最小二乘法获得的回归直线=a+6x是否比较客观地符合变 量 x和y之间的规律,即y和x是否显著地存在线性关系呢?这可以用 F检验进行方差分析。具体的方法是:设回归值 与算术半均数y的偏差半方和为B,观祭值y与回归值的偏差平方和 为 (1-)2=1x-bl 作统计量 S/(n-2 如果在给定显著性水平a下,有 P{F≤F。(1,n-2)}=1-a, 于是有1一α的把握确定回归直线的显著性。否则,在给定显著性水 平a下,回归不显著,即变量x和y的线性关系不显著。 多元线性回归模型
量 x 和 y 之间的规律,即 y 和 x 是否显著地存在线性关系呢?这可以用 F 方和 为 S 剩, 则 如果在给定显著性水平α下,有 P{F≤Fα(1,n-2)}=1-α, 于是有 1-α的把握确定回归直线的显著性。否则,在给定显著性水 平α下,回归不显著,即变量 x 和 y 的线性关系不显著。 二、多元线性回归模型
对于一元以上的线性回归,这里先讨论二元线性回归。设随机变量y 和另外两个变量x1和x2近似存在线性关系 y=a+blx1tb2X2 由最小二乘法61,62满足 nb1+12b2=120 而a=一611-b2 其中 kent (x1-x1)2,12 x2 (x1-x1)( (x121)(y1-y) 同样可以讨论二元以上的线性回归。为了书写简便,可以用矩阵的形 式来表示回归系数。设随机变量y与另外p个变量x1,x2,x3,…,xp近 似存在线性关系 y=Bo+B1x+B2x2+…+βpxp, 经过n次试验,得到数据组(y,x,x2,…,xp)(i=1,2,…,n)。 这就有 B0+阝1x1+阝 … y2=即。+B2+B2x2+…+, 阝0+β1xa1+阝2xa+…+阝
对于一元以上的线性回归,这里先讨论二元线性回归。设随机变量 y 和另外两个变量 x1和 x2近似存在线性关系 y=a+b1x1+b2x2, 同样可以讨论二元以上的线性回归。为了书写简便,可以用矩阵的形 式来表示回归系数。设随机变量 y 与另外 p 个变量 x1,x2,x3,…,xp近 似存在线性关系 y=β0+β1x1+β2x2+…+βpxp, 经过 n 次试验,得到数据组(yi,xi1,xi2,…,xip)(i=1,2,…,n)。 这就有
11x12… 如果令x=:.x2m2“2 &nI 2n2 上述方程组就可以写成Y=Xβ。经过矩阵的运算,并运用最小二乘 法 若|xx|≠0,可得阝=(xx)-1xry,其中x为x的转置矩阵, (XxX)-<>是Ⅹ的逆矩阵。 二元线性回归也可以用矩阵的形式来表示。设 y=Bo+β+B2X2, z11x1 y 于是 n XilI ∑x
上述方程组就可以写成 Y=Xβ。经过矩阵的运算,并运用最小二乘 法, (XTX)-1 <>是 XTX 的逆矩阵。 二元线性回归也可以用矩阵的形式来表示。设 y=β0+β1x1+β2x2, 于是
这就可以求出=(xx)-1xrY 在数据处理过程中,两个或两个以上变量之间的回归关系,并非总是 线性的。这时,选择恰当类型的曲线比直线更符合实际情况。但在许多情 况下,非线性回归可以通过某些简单的变量变换,转化为线性回归。例如, 假设变量y和ⅹ之间有关系式y=Boe",只要两边取对数,并令y′=hy, o=Inβ0,就可以将上述非线性回归问题转化为线性回归问题。 三、回归模型在教学评估中的应用举例 1.同一学科成绩的一元线性回归分析 从一组学生某学科的平时成绩与期中考试成绩或两次不同考试的成 绩,分析这组学生学习该学科的水平状况,便是一元线性回归模型在教学 评估中的一个应用 例如,从某班随机抽取15名学生两个学期的数学期末考试成绩如表 5-1(x、y分别表示第一学期、第二学期的期末成绩),下面用一元线性回 归进行分析。 表5-115名学生数学期末考试成装 学生编号12345678910112131415总和 60877481936894 72688966121150 786?7214651104 (x1-2)(y1-y) 由于 =072 (x1-2)2∑(1-)2 所以,这组学生的成绩相关。根据一元线性回归计算方法,得 x1=1150,∑y1=1104 x2=89954,∑y1=82620, x=85757,1x=17873
在数据处理过程中,两个或两个以上变量之间的回归关系,并非总是 线性的。这时,选择恰当类型的曲线比直线更符合实际情况。但在许多情 况下,非线性回归可以通过某些简单的变量变换,转化为线性回归。例如, 假设变量 y 和 x 之间有关系式 y=β0 eβx,只要两边取对数,并令 y′=lny, β′0=lnβ0,就可以将上述非线性回归问题转化为线性回归问题。 三、回归模型在教学评估中的应用举例 1.同一学科成绩的一元线性回归分析 从一组学生某学科的平时成绩与期中考试成绩或两次不同考试的成 绩,分析这组学生学习该学科的水平状况,便是一元线性回归模型在教学 评估中的一个应用。 例如,从某班随机抽取 15 名学生两个学期的数学期末考试成绩如表 5-1(x、y 分别表示第一学期、第二学期的期末成绩),下面用一元线性回 归进行分析。 所以,这组学生的成绩相关。根据一元线性回归计算方法,得