这是因为 ∑=∑(a+b)=a+b ∑ x =a+bx=y t=1 中于是SR=∑(-)就是,,…,这n个数的偏差 出平方和它描述了角,2分散程度 S=∑(,-y)2=∑[a+bx1-(a+b t=1 ∑b(x-x)2=b2∑(x,-x) 王*由此可见元,,的分散性来源于xx2x 午的分散性并且是通过x对的线性相关系引起的 上圆國回
x a bx y n a b a b n y n n t t n t t n t t = + = + = + = = = = ˆ ˆ 1ˆ ) ˆ ˆ (ˆ 1 ˆ 1 1 1 1 这是因为 . ˆ , ˆ ,..., ˆ . ( ˆ ) ˆ , ˆ ,..., ˆ 1 2 1 2 1 2 平方和它描述了 的分散程度 于是 就是 这 个数的偏差 n n n t R t y y y S y y y y y n = = − = = = = = − = − = − = + − + n t t t n t n t t n t R t b x x b x x S y y a bx a bx 1 2 2 2 1 2 1 2 1 2 ( ) ˆ ( ) ˆ )] ˆ ( ˆ ˆ ( ˆ ) [ ˆ , . , ˆ , ˆ ,..., ˆ , ,..., 1 2 1 2 的分散性 并且是通过 对 的线性相关关系引起的 由此可见 的分散性来源于 x Y y y y x x x n n
而∑(x1-x)就是x1,x2…,x,这n个数的偏差 t=1 c平方和记作S它描述了x,x2,x的分散程度 工 SE=∑(-)=∑[y-(a+bx,)2=9(ab)就是 Q(a,b舶的最小值,称为残差平方和 由上面的分析可知,y12y2,yn分散程度可以分解 为两部分S1SR+SE,其中一部分是通过x对于Y的线 性相关关系而引起的Y的分散性另一部分是剩余 部分引起的Y的分散性 上或
, . , ,..., . ( ) , ,..., 1 2 1 2 1 2 平方和 记作 它描述了 的分散程度 而 就是 这 个数的偏差 xx n n n t t S x x x x x x x x n = − ( , ) , . ) ˆ )] ( ˆ, ˆ ( ˆ ) [ ( ˆ 1 2 1 2 的最小值 称为残差平方和 就是 Q a b S y y y a bx Q a b n t t t n t E = t − t = − + = = = • 由上面的分析可知,y1 ,y2 ,…yn分散程度可以分解 为两部分ST=SR+SE ,其中一部分是通过x对于Y的线 性相关关系而引起的Y的分散性,另一部分是剩余 部分引起的Y的分散性
王 ·现在来回答x,Y之间是否存在线性相关关系的 问题不难想到把回归平方和S与剩余平方和Ss 进行比较即在数理统计中选取统计量 F= R Sr/(n-2) E 王来体现与Y的线性相关系的相对大小若F值相 当大则表明x对Y的线性影响较大这时可以认为x 上与Y之间有线性相关关系反之若F值较小则没有 c理由认为x与Y之间有线性相关关系 上或
• 现在来回答x,Y之间是否存在线性相关关系的 问题.不难想到把回归平方和SR与剩余平方和SE 进行比较.即在数理统计中,选取统计量 /( − 2) = S n S F E R 来体现x与Y的线性相关关系的相对大小.若F值相 当大,则表明x对Y的线性影响较大,这时可以认为x 与Y之间有线性相关关系.反之,若F值较小,则没有 理由认为x与Y之间有线性相关关系
衡量F值的大小需要有一个定量的界限可以证 明在假定 YI a+bx te Y2=a+bx2+82 Y +bx+8 n 下,此定量界限F就是自由度为1,n-2的F分布的 上临界值,其中e12,,m服从N(03的独立随机 变量 上或
衡量F值的大小需要有一个定量的界限.可以证 明在假定 Y1=a+bx1+ε1 Y2=a+bx2+ε2 … … … … Yn =a+bxn+εn 下,此定量界限F就是自由度为1,n-2的F分布的 临界值,其中ε1 ,ε2 ,…,εn服从N(0,σ2 )的独立随机 变量
§14数学模型与相关性检验 F值究竞多大才能认为x与Y之间有线性相关关 系呢?为此对数据结构提出下列假定 Y1=a+bx1+81 2=a+bx2+82 Yn=a+bxn+an 其中81,e2,,En服从N(0,o3)的独立随机变量 判断x与Y之间是否有线性相关关系,就是要检 验假设 H:b=0 上或
§1.4 数学模型与相关性检验 • F值究竟多大才能认为x与Y之间有线性相关关 系呢?为此对数据结构提出下列假定: Y1=a+bx1+ε1 Y2=a+bx2+ε2 … … … … Yn =a+bxn+εn 其中ε1 ,ε2 ,…,εn服从N(0,σ2 )的独立随机变量. • 判断x与Y之间是否有线性相关关系,就是要检 验假设 H0 :b=0