多元回归分析所要求的条件 ·LINE ·样本量要求:一般样本含量要求是参与分析的变 量(自变量+因变量)个数的5~10倍,对多元线性 回归甚至要求20倍(粗略估计)
多元回归分析所要求的条件 • LINE • 样本量要求:一般样本含量要求是参与分析的变 量(自变量+因变量)个数的5~10倍,对多元线性 回归甚至要求20倍(粗略估计)
数据准备一数据格式 编号X X X X X12 . X . X 2 X21 X22 X a i X X Ki X K2 Ai a 注:编号i=1,2.,n:变量的j=1,2,.,m
数据准备-数据格式
数据准备-随机缺失的处理 ·不完全数据样品:1个样品中有一个或几个变量值缺失。 “缺失”分为非随机缺失、随机缺失。 随机缺失的处理 ·样本含量大,不完全数据样品小,删除该样品: ·样本含量小,需利用不完全数据样品 ※用该变量的均数值代替: ※缺失值变量与其他变量相关程度大,则建立该缺失 变量与其他变量的回归方程,据此推算缺失值; ※其他处理办法
数据准备-随机缺失的处理 • 不完全数据样品:1个样品中有一个或几个变量值缺失。 “缺失”分为非随机缺失、随机缺失。 随机缺失的处理 • 样本含量大,不完全数据样品小,删除该样品; • 样本含量小,需利用不完全数据样品 ※ 用该变量的均数值代替; ※ 缺失值变量与其他变量相关程度大,则建立该缺失 变量与其他变量的回归方程,据此推算缺失值; ※ 其他处理办法
数据准备量化 ·定量资料是否需要进行转换? ·定性资料数量化
数据准备-量化 • 定量资料是否需要进行转换? • 定性资料数量化
回归模型 ·μYx1,2xm=B0+B1X1+B2X2+.+BmXm ·Bo:常数项,截距,指当所有自变量X、 X2、Xm均为0时,应变量Y的总体平均值 Y ·B;(j=1,2,.,m):自变量X的总体偏回归 系数,表示在其他自变量保持不变时,自变 量X每增加(或减少)一个计量单位,应变 量Y平均变化B,个单位
回归模型 • μY|x1, x2.xm= β0+β1x1+ β2 x2 +.+ βmxm • β0:常数项,截距,指当所有自变量X1、 X2、.Xm均为0时,应变量Y的总体平均值 μY • Βj(j=1,2,.,m) :自变量Xj的总体偏回归 系数,表示在其他自变量保持不变时,自变 量Xj每增加(或减少)一个计量单位,应变 量Y平均变化Βj个单位