第十二章 线性回归分析
第十二章 线性回归分析
双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1,Y1),(X2Y2),…,(Xn,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本—直线回归、直线相关
双变量计量资料:每个个体有两个变量值 总体:无限或有限对变量值 样本:从总体随机抽取的n对变量值 (X1 ,Y1), (X2 ,Y2), …, (Xn ,Yn) 目的:研究X和Y的数量关系 方法:回归与相关 简单、基本——直线回归、直线相关
历史背景: 英国人类学家 F Galton首次在《自然遗传》 书中,提出并阐明了“相关”和“相关系数” 两个概念,为相关论奠定了基础。其后,他和 英国统计学家 Karl Pearson对上千个家庭的身 高、臂长、推长(伸开大拇指与中指两端的最 大长度)做了测量,发现:
英国人类学家 F.Galton首次在《自然遗传》 一书中,提出并阐明了“相关”和“相关系数” 两个概念,为相关论奠定了基础。其后,他和 英国统计学家 Karl Pearson对上千个家庭的身 高、臂长、拃长(伸开大拇指与中指两端的最 大长度)做了测量,发现: 历史背景:
儿子身高(Y,英寸)与父亲身高(X, 英寸)存在线性关系:}=33.73+0.516X 也即高个子父代的子代在成年之后的身 高平均来说不是更高,而是稍矮于其父代水 平,而矮个子父代的子代的平均身高不是更 矮,而是稍高于其父代水平。aa将这种 趋向于种族稳定的现象称之“回归
儿子身高(Y,英寸)与父亲身高(X, 英寸)存在线性关系: 。 也即高个子父代的子代在成年之后的身 高平均来说不是更高,而是稍矮于其父代水 平,而矮个子父代的子代的平均身高不是更 矮,而是稍高于其父代水平。Galton将这种 趋向于种族稳定的现象称之“回归” 。 ˆ Y X = + 33.73 0.516
目前,“回归”已成为表示变量 之间某种数量依存关系的统计学术语 并且衍生出“回归方程”“回归系数” 等统计学概念。如研究糖尿病人血糖 与其胰岛素水平的关系,研究儿童年 龄与体重的关系等
目前, “回归”已成为表示变量 之间某种数量依存关系的统计学术语, 并且衍生出“回归方程”“回归系数” 等统计学概念。如研究糖尿病人血糖 与其胰岛素水平的关系,研究儿童年 龄与体重的关系等