第十二章简单回归分析 前面介绍了两变量间关联性分析,本 章与下一章我们将进一步的介绍观察数据 中变量间的数量依存性的回归关系。 第一节{ 简单直线回归
第十二章 简单回归分析 前面介绍了两变量间关联性分析,本 章与下一章我们将进一步的介绍观察数据 中变量间的数量依存性的回归关系。 第一节 简单直线回归
直线回归的概念及其统计描述 在上一章中,对15名健康人疑血浓度 (Y)与凝血时间(X)数据计算相关系数 定量猫述了变量间关联性的强弱程度与方 向。为直观地说明直线▣归的概念,我们 以以上一章中对15名健康人凝血浓度与凝 血时间数据为例,来探讨两变量间依存变 化关系 反应变量(Y)与自变量(X)的简单线性模 simple linear regression model 可表达为 Y=a+BX:+8
一、直线回归的概念及其统计描述 在上一章中,对15名健康人凝血浓度 (Y)与凝血时间(X)数据计算相关系数, 定量描述了变量间关联性的强弱程度与方 向。为直观地说明直线回归的概念,我们 以以上一章中对15名健康人凝血浓度与凝 血时间数据为例,来探讨两变量间依存变 化关系。 反应变量(Y)与自变量(X)的简单线性模 型(simple linear regression model) 可表达为: Yi Xi i = + +
表12·115名健康成人凝血时间与凝血酶浓度测量值 受试者号 12345 6 8 910111213 14 15 X 1.11.21.0 0.91.2 1.10.9 0.61.0 0.9 1.1 09 1.1 1.0 0.7 1413 151513 14161714 161516141517 在通常情况下,研究者只能获取一定数 量的样本数据,用该样本数据建立的有关Y 与X变化的线性方程称为回归方程 (regression equation)嘢x
表12-1 15名健康成人凝血时间与凝血酶浓度测量值 在通常情况下,研究者只能获取一定数 量的样本数据,用该样本数据建立的有关Y 与X变化的线性方程称为回归方程 (regression equation)即: 受试者号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 X 1.1 1.2 1.0 0.9 1.2 1.1 0.9 0.6 1.0 0.9 1.1 0.9 1.1 1.0 0.7 Y 14 13 15 15 13 14 16 17 14 16 15 16 14 15 17 Y ˆ = a +bX
在描述两变量的关系时,一般把两个变量中能 精确容易测量的作自变量,不易测量作为因变量: 即用易测量的数据X估计不易测量的另一数据。如 年龄估算小儿体重等。在描述凝血时间与凝血浓度 的依存关系中,将凝血酶浓度作为自变量(X), 凝血时间作为应变量(Y)。由图12-1可见,凝 血时间随凝血酶浓度增大而减少且呈直线趋势,但 并非15点恰好全部都在一直线上。两变量数量间虽 然存在一定关系,但不是十分确定的。这与两变量 间严格对应的函数关系不同,称为直线回归 (Linear regression)。直线回归是回归分析中 最基本、最简单的一种,故又称简单simple regression)
在描述两变量的关系时,一般把两个变量中能 精确容易测量的作自变量,不易测量作为因变量。 即用易测量的数据X估计不易测量的另一数据。如 年龄估算小儿体重等。在描述凝血时间与凝血浓度 的依存关系中,将凝血酶浓度作为自变量( X ), 凝血时间作为应变量(Y)。由图12-1可见,凝 血时间随凝血酶浓度增大而减少且呈直线趋势,但 并非15点恰好全部都在一直线上。两变量数量间虽 然存在一定关系,但不是十分确定的。这与两变量 间严格对应的函数关系不同,称为直线回归 (Linear regression)。直线回归是回归分析中 最基本、最简单的一种,故又称简单simple regression)
凝血时间(秒) 09 18 17 16 15 14 13 12 .5 .6 .7 .8.9 1.0 1.1 1.2 1.3 凝血酶浓度(毫升) 图 12-1 凝血浓度与凝血时间的散点分布
图 12-1 凝血浓度与凝血时间的散点分布 凝血酶浓度(毫升) .5 .6 .7 .8 .9 1.0 1.1 1.2 1.3 凝 血 时 间 ( 秒 ) 20 19 18 17 16 15 14 13 12