m(时论、等根.作业)》 型酸最季金三生晚计季长研业 大手精品球复用站-教学其一(、m) 物样脸 一均教的差和准 Example: 样试n=5)】 N 样浅脸n=10) 袖样浅脸(n=30)
第六章 参数估计与假设检验 (Parameter Estimation and Hypothesis Test) 预防医学系 卫生统计学教研室 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 教学内容 第一节 参数估计 第二节 假设检验 3 总体 样本 抽取部分观察单位 统计量 参 数 统计推断 统计推断 statistical inference 如:样本均数 样本标准差 S 样本率 P 如:总体均数 μ 总体标准差 σ 总体率 π X 内容:1、参数估计(estimation of parameters) 包括:点估计与区间估计 2、假设检验(test of hypothesis) 统计描述 4 Example: 已知健康成年男性服从总体均数为4.75×102 /L , 标准差为0.38×102 /L的正态分布,从该总体中随 机抽取140人,计算的样本均数为4.77×102 /L 问: 总体均数≠样本均数的原因是什么? 第一节 样本均数的标准误 一、均数的抽样误差和标准误 5 抽样试验 从正态分布总体N(5.00,0.502)中,每次 随机抽取样本含量n=5,并计算其均数与标 准差;重复抽取1000次,获得1000份样本; 计算1000份样本的均数与标准差,并对1000 份样本的均数作直方图。 按上述方法再做样本含量n=10、样本含量 n=30的抽样实验;比较计算结果。 6 抽样试验(n =5) 7 抽样试验(n =10) 8 抽样试验(n =30) 9
个抽样实验结景图示 1000份择本抽样计第结 -,5-00 计在在,华装5,香 二、样本均数的抽样分布特点 u 体,B华尚边市 -S1-/m-002 每准满的用造 t分布 t分有 益 年智 N (o.P) 6a2特” 调华行双对五正品神尚元成件波热 ▣奉液是与泰准液曲置到补有条行 u=二
3个抽样实验结果图示 0 50 100 150 200 250 300 350 400 450 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 0 50 100 150 200 250 300 350 400 450 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 0 50 100 150 200 250 300 350 400 450 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 5; 0.2212 X n S 30; 0.0920 X n S 10; 0.1580 X n S 10 1000份样本抽样计算结果 总体均 数 总体标 准差s 均数的 均数 均数的标准差 n=5 5.00 0.50 4.99 0.2212 0.2236 n=10 5.00 0.50 5.00 0.1580 0.1581 n=30 5.00 0.50 5.00 0.0920 0.0913 S n n 11 • 抽样误差的大小可以用样本均数的标准差 来描述 • 通常将统计量的标准差称标准误(Standard Error) 又称样本均数的标准差 n X / • 抽样误差在抽样研究中不可避免 • 均数的抽样误差(sampling error) : 由于样本的随机性所造成的导致来自同一总 体的样本均数之间及样本均数与总体均数间 的差异。 X X 12 • 实际研究中σ未知,以样本标准差S作为σ的估计值 计算标准误: 例4.1 在某地随机抽查成年男子140人,测得红细胞 数均数为4.77×102 /L,标准差0.38 ×102 /L ,试计算 其抽样误差的大小: S S n X / S S / n 0.38/ 140 0.032 X P29 13 二、样本均数的抽样分布特点 各样本均数未必等于总体均数 样本均数之间存在差异 样本均数的分布很有规律,围绕着总体均数左右 基本对称,也服从正态分布 样本均数的变异较原变量的变异大大缩小 0 50 100 150 200 250 300 350 400 450 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 0 50 100 150 200 250 300 350 400 450 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 0 50 100 150 200 250 300 350 400 450 3.71 3.92 4.12 4.33 4.54 4.74 4.95 5.15 5.36 5.57 5.77 5.98 6.19 均数 频数 14 中心极限定理: 当样本含量很大的情况下,无论原始测量变量服从 什么分布,X 的抽样分布均近似正态。 抽样分布 抽样分布示意图 s 15 标准误的用途 衡量抽样误差的大小,标准误越小,样本均数与 总体均数越接近,样本均数的可信度越高 结合标准正态分布与t分布曲线下面积分布规律, 估计总体均数的可信区间 用于假设检验 标准差与标准误的区别和联系? 16 从正态总体N( μ,σ2)中随机抽取样本含量为n 的样本,获得的样本均数的分布服从正态分布 N(μ, ) 。 同样可以对呈正态分布的 进行u变换 2 x t 分布 x x x u 17 t分布 X u X 随机变量X N(μ,σ2) 标准正态分布 N(0,1 u变换 2) 均数 N(μ,σ2/n) 标准正态分布 N(0,1 2) n X u , 1 v n SX S n X t X Student t分布 自由度:n-1 18
t分布曲线 t分布曲线下面积(附2) 州 灯司 可信且间的两个头★ 居体场款简了维盒闹的格计 ,1.道墙重fary小。度味点写替意畅火 1,rwuA士机6 释州 属两北成风小,普面良角高 :8e O-AS a'SSNST
t分布曲线 0.0 0.1 0.1 0.2 0.2 0.3 0.3 0.4 0.4 -4 -3 -2 -1 0 1 2 3 4 t f(t) 自由度为1的t分布 自由度为9的t分布 标准正态分布 t 分布有如下性质: ①单峰分布,曲线在t=0 处 最高,并以t=0为中心左右 对称 ②与正态分布相比,曲线最 高处较矮,两尾部翘得高( 见绿线) ③ 随自由度增大,曲线逐渐 接近正态分布;分布的极限 为标准正态分布。 19 t分布曲线下面积(附表2) 双侧t0.05/2,9=2.262 =单侧t0.025,9 单侧t0.05,9=1.833 双侧t0.01/2,9=3.250 =单侧t0.005,9 单侧t0.01,9=2.821 双侧t0.05/2,∞=1.96 =单侧t0.025,∞ 单侧t0.05,∞ =1.64 20 单侧:tα, v 双侧:tα/2,v 四 总体均数的估计 总体均数的点估计(point estimation) 与区间估计(interval estimation) 参数的估计 点估计:由样本统计量 直接估计 总体参数 区间估计:在一定置信度(Confidence level) 下,估计未知总体均数的可能范围 a b 、 、 X、 S、 p 21 在估计总体均数的可信区间时: 估计错误的概率:α 估计正确的概率:1-α,也称为可信度,常用 95%或99% 可信区间:根据一定概率估计得到的区间 95%(CI) ; 99%(CI) 22 可信区间的两个要素 1.准确度(accuracy):反映在可信度的大 小,即可行区间包含总体均数的概率大小 2.精密度(precision):反映在区间的长度, 区间宽度越小,精密度越高 23 总体均数的可信区间的估计 1、σ已知, 正态曲线下有95%的u值在±1.96间, 总体均数95%可信区间为: 同理,99%可信区间为: x x x x x xu 1.96 1.96 1.96 1.96 1.96 1.96 x x x 96 x 1.96 , 1. x x x 58 x 2.58 , 2. 24 v v 5 v 1 f t( ) 标准正态分布 σ 未知 可用其估计值S 代替,但 已不再服从标准正态分布, 而是服从 t 分布。 (X )/(S / n) 不同自由度的 t 分布图 25 2、σ未知 按t分布原理, 有95%的t值在± 之间 总体均数μ的95%可信区间为: 总体均数μ的99%可信区间为: 0.05/ 2 t 0.05/2 0.05/2 0.05/2 0.05/2 0.05/2 0.05/2 , x x x t t t x t t S x t S x t S 移项 : x Sx x t S x t 0.05/ 2 0.05/ 2 , x Sx x t S x t 0.01/ 2 0.01/ 2 , 26 例4.2 某医生测得25名动脉粥样硬化患者血浆纤维 蛋白原含量的均数为3.32 g/L,标准差为0.57 g/L, 试计算该种病人血浆纤维蛋白原含量总体均数的 95%可信区间。 下限: 上限: . 3.32 2.064 0.57/ 25 3.09 (g/L) / 2( ) X X-t S . 3.32 2.064 0.57 / 25 3.56 (g/L) / 2( ) X X t S 27
-n4am 第三节 林个有 值不为的原园是什么? 假设检验的意义和步擦 一、复适妆清肠远来恶想 小物率及施盖 巴贤4 ⑦未业井边高随:著归阳 雷守用》(音)】 许品 学号20
例4.3 试计算例4.1中该地成年男子红细胞总 体均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计 算可信区间。因为 , 则95%可信区间为: 4.77, 0.38,n 140 . 4.77 1.96 0.38/ 140 4.71( 10 /L) 12 / 2 X X-u S . 4.77 1.96 0.38/ 140 4.83( 10 / L) 12 / 2 X X u S 下限: 上限: 28 可信区间的涵义 总体均数95%可信区间:该区间包含总体均数的概率为95%。 从总体中作随机抽样,作100次抽样,每个样本可算得一个可 信区间,得100个可信区间,平均有95个可信区间包括μ(估 计正确),只有5个可信区间不包括μ(估计错误)。 95%可信区间 99%可信区间 公式 区间范围 窄 宽 估计错误的概率 大(0.05) 小(0.01) X X X t0.01/ 2,S , X t0.01/ 2,S X X X t 0.05 / 2, S , X t 0.05 / 2, S 29 μ * * * * * * 三、模拟实验 模拟抽样成年男子红细胞数。设定: μ=4.75,σ=0.39,n=140 产生100个随机样本,分别计算其95%的可信区间,结果用图 示的方法表示。从图可以看出:绝大多数可信区间包含总体 参数μ=4.75,只有6个可信区间没有包含总体参数(用星号标 记)。 30 第三节 假设检验的意义和步骤 第三节 假设检验的意义和步骤 (Hypothesis Test) 统计推断的另一个重要内容,目的是通过 样本数据比较总体参数之间有无差别。 一、假设检验的基本思想 小概率反证法 32 例4.4 使用黑加仑油软胶囊治疗高脂血症,30名高脂血 症患者治疗前后血清甘油三酯检测结果的差值为 1.38±0.76 (g/L),问治疗后血清甘油三酯是否有所改 善? 差值不为零的原因是什么? 假设检验的目的——就是判断差别是由哪 种原因造成的。 ① 抽样误差造成的; ② 本质差异造成的。 33 ① 抽样误差造成的: 治疗后 d= 1.38 μd = 0 治疗前 34 ② 本质差异造成的: 差值=1.38 μ前>μ后 治疗前 治疗后 35 ① 抽样误差造成的:H0 治疗后 d= 1.38,μd = 0 治疗前 ② 本质差异造成的:H1 μ前>μ后,差值=1.38 治疗前 治疗后 H0:来自同一总体,治疗前后没有差别; H1: 来自不同总体,治疗前后有差别; α=0.05 n S d S d S d t d d d d 0 =1.38/0.139=9.95 t (0.05,29) = 2.045 36
同规未质: 2 这种别走未幸个每的核 餐表款整的少象 2计界读虚晚计量 e P暖克镇点风高业看气下,线计量大子成样 2049 3.项定P雅,下结拾 益微” 装得尚据地计女健的机本。 824
假设检验过去称显著性检验。它是利用小概率反 证法思想,从问题的对立面H0出发间接判断要解决 的问题H1是否成立。然后在H0成立的条件下计算检 验统计量,最后根据P值与α之间的关系来判断假设 是否成立。 假设检验基本思想及步骤 37 问题实质: 希望通过样本统计量与总体参数的差别, 或样本统计量之间的差别,来推断总体 参数是否不同。 这种识别的过程,就是本章介绍的假设 检验(hypothesis test)。 38 假设检验的步骤 1.建立检验假设,确定检验水准(选用单侧或双侧检验) (1)无效假设又称零假设,记为H0; (2)备择假设又称对立假设,记为H1。 对于检验假设,须注意: (1)检验假设是针对总体而言,而不是针对样本; (2)H0和H1是相互联系、相互对立的假设,后面的结 论是根据H0和H1做出的,因此两者缺一不可; (3)应先判断H0 ,因为计算统计量是在H0成立的前提下 进行的。 39 (4) H1的内容直接反映了检验单/双侧 若H1中只是 0 或 < 0,则此检验为单侧检验。 它不仅考虑有无差异,而且还考虑差异的方向。 (5) 单双侧检验的确定 首先根据专业知识,其次根据所要解决的问题确定。 若从专业上看一种方法结果不可能低于或高于另一种方 法结果,此时应该用单侧检验。一般认为双侧检验较保 守和稳妥。 40 假设检验的步骤 检验水准 (通常取值0.05,0.01) 预先规定的概率值(拒绝域); 拒绝实际正确H0所犯错误的概率(弃真); P值是指在H0成立前提下,检验统计量大于或等 于实际观测值的概率。 41 根据变量和资料类型、设计方案、统计推断的 目的、是否满足特定条件等(如数据的分布类 型)选择相应的检验统计量 (即合适的统计方法)。 2. 计算检验统计量 n S d S d S d t d d d d 0 =1.38/0.139=9.95 t (0.05,29) = 2.045 42 P的含义是指从H0所规定的总体(H0成 立的前提下)随机抽样,其检验统计量等 于及大于(或/和等于及小于)现有样本 获得的检验统计量值的概率。 3. 确定P值,下结论 43 /2, t /2, t t P 1 2 t = 9.95 t (0.05,29) = 2.045 P<α 44 根据事后概率P与事先规定的概率(检验水准α)进行比 较,看其是否为小概率事件而得出结论 推断的结论应包含统计结论和专业结论 若 P≤α(0.05) 按α检验水准,拒绝H0,接受H1, 差别有统计学意义(统计结论),可认为……不 同或不等(专业结论) 若P >α(0.05) 按α检验水准,不拒绝H0,差别 无统计学意义(统计结论),还不能认为……不 同或不等(专业结论) 45