第三章总体均数的区向估计和假设检胎 一、基本概念 1.抽样误差由于抽样而引起的样本指标与总体指标的差异,或者统计量与参数之 间的差异称为抽样误差。 2.标准误用来反映抽样误差大小的指标。 3.统计推断是指由总体中随机抽取样本,并由样本信息推断总体特征。 4.参数估计由样本统计量估计总体参数称为参数估计。 5.点估计通过抽取样本计算统计量,并直接由样本指标作为总体指标的估计值。 6.可信区间按一定的概率估计包含总体均数可能的范围,此范围称为总体均数的 可信区间。 7.【分布是一种连续性分布。主要用于t检验,总体均数的区间估计以及研究小样 本问题。 8.正态分布又称高斯分布或拉普拉斯分布。它是以均数为中心呈对称的钟型分布 是医学、生物学中最常见最重要的连续型分布。 9.假设检验分为参数法与非参数法。先对总体的参数或分布作出某种假设,再用适 当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。其结果将有助于研 究者作出决策及采取措施。 10.【型错误也称为第一类错误或ā错误,是指拒绝了实际上成立的H。一般定义 a0.05或a=0.01. 1山.Ⅱ型错误也称为第二类错误或B错误,是指不拒绝实际上不成立的H。一般 是未知的。 二、公式及应用条件 1.标准误:σ=o/√n (o已知) S=SI/n (0未知) 2.正态分布及分布:①o已知,则u=(你-/o:=(你-)/G1月 ②a未知,则1=丘-/S:=-水S1W同) 3.可信区间估计: ①小样本:n≤100 95%:天±1o5:99%:不±0uS ②大样本:n>100 95%:x±1.96S2:99%:x±2.58S2 16
第三章 总体均数的区间估计和假设检验 一、基本概念 1. 抽样误差 由于抽样而引起的样本指标与总体指标的差异,或者统计量与参数之 间的差异称为抽样误差。 2. 标准误 用来反映抽样误差大小的指标。 3. 统计推断 是指由总体中随机抽取样本,并由样本信息推断总体特征。 4. 参数估计 由样本统计量估计总体参数称为参数估计。 5. 点估计 通过抽取样本计算统计量,并直接由样本指标作为总体指标的估计值。 6. 可信区间 按一定的概率估计包含总体均数可能的范围,此范围称为总体均数的 可信区间。 7. t 分布 是一种连续性分布。主要用于 t 检验,总体均数的区间估计以及研究小样 本问题。 8. 正态分布 又称高斯分布或拉普拉斯分布。它是以均数为中心呈对称的钟型分布, 是医学、生物学中最常见最重要的连续型分布。 9. 假设检验 分为参数法与非参数法。先对总体的参数或分布作出某种假设,再用适 当的方法根据样本对总体提供的信息,推断此假设应当拒绝或不拒绝。其结果将有助于研 究者作出决策及采取措施。 10. Ⅰ型错误 也称为第一类错误或α错误,是指拒绝了实际上成立的 H。一般定义 α=0.05 或α=0.01。 11. Ⅱ型错误 也称为第二类错误或β错误,是指不拒绝实际上不成立的 H。一般β 是未知的。 二、公式及应用条件 1. 标准误: n x σ = σ / (σ已知) S S n x = / (σ未知) 2. 正态分布及 t 分布:①σ已知,则u (x ) (x ) ( n ) x = − µ /σ = − µ / σ / ②σ未知,则t (x ) S (x ) (S n ) x = − µ / = − µ / / 3. 可信区间估计: ①小样本:n≤100 95%: ( ) x x ± t 0.05,v S ;99%: ( ) x x ± t 0.01,v S ②大样本:n>100 95%: x x ±1.96S ;99%: x x ± 2.58S 16
4.均数u检验 ①样本均数与总体均数的比较条件:0已知(或0未知,且0>100) u=F-4/o:=F-461) ②两个大样本均数的比较条件:n1和n2均>50 u=压-xVS+S =1-x2/VS21n+S21n, 5.均数的t检验 ①样本均数与总体均数的比较条件:n≤100 1=k-4s:=F-61) ②配对计量资料的比较 1=F-01S,=同sa1n同 ③两小样本均数比较,即独立样本t检验,条件:n,和2均≤50 1=1-2/S3-i Si =52(Im +1/ng)=S2 (mn +m)(onns) s.Ex-②x,fmx好-xfm (m+m2-2) S=【m-1s2+m2-10sm+m2-2) ④两样本几何均数的比较 =lg X1,x2 =IgX2,x1=lgG,x2=lgG2 1=-xS-其它同③的各公式. 6.方差齐性检验 F=S2/S好 S为较大方差,S?为较小方差,较大方差的自由度为v,-1,较小方差的自由度为 V2=n2-1。 7.t'检验条件:两方差不齐 17
4. 均数 u 检验 ①样本均数与总体均数的比较 条件:σ已知(或σ未知,且σ>100) u x x ( n ) x = − µ /σ = − µ / σ / ②两个大样本均数的比较 条件:n1和n2均>50 2 2 1 2 1 2 / x x u = x − x S + S 2 2 1 1 2 1 = x1 − x 2 / S / n + S / n 5. 均数的 t 检验 ①样本均数与总体均数的比较 条件:n≤100 t x S x ( ) S n x = − µ / = − µ / / ②配对计量资料的比较 t t S d (S n ) d d = − 0 / = / / ③两小样本均数比较,即独立样本t检验,条件:n1和n2均≤50 1 2 1 2 / x x t x x S − = − ( ) ( ) ( ) 1 2 1 2 2 1 2 2 1/ 1/ / 1 2 S Sc n n Sc n n n n x x = + = + ⋅ − [ ( ) ] [ ( ) ] ( ) 2 / / 1 2 2 2 2 2 1 2 2 1 2 2 1 + − − + − = ∑ ∑ ∑ ∑ n n X X n X X n Sc [( ) 1 ( 1) ]/( ) 1 2 2 2 2 2 2 1 1 2 Sc = n − S + n − S n + n − ④两样本几何均数的比较 设 2 2 1 1 1 1 2 2 x = lg X , x = lg X , x = lgG , x = lgG 1 2 1 2 / x x t x x S − = − 其它同③的各公式。 6. 方差齐性检验 2 2 2 1 F = S / S 2 S1 为较大方差, 为较小方差,较大方差的自由度为v 2 S2 1=n1-1,较小方差的自由度为 v2=n2-1。 7.t′检验 条件:两方差不齐 17
'=民-/S+S =民-S1m+S1m 6=So,)+So/S经+s) 三、习题 1.据下表问:中草药治疗后舒张压有否变化? 表3-1 某医院用中草药治疗10名高血压病人的舒张压值 治疗前 115 110129 109110 116116116120104 治疗后 116901088792901101208896 2.将大白鼠配成8对,分别给予两种饲料,问V缺乏对肝中V含量有无影响? 对照组3.55 2.003.00 3.953.803.75 3.45 3.05 VE缺乏组2.45 2.401.803.203.252.702.401.75 3.表33用克矽平治疗7名的肺病人血清粘蛋白数据(mg%) 治疗前6.5 7.3 7.3 3.0 7.3 5.6 7.3 治疗后 3.4 3.6 3.7 2.6 4.3 3.7 5.0 问:治疗前后血清粘蛋白的差别有无显著性? 4.表3-412名妇女最大呼气率分别用两法测得的结果(L/min) Wright法490397512401470415431429420275165421 Mini法525415508444500460390432420227268443 问:两法测得结果有无显著差别? 5.健康成年男子脉搏平均次数为72次/分。现调查25名某山区健康成年男子脉搏平 均次数为74.2次/分,标准差为6.5次/分。问:①山区健康成年男子脉搏数与一般健康成 年男子脉搏数有否不同?②山区健康男子脉搏数是否高于一般健康男子脉搏数? 6.已知某水样中含CC0的真值为20.7mgL。现用某法重复测定该水样11次。CC0 含量(mgL)为20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20.00,23.00, 22.00。问该法测得的均数与真值有否显著性差异? 18
2 2 1 2 1 2 / Sx Sx t′ = x − x + 2 2 1 2 2 1 2 1 = x − x / S / n + S / n [ ( ) ( )] ( ) 2 2 2 2 1 2 1 2 1 2 / x x x x t′ = S t υ + S t υ S + S α α α 三、习题 1. 据下表问:中草药治疗后舒张压有否变化? 表 3-1 某医院用中草药治疗 10 名高血压病人的舒张压值 治疗前 115 110 129 109 110 116 116 116 120 104 治疗后 116 90 108 87 92 90 110 120 88 96 2. 将大白鼠配成 8 对,分别给予两种饲料,问VE缺乏对肝中VA含量有无影响? 对 照 组 3.55 2.00 3.00 3.95 3.80 3.75 3.45 3.05 VE缺乏组 2.45 2.40 1.80 3.20 3.25 2.70 2.40 1.75 3. 表 3-3 用克矽平治疗 7 名矽肺病人血清粘蛋白数据(mg%) 治疗前 6.5 7.3 7.3 3.0 7.3 5.6 7.3 治疗后 3.4 3.6 3.7 2.6 4.3 3.7 5.0 问:治疗前后血清粘蛋白的差别有无显著性? 4. 表 3-4 12 名妇女最大呼气率分别用两法测得的结果(L/min) Wright 法 490 397 512 401 470 415 431 429 420 275 165 421 Mini 法 525 415 508 444 500 460 390 432 420 227 268 443 问:两法测得结果有无显著差别? 5. 健康成年男子脉搏平均次数为 72 次/分。现调查 25 名某山区健康成年男子脉搏平 均次数为 74.2 次/分,标准差为 6.5 次/分。问:①山区健康成年男子脉搏数与一般健康成 年男子脉搏数有否不同?②山区健康男子脉搏数是否高于一般健康男子脉搏数? 6. 已知某水样中含CaCO3的真值为 20.7mg/L。现用某法重复测定该水样 11 次。CaCO3 含量(mg/L)为 20.99,20.41,20.10,20.00,20.91,22.60,20.99,20.41,20.00,23.00, 22.00。问该法测得的均数与真值有否显著性差异? 18
7.表35调查两地乡村女生各30名的一分钟仰卧起坐(次/分)结果 年龄(岁) 14 15 16 17 18 济南x 23.0 22.7 24.4 24.3 22.7 8.78 9.84 9.15 9.43 8.55 青岛x 24.9 24.4 27.4 29.3 28.0 7.41 8.34 7.37 7.10 7.76 问:两地各年龄组的一分钟仰卧起坐有否差异? 8.表3-6某职防院为观察驱汞效果使用两药治疗两组病人的结果 丙磺酸钠 3.34 1419 6.80 482 5.22 0.93 634 (12人) 8.54 12.59 6.11 6.13 7.28 丁二酸钠 3.84 2.62 0.93 383 2.60 246 1.19 (10人) 8.50 2.75 3.50 问:两药效果有否差异? 9.表37 某地1980年测定正常新生儿脑血脂(mg/100ml)结果 男 女 血脂 n n 胆固醇 378 71.4 21.6 373 79.3 24.0 甘油三酯 375 37.6 22.5 367 38.8 25.8 B脂蛋白 121 95.5 38.6 173 94.7 37.6 问间:三种血脂指标有无性别差异?试估计总体均数的95%和99%可信区间及正常值范 围。 10.表3-8调查18岁城市及乡村男生各60名的身高数据(cm) 城乡 济南 青岛 烟台 济宁 临沂 泰安 城市x 173.20 172.80 171.38 171.82 170.86 170.60 5.03 5.59 5.07 6.38 5.11 5.62 乡村x 167.10 170.24 16854 165.88 166.82 166.86 5.54 4.54 5.61 5.76 5.75 5.08 ①试比较各地城乡之间男生身高有无显著差别? ②试估计各地城乡男生身高总体均数的95%及99%可信区间。 19
7. 表 3-5 调查两地乡村女生各 30 名的一分钟仰卧起坐(次/分)结果 年龄(岁) 14 15 16 17 18 济南 x 23.0 22.7 24.4 24.3 22.7 S 8.78 9.84 9.15 9.43 8.55 青岛 x 24.9 24.4 27.4 29.3 28.0 S 7.41 8.34 7.37 7.10 7.76 问:两地各年龄组的一分钟仰卧起坐有否差异? 8. 表 3-6 某职防院为观察驱汞效果使用两药治疗两组病人的结果 丙磺酸钠 3.34 14.19 6.80 4.82 5.22 0.93 6.34 (12 人) 8.54 12.59 6.11 6.13 7.28 丁二酸钠 3.84 2.62 0.93 3.83 2.60 2.46 1.19 (10 人) 8.50 2.75 3.50 问:两药效果有否差异? 9. 表 3-7 某地 1980 年测定正常新生儿脑血脂(mg/100ml)结果 男 女 血 脂 n X S n X S 胆 固 醇 378 71.4 21.6 373 79.3 24.0 甘油三酯 375 37.6 22.5 367 38.8 25.8 β脂蛋白 121 95.5 38.6 173 94.7 37.6 问:三种血脂指标有无性别差异?试估计总体均数的 95%和 99%可信区间及正常值范 围。 10.表 3-8 调查 18 岁城市及乡村男生各 60 名的身高数据(cm) 城乡 济南 青岛 烟台 济宁 临沂 泰安 城市 x 173.20 172.80 171.38 171.82 170.86 170.60 S 5.03 5.59 5.07 6.38 5.11 5.62 乡村 x 167.10 170.24 168.54 165.88 166.82 166.86 S 5.54 4.54 5.61 5.76 5.75 5.08 ①试比较各地城乡之间男生身高有无显著差别? ②试估计各地城乡男生身高总体均数的 95%及 99%可信区间。 19
11.表3-9 调查某地健康人血液指标结果 指标 性别 例数 标准值 红细胞数(万mm) 男 360 466.02 57.46 483.5 女 255 417R0 29.10 433.2 血红蛋白(g%) 男 360 13.45 0.71 14.02 女 255 11.76 1.02 12.47 ①估计不同性别血液指标总体均数的可信区间。 ②不同性别血液指标有无不同? ③不同性别血液指标与标准值有无不同? 四、思考题 1解释名词:抽样误差标准误假设检验正态分布t分布均数可信区间 统计推断参数估计点估计【型错误Ⅱ型错误 2标准差与标准误的区别主要有哪几点?不同的意义是什么? 3.t分布与正态分布的特点、意义是什么?不同的意义是什么? 4.参考值范围或正常值范围与可信区间的特点、意义和区别是什么? 5.点估计和可信区间的特点、意义和区别是什么? 6.t检验有哪几种?适用条件是什么?用于何种资料? 7.u检验有哪几种?适用条件是什么?用于何种资料? 8.O:与S的特点、意义及区别是什么? 9.【型及Ⅱ型错误的特点、意义和区别是什么? 10.应用t检验的注意事项有哪些?在实际科研工作中如何把握和理解? 20
11.表 3-9 调查某地健康人血液指标结果 指标 性别 例数 x S 标准值 红细胞数(万/mm 3 ) 男 360 466.02 57.46 483.5 女 255 417.80 29.10 433.2 血红蛋白(g%) 男 360 13.45 0.71 14.02 女 255 11.76 1.02 12.47 ①估计不同性别血液指标总体均数的可信区间。 ②不同性别血液指标有无不同? ③不同性别血液指标与标准值有无不同? 四、思考题 1.解释名词:抽样误差 标准误 假设检验 正态分布 t 分布 均数可信区间 统计推断 参数估计 点估计 Ⅰ型错误 Ⅱ型错误 2.标准差与标准误的区别主要有哪几点?不同的意义是什么? 3.t 分布与正态分布的特点、意义是什么?不同的意义是什么? 4.参考值范围或正常值范围与可信区间的特点、意义和区别是什么? 5.点估计和可信区间的特点、意义和区别是什么? 6.t 检验有哪几种?适用条件是什么?用于何种资料? 7.u 检验有哪几种?适用条件是什么?用于何种资料? 8. x σ 与 x S 的特点、意义及区别是什么? 9.Ⅰ型及Ⅱ型错误的特点、意义和区别是什么? 10.应用 t 检验的注意事项有哪些?在实际科研工作中如何把握和理解? 20