2015/1/9 ■ 回回 课程设置 酒石河子大学 漂财:覆论漂:22净财 共月绿:10学财 第九章x2检验 联方式:预防医季卫生 Tel:2057153 (Chi Square Test Baidu账巴:yfa(讨论.米是、作业) wmv) 医季晚预防医季泰 ◆目的: >推断两个善体平或构成此之间有无差别 第一节 ,推断多个慈体年或构成此之间有无差刮 ·检验统计量:X2 四格表资料的X2检验 ◆应用:定性数据 一、基本会式和基本思想 圆的: 推断两个惑体率(构成比)是否有是副 震血用来意制加精响海疗。试分新有故位。 妻求: 表9】两种疗法治疗原发性高血压的疗效 有效 无效合计有效 两拆本的两分真个体敷赫列成四格表资料 20() 合计
2015/1/9 1 1 第九章 χ2检验 (Chi Square Test ) 医学院预防医学系 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 目的: 推断两个总体率或构成比之间有无差别 推断多个总体率或构成比之间有无差别 检验统计量:χ 2 应用:定性数据 4 第一节 四格表资料的χ 2 检验 5 目的: 推断两个总体率(构成比)是否有差别 要求: 两样本的两分类个体数排列成四格表资料 6 一、基本公式和基本思想 例9-1 吲达帕胺片治疗原发性高血压疗效,将患者随 机分为两组,试验组用吲达帕胺片加辅助治疗,对 照组用安慰剂加辅助治疗。试分析有效性
2015/1/9 四格表资料的基本形式 2=4- v=(行数-1列数-1) 7T 处粗,发生数来发生数合计 处理组发生数未发生数 合计% 安 a Tn bTa a+b甲% n 合计cbd 乙 c Tn dTn c+d飞% A,矣际频(actual frequency】. 合计 a+c b+d n◆计% T覆论频k(theoretical frequency.) Tc,第RC列的覆论频长 。检脸晚计量x2值反映了实际频教 与理论频款的由合程度。 若检脸餐设H6:,=布2成立,宾际频款人与理 论频散T相差不应诚很大,x2不应诚根大。 度。 若x2值服大,则A与T有差太大,若P≤a, 是出丁构拆溪差无并的能国,从而怀展儿的王 确楼,接受其对主假设片,即1卡2 四整表管养两骨两列,”=1,即在周边合计美国变的 假设检脸步豫 (2)求检脸统计量值 (门)立检脸假设,喷定检脸水平。 H6:1=石2中试脸血场对黑血的恶体有藏年和羊 2 15.2 v=(2-10(2-1)=1 Tn-444/7m-258 4=0.05。 20(25.8)2418.2 Ta-2970-i82 21(15.2 510.8) Ta-26*41/7m0-152 Ta-2629/70-10.8 2
2015/1/9 2 7 处理组 发生数 未发生数 合计 甲 a b a+b 乙 c d c+d 合 计 a+c b+d n 四格表资料的基本形式 甲% 乙% 合计% T11 T12 T21 T22 % 8 处理组 发生数 未发生数 合计 甲 a b a+b 乙 c d c+d 合 计 a+c b+d n 2 2 ( ) , ( )( 1) A T T 行数-1 列数 A:实际频数(actual frequency) T:理论频数(theoretical frequency) T RC :第R 行C 列的理论频数 nR :相应的行合计,nC :相应的列合计 R C RC n n T n 9 检验统计量χ2 值反映了实际频数 与理论频数的吻合程度。 若检验假设H0 :π1=π2成立,实际频数A 与理 论频数T 相差不应该很大,χ2 不应该很大。 若χ2 值很大,则A与T相差太大,若 P≤α, 超出了抽样误差允许的范围,从而怀疑H0的正 确性,接受其对立假设H1,即π1≠π2。 10 自由度ν愈大,χ 2 值也会愈大;所以只 有考虑了自由度ν的影响,χ 2 值才能正 确地反映实际频数A和理论频数T 的吻合 程度。 检验的自由度取决于可以自由取值的格子数目,而不 是样本含量n。 四格表资料两行两列,ν=1,即在周边合计数固定的 情况下,4个基本数据当中只有一个可以自由取值。 11 (1) 建立检验假设,确定检验水平。 H0 :π1=π2 即试验组与对照组的总体有效率相等 H1 :π1≠π2 即试验组与对照组的总体有效率不等 α=0.05。 假设检验步骤 12 (2)求检验统计量值 2 2 2 2 2 (20 25.8) (24 18.2) (21 15.2) (5 10.8) 8.40 25.8 18.2 15.2 10.8 (21)(21) 1 T11 =44*41/70=25.8 T12=44*29/70=18.2 T21=26*41/70 =15.2 T22 = 26*29/70=10.8 20(25.8) 24(18.2) 21(15.2) 5(10.8)
2015/1/9 (3)确宗P值,作出推断结论 二、四格表资料检险的专用会式 带 x2= (ad-bc)2n (a+b)(a+cXb+d)(c+d) 当自由度,确定后,x分布曲线下右侧尾 部的面积为a时,横轴上相应的x值记作x X2=20x5-24×212×70-840 P<0.005,典a=0.05水准,指地片,热要片,可 44×26×41×29 以认为而盒施疗原发性高么压的愿体者故平不学,即 可认齐明达格康海青原发性高血届有放。 三、四格表资料检脸的校正含式 X2分布是一连峡型分布,而回格表资料局 若=∑4--05y 离散型分有,由此计算得的X统计量的抽拆 T 分有亦里高散性质。为或昌X2能计量分有 的选峡性,则需行逃喷性校至(correction (ad-bel-n for continuity)。 x2= (a+b)(c+d)(a+c)b+d) 子连碳位投正低用于y=1的四棒泰贵解,面y>2 财,一不保投。 四格表资料X?检脸金式的选 制9-2等最师秋此能胞4型碱与种经节#睡谁轴 金管病病白守故,普58制陆血管病病喜★政机分为 两触,始品儿表。问西种葛物德守陆血管来高的者 n≥40,T≥5,专用会式 放单是香湘等? 表2两种物治疗血管疾转有效率的较 n≥40,1≤T<5,校正会式: 有效无滩合计有效单(》 n<40或T<1,直楼计算瓶率。 49
2015/1/9 3 13 (3) 确定P 值,作出推断结论 当自由度 确定后, 2 分布曲线下右侧尾 部的面积为 时,横轴上相应的 2 值记作 2 , 0.0 0.1 0.2 0.3 0.4 0.5 0 3 6 9 12 15 18 卡方值 纵高 自由度=1 自由度=2 自由度=3 自由度=6 P< 0.005,按α=0.05水准,拒绝H0 ,接受H1 ,可 以认为两组治疗原发性高血压的总体有效率不等,即 可认为吲达帕胺治疗原发性高血压有效。 14 二、四格表资料检验的专用公式 2 2 ( ) ( )( )( )( ) ad bc n a b a c b d c d 2 2 (20 5 24 21) 70 8.40 44 26 41 29 15 三、四格表资料检验的校正公式 2 2 ( 0.5) c A T T 2 2 ( ) 2 ( )( )( )( ) c n | ad - bc|- n = a+b c+d a+c b+d 16 χ 2分布是一连续型分布,而四格表资料属 离散型分布,由此计算得的χ 2统计量的抽样 分布亦呈离散性质。为改善χ 2 统计量分布 的连续性,则需行连续性校正(correction for continuity)。 χ 2 连续性校正仅用于ν =1 的四格表资料,当ν≥2 时,一般不作校正。 17 四格表资料χ 2 检验公式的选择: n T 40, 5 ,专用公式; ,校正公式; ,直接计算概率。 n T 40, 1 5 n T 40 1 或 18 例9-2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑 血管疾病的疗效,将58例脑血管疾病患者随机分为 两组,结果见表。问两种药物治疗脑血管疾病的有 效率是否相等?
2015/1/9 上走立银设,设走妆脸水准 四、四格表资料的Fisher喷切机率法 (选拳) H:开士可即两科葛物地方脑么普病病的有数年不湘等 条件: n<40,或T<1, =0.05 2.计算检整晚计量 或P≈a时, .v-2- ◆理论依据:是几何分布。 3.喷史P值,作出雄奇地治 不在心比,高不易认希两种茜物睡亦聘血管套 病的有故平不湘善。 令基本思想 ,春鱼合瓶来P的计算 在回格表用边合计圆定不支的条件下, 在四格表周边合计教不支的条件下, 计算表内4个尖际频款支动财的各种鱼合 表内4个来际频戴abCd支动的血合藏 之机年尸:,再楼检险假设用羊侧或双创 共有“周边合计中录小戴+1”个。如创 的果计概单P,依据所取的检脸水准a 8.3,表内4个实际频款支动的血合款共 账出推断。 者8+1=9个,见表8-4。 >各息会的瓶率P尿从是几何分布, 创9.3将17名非闲出者威机分 两血,分制用雨种方债嗨疗,地暴儿表83, 其和为1。 问两种守的守数是香不阿? P=a+bc+d)(a+cb+d月 素种疗铁对版 alblc!d!n! 疗法 2 9 刀.18 保守疗法 25.00 合计 7 4
2015/1/9 4 19 H0:1 2 H1:1 2 0.05 即两种药物治疗脑血管疾病的有效率相等 即两种药物治疗脑血管疾病的有效率不相等 2.计算检验统计量 2 2 6 25 3 24 58 2 58 0 376 49 9 28 30 c / . (21)(21) 1 3.确定P 值,作出推断结论 不拒绝 H0 ,尚不能认为两种药物治疗脑血管疾 病的有效率不相等 。 1.建立假设,设定检验水准 20 条件: 理论依据:超几何分布。 n 40,或T 1, 或P 时, 四、四格表资料的Fisher确切概率法 (选学) 21 基本思想 在四格表周边合计数固定不变的条件下, 计算表内4个实际频数变动时的各种组合 之概率Pi ;再按检验假设用单侧或双侧 的累计概率 P ,依据所取的检验水准α 做出推断。 22 各组合概率Pi的计算 在四格表周边合计数不变的条件下, 表内4个实际频数 a,b,c,d 变动的组合数 共有“周边合计中最小数+1”个。如例 8.3,表内4个实际频数变动的组合数共 有8+1=9个,见表8-4。 23 各组合的概率Pi服从超几何分布, 其和为1。 ( ) ( )!( )!( )! ! ! ! ! ! i a b c d a c b d P a b c d n ! 24 表 8-3 两种疗法对腰椎间盘脱出症的疗效 疗法 治愈 未治愈 合计 治愈率(%) 新疗法 7 2 9 77.78 保守疗法 2 6 8 25.00 合计 9 8 17 52.94 例9.3 将17名腰椎间盘脱出症患者随机分到 两组,分别用两种方法治疗,结果见表8-3, 问两种疗法的疗效是否不同?
2015/1/9 二、检脸步(本创n=17<40】 3% :石=,月:,a=005 34 ( 2.24P=0.041464 P=P(1+P(②+P(⑦+P(8)+P(9)=0.057 P=P(⑦+P(⑧+P(⑨=0.044 与计量资料推断两总体均敷是否有差 第二节 别有成组设计和配对设计一样,计数 资料推断两个恶体率(构成比)是否 配对四格表资料的X2检脸 有差别也有成组设计和配对设计,即 四格表资料和配对四格表资料。 ■ ■ 创9.4见者198份爽标本,◆份赫本分刮 表95人 的培苏结 用A、B两种培养基培养结核葡,结暴见 表9-5。问A、B两种培养基白阳性婚界 来是香不等? 2 198
2015/1/9 5 25 表 8-4 各种组合的四格表计算的概率 四格表序号 治愈 未治愈 a-Ta P 1 1 8 8 0 -3.76 0.000370 2 2 7 7 1 -2.76 0.011847 3 3 6 6 2 -1.76 0.096750 4 4 5 5 3 -0.76 0.290251 5 5 4 4 4 0.24 0.362814 6 6 3 3 5 1.24 0.193501 7 * 7 2 2 6 2.24* 0.041464* 8 8 1 1 7 3.24 0.002962 9 9 0 0 8 4.24 0.000041 *:为实际四格表 26 二、检验步骤(本例n=17<40 ) 计算表内四个格子数据的各种组合的概率Pi (表8-4) 本例(a-T)*=2.24, P* =0.041464 确定累计概率值 1. 双侧检验 P = P (1) + P (2) + P (7) + P (8) + P (9) =0.057 2. 单侧检验 P = P (7) + P (8) + P (9) =0.044 H0 :1 2 ,H1 :1 2 , 0.05 27 第二节 配对四格表资料的 χ2 检验 28 与计量资料推断两总体均数是否有差 别有成组设计和配对设计一样,计数 资料推断两个总体率(构成比)是否 有差别也有成组设计和配对设计,即 四格表资料和配对四格表资料。 29 例9.4 现有198份痰标本,每份标本分别 用A、B两种培养基培养结核菌,结果见 表9-5。问A、B两种培养基的阳性培养 率是否不等? A培养基 B培养基 合计 + - + 48(a) 24(b) 72 - 20(c) 106(d) 126 合计 68 130 198 30 样品号 A培养基 B培养基 1 + + 2 + - 3 - + 4 - - …… …… …… 198 + - 表9-5 A、B两种培养基的培养结果 A培养基 B培养基 合计 + - + 48(a) 24(b) 72 - 20(c) 106(d) 126 合计 68 130 198