卫生/医学统计学实习指®2.1x版)实习2计数资料的描述27 t1<-cumsum(x1) 算累计标准人口总和 tx2<-cumsum(x2) 计算累计总和 tyl<-cumsum(yl)) 计算甲组频数、频率累计 ty2<-cumsum(y2)】 ex2<-cumsum(standpop*x4100 计算乙组须数、顿率累计 ey2<-cumsum(standpop*y4)100 xl<-c标化 tx1[6].tx2[61.100,round(ex2[6]/tstandpop[6]100.2) 追加标化结果数据到数据框 tyl[61.ty2[61.100.round(ey2[61/tstandpop[6]*100.2) ex2[6J/tst ndpop[6*100和 ey26 /tstandpop[6*100是计算的标 准化率 nmc年龄组甲调查人数,甲患病人数 给各个变量定义输出表的表头 查人数,乙患病人数 1率% 输出标准化率打印结果 2、某地某慢性病统计资料,见表2-2。 表2-2某地某慢性病统计资料 年龄组人口数忠病人数新发病例数死亡人数 0 383562 1105 9 3 20 542655 3236 38 5 40 42386 18538 6 131 60 10323813636 129 102 合计145331836515 343 261 问题1:计算患病率、发病率 问题2:死亡率、病死率。 R参考程序。 R计算程序 程序解释 x-read.table(textConnection( 数据输入程序数据框为x age xI x2 x3 x4 0-383562110593 20-54265532363825 40-42386318538167131 60-10323813636129102 合计14533183651534326 "),header=T,as.is=T) attach(x) v1<-x2/x1◆100 按公式计算 y2<-x3k1100000 y3<x4/x1*10000( y4<-x4/X2◆100 x<-cbind(x.yl.y2.y3.y4) 添加新变量y1,y2y3y4到数据框 names((xK-c年龄组,人口数,患病人数,新发病例数 修改输出表的表头 死亡人数,患病率(%,发病率10万,死亡率(10万)
卫生/医学统计学实习指导(R2.1x 版) /实习 2 计数资料的描述 2/7 tx1<-cumsum(x1) tx2<-cumsum(x2) ty1<-cumsum(y1) ty2<-cumsum(y2) ex2<-cumsum(standpop*x4)/100 ey2<-cumsum(standpop*y4)/100 x[7,]<-c('标化', tx1[6],tx2[6],100,round(ex2[6]/tstandpop[6]*100,2), ty1[6],ty2[6],100,round(ey2[6]/tstandpop[6]*100,2)) names(x)<-c('年龄组','甲调查人数','甲患病人数','甲患病 年龄构成(%)' ,'甲患病率(%)','乙调查人数','乙患病人数' ,' 乙患病年龄构成(%)' ,'乙患病率(%)') 算累计标准人口总和 计算累计总和 计算甲组频数、频率累计 计算乙组频数、频率累计 追加标化结果数据到数据框 ex2[6]/tstandpop[6]*100 和 ey2[6]/tstandpop[6]*100 是计算的标 准化率 给各个变量定义输出表的表头 x 输出标准化率打印结果 2、 某地某慢性病统计资料,见表 2-2。 表 2-2 某地某慢性病统计资料 年龄组 人口数 患病人数 新发病例数 死亡人数 0~ 383562 1105 9 3 20~ 542655 3236 38 25 40~ 423863 18538 167 131 60~ 103238 13636 129 102 合计 1453318 36515 343 261 问题1:计算患病率、发病率; 问题2:死亡率、病死率。 R 参考程序。 R 计算程序 程序解释 x<-read.table(textConnection(" age x1 x2 x3 x4 0- 383562 1105 9 3 20- 542655 3236 38 25 40- 423863 18538 167 131 60- 103238 13636 129 102 合计 1453318 36515 343 261 "), header=T, as.is=T) attach(x) y1<-x2/x1*100 y2<-x3/x1*100000 y3<-x4/x1*100000 y4<-x4/x2*100 x<-cbind(x,y1,y2,y3,y4) names(x)<-c('年龄组','人口数','患病人数','新发病例数' ,'死亡人数','患病率(%)','发病率(/10万)','死亡率(/10万)' 数据输入程序;数据框为 x 按公式计算 添加新变量 y1,y2,y3,y4 到数据框 修改输出表的表头
卫生/医学统计学实习指导(®2.1x版)/实习2计数资科的描述37 ,病死率(% 打印结果 3、某地2000年男女各年龄构成比资料,见表2-3。 表23某地2000年男女各年龄构成比(%) 年龄组 女 龄组 男 3.51 2.57 45- 4.18 429 5. 461 4.01 50 467 443 10. 4.43 382 6 392 373 29r 2. 60 2 2.26 2.11 65 2.05 1.53 25. 2.45 285 70 123 1.31 4.19 4.63 0.82 0.92 35 3.77 3.8 80+ 046 07 40- 2.77 2.89 问揽1:绘制人口金字塔图 计算全人口性别比 问题3 计算老年人口比重 计算老少比:计算负担系数: 司题4:计算有龄妇女占全人口的比重。 R参考程序 R计算程序 程序解释 x<-read.table(textConnection( 数据输入程序:数据框命名为X。因 m fage 为是分组有序,所以只输入分性别的 3.512.570- 年龄,m男性年龄构成,f女性年龄构 4614015. 成。 443382 10- 2.982.63 2.262.1120- 2.452.8525- 4.1946330- 37738535- 2.772.89 % 4.184.29 4.674.4350 39237355 27526160 2.051.536 1231.3 0- 0.820.9275 0.460.7780- "),header=T) 显示数据
卫生/医学统计学实习指导(R2.1x 版) /实习 2 计数资料的描述 3/7 ,'病死率(%)') x 打印结果 3、 某地 2000 年男女各年龄构成比资料,见表 2-3。 表2-3 某地2000年男女各年龄构成比(%) 年龄组 男 女 年龄组 男 女 0- 3.51 2.57 45- 4.18 4.29 5- 4.61 4.01 50- 4.67 4.43 10- 4.43 3.82 55- 3.92 3.73 15- 2.98 2.63 60- 2.75 2.61 20- 2.26 2.11 65- 2.05 1.53 25- 2.45 2.85 70- 1.23 1.31 30- 4.19 4.63 75- 0.82 0.92 35- 3.77 3.85 80+ 0.46 0.77 40- 2.77 2.89 问题1:绘制人口金字塔图; 问题2:计算全人口性别比; 问题3:计算老年人口比重;计算老少比;计算负担系数; 问题4:计算育龄妇女占全人口的比重。 R参考程序。 R 计算程序 程序解释 x<-read.table(textConnection(" m f age 3.51 2.57 0- 4.61 4.01 5- 4.43 3.82 10- 2.98 2.63 15- 2.26 2.11 20- 2.45 2.85 25- 4.19 4.63 30- 3.77 3.85 35- 2.77 2.89 40- 4.18 4.29 45- 4.67 4.43 50- 3.92 3.73 55- 2.75 2.61 60- 2.05 1.53 65- 1.23 1.31 70- 0.82 0.92 75- 0.46 0.77 80- "),header=T) x 数据输入程序;数据框命名为 x。因 为是分组有序,所以只输入分性别的 年龄,m 男性年龄构成,f 女性年龄构 成。 显示数据
卫生/医学统计学实习指(®2.1x版)/实习2计数资科的描述4/7 #install.packages('pyramid' 采用pyramid包来计算和绘制人口金 library(pyramid) 字塔,在使用前首先安装pvramid句 (只需安装一次以后都可以使用), 然 后使用library(0来加载pyramid包 pyramid(x,main="某地2000年人口金字塔",Llab="男 绘制人▣金字塔 性",Rlab"女性",Clab=年龄) attach(x) 计算相关指标 xSd<-xSm-xSf 构成比差 sexratio<-sum(m/sum(f) 性别比 elder<-sum(x[14:17.1:21) 老年人口比重(% younger<-sum(x[1:3.1:21) 少儿人口比重(%) laoshao<-elder/younger*100 老少比%) fudanfz<-elder 负担系数(% yulr<-sum(f 4:10 有龄妇女比(%) y<-cbind(sexratio,elder,younger,laoshao,fudanfz,yulr) 设计表头 colnames(y)K-c(性别比,'老年人口比重(%,'少儿人口 比重(%,老少比(%,'负担系数(%,育龄妇女比 y 输出结果 4、有报道称对输卵管结扎了的育龄妇女实施壶胞部壶脱部吻合术后,受孕率为067。现有 某医院对名输卵管结扎了的有龄妇女41名实施峡部-峡部吻合术,结果有39人受孕, 问题1: 试估计研究的受孕率的95%可信区间 问题2:问实施峡部峡部吻合术妇女的受孕率是否高于壶腹部壶腹部吻合术 R参考程序。 R计算程序 程序解释 binom.test(x=39,n=41,p-0.55) 二项分布精确法 prop.test(x=39,n=41.p=0.55) 正态近似法 问题1:试估计研究的受孕率及其的95%可信区间。 问题2:问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术 5、一般人群先天性心脏病的发病率为8%。,某研究者为探讨母亲吸烟是否会增大其小孩的 先天性心脏病的发病危险,对一群20~25岁有吸烟嗜好的孕妇进行了生有观察,在她们生 育的120名小孩中,经筛查有4人患了先天性心脏病, R参考程序。 R计算程序 程序解释 binom.test(x=4.n=120,p=0.008) 二顶分布精确法。X阳性数,n样本量。 r<-poisson.test(x=4,T=120*0.008) 泊松分布近似法。X阳性数,T单位样本量这里T是样本 rSconf.int/120 量乘以阳性率求得。最后求出阳性率。 试估计研究群体的婴 儿先天性心脏病的发病率及其95%可信区间 问题2:是否研究群体的婴儿先天性心脏病的发病率异于正常人群?
卫生/医学统计学实习指导(R2.1x 版) /实习 2 计数资料的描述 4/7 #install.packages('pyramid') library(pyramid) pyramid(x, main="某地 2000 年人口金字塔", Llab="男 性", Rlab="女性", Clab="年龄") 采用 pyramid 包来计算和绘制人口金 字塔,在使用前首先安装 pyramid 包 (只需安装一次以后都可以使用),然 后使用 library()来加载 pyramid 包 绘制人口金字塔 attach(x) x$d<- x$m-x$f sexratio<- sum(m)/sum(f) elder<-sum(x[14:17,1:2]) younger<-sum(x[1:3,1:2]) laoshao<-elder/younger*100 fudanfz<-elder+younger yulr<-sum(f[4:10]) y<-cbind(sexratio, elder, younger, laoshao , fudanfz , yulr) colnames(y)<-c('性别比', '老年人口比重(%)', '少儿人口 比重(%)', '老少比(%)', '负担系数(%)', '育龄妇女比 (%)' ) 计算相关指标 构成比差 性别比 老年人口比重(%) 少儿人口比重(%) 老少比(%) 负担系数(%) 育龄妇女比(%) 设计表头 y 输出结果 4、有报道称对输卵管结扎了的育龄妇女实施壶腹部-壶腹部吻合术后,受孕率为 0.67。现有 某医院对名输卵管结扎了的育龄妇女 41 名实施峡部-峡部吻合术,结果有 39 人受孕。 问题1:试估计研究的受孕率的95%可信区间。 问题 2:问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术? R 参考程序。 R 计算程序 程序解释 binom.test(x=39, n=41, p=0.55) 二项分布精确法 prop.test(x=39, n=41, p=0.55) 正态近似法 问题1:试估计研究的受孕率及其的95%可信区间。 问题 2:问实施峡部-峡部吻合术妇女的受孕率是否高于壶腹部-壶腹部吻合术? 5、一般人群先天性心脏病的发病率为 8‰,某研究者为探讨母亲吸烟是否会增大其小孩的 先天性心脏病的发病危险,对一群 20~25 岁有吸烟嗜好的孕妇进行了生育观察,在她们生 育的 120 名小孩中,经筛查有 4 人患了先天性心脏病。 R 参考程序。 R 计算程序 程序解释 binom.test(x=4, n=120, p=0.008) 二项分布精确法。x 阳性数,n 样本量。 r<-poisson.test(x=4, T=120*0.008) r$conf.int/120 泊松分布近似法。x 阳性数,T 单位样本量,这里 T 是样本 量乘以阳性率求得。最后求出阳性率。 问题1:试估计研究群体的婴儿先天性心脏病的发病率及其95%可信区间。 问题 2:是否研究群体的婴儿先天性心脏病的发病率异于正常人群?
卫生/医学统计学实习指(®2.1x版)/实习2计数资科的描述57 四、评价 1、第1题R输出结果 甲忠病率】 乙调查人数乙忠病人数乙老璃年的构度乙电璃率心 6 31.82 2、第2小题R输出结果 人日数病人新发清例致死亡人数发宝0万死亡率 万 将死 1235 259 3、第3小顺R输出结 人口金号 某地2000年人口金字塔 正 女性 467350223351167 011672335350246 人口相关指标 :点老年人a少儿人此基纱负超系要有#相安比基
卫生/医学统计学实习指导(R2.1x 版) /实习 2 计数资料的描述 5/7 四、评价 1、第 1 题 R 输出结果 2、第 2 小题 R 输出结果 3、第 3 小题 R 输出结果 人口金字塔 人口相关指标
卫生/医学统计学实习指®2.1x版)实习2计数资科料的描述67 4、第4小题R参考结果 “项式精确法结果 =41,p-0.55 Exact binomial test data:39 and 41 e=39 alternative hypothesia: 地 0.95129时 正态近似法结果 >prop.te9t(x=39,n=41,p=0.05) 1-sample proportions test with continuity correction data: X-9 quared=682.2092 va1ue<2.2e-16 0.829i8699150571 sample estimates: 0.9512195 警告信息: In prop,te3t(x=39,n=41,P=0.05):Chi-squaredi近似算法有可能不准 5、第5题R参考结果 二项分布精确法结果 >b1nom.tegt(x=4,n=120,p=0.008) Exact binomial test 品。 0.0091555060.083148721 probability of 泊松分布近似法结果
卫生/医学统计学实习指导(R2.1x 版) /实习 2 计数资料的描述 6/7 4、第4小题R参考结果 二项式精确法结果 正态近似法结果 5、第5题R参考结果 二项分布精确法结果 泊松分布近似法结果