卫生、医学统计学实习指导 (R2.1x版) Histogram ofx 曾庆彭斌 于重庆医科大学 2012-3
卫生、医学统计学实习指导 (R2.1x 版) 曾庆 彭斌 于重庆医科大学 2012-3
卫生医学统计学实习指导2.1x版)y实习1计量资料的描述18 实习1计量资料的描述 一、目的与要求 1、掌握计量资料频数表的编制方法和用途; 2、掌握均数、中位数、几何均数的意义、应用条件及计算: 3、掌握极差、四分位数间距、方差、标准差、变异系数的意义、应用条件及计算: 4、掌握百分位数的含义及计算方法。 二、学时 3学时 三、案例 1、2005年某市城镇8岁男孩握力(Kg)测验结果如表1-1所示。 表1-1120例8岁男孩握力(Kg)测验结果 8.6 10.7 14.6 13.5 15.0 15 112 17.5 92 12.8 8.6 11.0 8.6 9> 13.5 16.8 11.1 12.5 白 12.0 8.0 11.0 12.0 14.0 65 12.2 11.5 11.9 11.4 135 13 515 1 1.3 0 10.4 12.4 155 12.5 6 132 112 513131 11551 7.2 112 1 132 94 12.2 10.5 14.5 1 59 9.7 71 10 135 75 88 115 140 S007 问题1:编制握力数据的频数表,并绘制直方图: 问题2:计算握力数据的算术均数及中位数:哪一个指标表达集中趋势更合理, 为什么? 词题3. 计算极差、方差、标准差、变异系数 问题4: 计算P2.5 p975. 并计 算四分位数间距 问题5:试计算样本中握力小于元-的男孩占本次测验全部男孩的此例。 问题6:综合描述该资料。 第1小颗R参考程序 R计算程序 程序解释 x<-c8.6,10.7,14.6,13.5,15.0,9.4,15.5,14.0,11.2,11.2, 数据输入程序: 17.5,92,84,128,8.6,11.0,8.6.9.7,13.5,16.8 全部数据以向量的形式输入,保存为向 111125.10.5.120.80.110.120.7.0.14.0.115 量X,注意各个数据值之间以逗号分隔 13.5,65,15.0,12.2,11.5,11.9,114.13.5,11.3.150 函数cuO用于分组,这里则产生频数 3.5,134142,113,8.0,92,125,8.5,6.410.3 组。其选项breaks指定各组下限, 向量 115,112,12.0,9.0,10.0,13.5,11.4,74,13.2,11.8 形式。rgh=F选项指定分组时采用下 10.0.125.75.140.82.146.100.115.85.10.0 闭区间上开区间的形式。 10.4,124.9.6,132,112,5.5.11.0,12.4,9.5,10.3, 1551259072112.9987102.113124 132,94,10.2,122,105,145,12.0,15.0,9.7,63
卫生/医学统计学实习指导(R2.1x 版)/实习 1 计量资料的描述 1/8 实习 1 计量资料的描述 一、目的与要求 1、掌握计量资料频数表的编制方法和用途; 2、掌握均数、中位数、几何均数的意义、应用条件及计算; 3、掌握极差、四分位数间距、方差、标准差、变异系数的意义、应用条件及计算; 4、掌握百分位数的含义及计算方法。 二、学时 3 学时。 三、案例 1、 2005 年某市城镇 8 岁男孩握力(Kg)测验结果如表 1-1 所示。 表 1-1 120 例 8 岁男孩握力(Kg)测验结果 8.6 10.7 14.6 13.5 15.0 9.4 15.5 14.0 11.2 11.2 17.5 9.2 8.4 12.8 8.6 11.0 8.6 9.7 13.5 16.8 11.1 12.5 10.5 12.0 8.0 11.0 12.0 7.0 14.0 11.5 13.5 6.5 15.0 12.2 11.5 11.9 11.4 13.5 11.3 15.0 13.5 13.4 14.2 11.3 8.0 9.2 12.5 8.5 6.4 10.3 11.5 11.2 12.0 9.0 10.0 13.5 11.4 7.4 13.2 11.8 10.0 12.5 7.5 14.0 8.2 14.6 10.0 11.5 8.5 10.0 10.4 12.4 9.6 13.2 11.2 5.5 11.0 12.4 9.5 10.3 15.5 12.5 9.0 7.2 11.2 9.9 8.7 10.2 11.3 12.4 13.2 9.4 10.2 12.2 10.5 14.5 12.0 15.0 9.7 6.3 7.1 10.0 10.1 11.5 9.8 7.8 12.0 9.7 12.0 10.0 13.5 7.5 12.5 10.5 16.0 9.8 10.0 11.5 14.0 7.4 问题 1:编制握力数据的频数表,并绘制直方图; 问题 2:计算握力数据的算术均数及中位数;哪一个指标表达集中趋势更合理,为什么? 问题 3:计算极差、方差、标准差、变异系数; 问题 4:计算 P2.5,P50,P97.5,并计算四分位数间距; 问题 5:试计算样本中握力小于 x s 的男孩占本次测验全部男孩的比例。 问题 6:综合描述该资料。 第 1 小题 R 参考程序。 R 计算程序 程序解释 x<-c(8.6 ,10.7,14.6,13.5,15.0, 9.4,15.5,14.0,11.2,11.2, 17.5, 9.2, 8.4,12.8, 8.6,11.0, 8.6, 9.7,13.5,16.8, 11.1,12.5,10.5,12.0, 8.0,11.0,12.0, 7.0,14.0,11.5, 13.5, 6.5,15.0,12.2,11.5,11.9,11.4,13.5,11.3,15.0, 13.5,13.4,14.2,11.3, 8.0, 9.2,12.5, 8.5, 6.4,10.3, 11.5,11.2,12.0, 9.0,10.0,13.5,11.4, 7.4,13.2,11.8, 10.0,12.5, 7.5,14.0, 8.2,14.6,10.0,11.5, 8.5,10.0, 10.4,12.4, 9.6,13.2,11.2, 5.5,11.0,12.4, 9.5,10.3, 15.5,12.5, 9.0, 7.2,11.2, 9.9, 8.7,10.2,11.3,12.4, 13.2, 9.4,10.2,12.2,10.5,14.5,12.0,15.0, 9.7, 6.3, 数据输入程序; 全部数据以向量的形式输入,保存为向 量 x。注意各个数据值之间以逗号分隔。 函数 cut()用于分组,这里则产生频数 组。其选项 breaks 指定各组下限,向量 形式。right=F 选项指定分组时采用下 闭区间上开区间的形式
卫生医学统计学实习指导2.1x版)实习1计量资料的描述28 7.1100.10111.5.9.8.7.8120.9.7.120.10.0. 13.5.7.5.12.5.10.5.16.0.9.8.10.0.11.5.14.0.7.4 g<-cut(x,breaks=5:18,right=F) 在输出窗口显示输入的数据 在输出窗口显示分组后的数据 <-data frame(table()) 产生频数表 Spercent<-tSFreq/su n(tSFreq 计算频率(百分比,sum0求和函数 Scum.freq<-cumsum(tSFreq) 计算累计频数,cumsum)累计函数 Scum.percent<-cumsum(tSpercent) 计算累计频率 ames)-c('组段,'频数,频率(%,累计频数,累计频 设计表头 率%n: 显示频救表 range(x):mean(x):sd(x):var(x):sd(x)/mean(x)*100 四分位数间距、 summary(x) 计算最小值、p25、p50(中位数)、p75 最大值 shapiro.test(x) 进行正态性检验 tem(x) 作茎叶图 oxplot() 作箱式图 qqnorm(x):qqline(x) 作正态概率图,且绘制正态参考线 d<-densitv(x) 估计概率密度 h<-hist(x,breaks=5:18,right=F,col='red') 绘制直方图,设置颜色,且保留相关计 lines(d) 算讨程值,在图上绘制概率密度曲线 h 显示有关的计算结果 2、某医院某段时间内剖宫产分娩的住院天数如表1-2所示。 表12某医院部宫产分峰的住院天数分布 组段 频数 频率%)累计频数累计频率%) 3 0.12 0.12 4 37 452 38 4.65 256 3130 294 35.94 2836 6430 入 15.40 79.71 8 72 8.80 724 88.51 9 38 465 762 93.15 10- 18 220 780 95.35 11 36g 98.04 12 5 0.61 807 9866 13 0.98 815 99.63 14 0.24 817 99.88 1516 1 0.12 81g 100.00 问题1:绘制直方图,说明剖宫产分娩住院时间的分布特征 问题2:计算剖宫产分婉住院天数的算术均数及其中位数:哪 个更合理
卫生/医学统计学实习指导(R2.1x 版)/实习 1 计量资料的描述 2/8 7.1 ,10.0,10.1,11.5, 9.8, 7.8,12.0, 9.7,12.0,10.0, 13.5, 7.5,12.5,10.5,16.0, 9.8,10.0,11.5,14.0, 7.4 ) g<-cut(x, breaks=5:18, right = F) x g 在输出窗口显示输入的数据 在输出窗口显示分组后的数据 t<-data.frame(table(g)) t$percent<-t$Freq/sum(t$Freq) t$cum.freq<-cumsum(t$Freq) t$cum.percent<-cumsum(t$percent) names(t)<-c('组段','频数','频率(%)','累计频数','累计频 率(%)')t 产生频数表 计算频率(百分比),sum()求和函数 计算累计频数,cumsum()累计函数 计算累计频率 设计表头 显示频数表 range(x);mean(x);sd(x);var(x);sd(x)/mean(x)*100 summary(x) shapiro.test(x) stem(x) boxplot(x) qqnorm(x);qqline(x) d<-density(x) h<-hist(x,breaks=5:18, right=F, col=’red’) lines(d) h 计算握力:全距、均数、标准差、方差、 四分位数间距、变异系数 计算最小值、p25、p50(中位数)、p75、 最大值 进行正态性检验 作茎叶图 作箱式图 作正态概率图,且绘制正态参考线 估计概率密度 绘制直方图,设置颜色,且保留相关计 算过程值,在图上绘制概率密度曲线 显示有关的计算结果 2、 某医院某段时间内剖宫产分娩的住院天数如表 1-2 所示。 表 1-2 某医院剖宫产分娩的住院天数分布 组段 频数 频率(%) 累计频数 累计频率(%) 3~ 1 0.12 1 0.12 4~ 37 4.52 38 4.65 5~ 256 31.30 294 35.94 6~ 232 28.36 526 64.30 7~ 126 15.40 652 79.71 8~ 72 8.80 724 88.51 9~ 38 4.65 762 93.15 10~ 18 2.20 780 95.35 11~ 22 2.69 802 98.04 12~ 5 0.61 807 98.66 13~ 8 0.98 815 99.63 14~ 2 0.24 817 99.88 15~16 1 0.12 818 100.00 问题 1:绘制直方图,说明剖宫产分娩住院时间的分布特征; 问题 2:计算剖宫产分娩住院天数的算术均数及其中位数;哪一个更合理?
卫生医学统计学实习指导R2.1x版)y实习1计量资料的描述38 问题3:计算描述其变异程度的指标。 第2小题R参考程序 R计算程序 程序解释 f-c1.37.256232.126.72.38.18.22.5.8.2.1) 数据输入程序:先输入频数,保存为向量£, g<.315+05 然后输入频数分组保存为向量g x<-rep(g.f) 根据频数分组和各组频数还原数据保存为向品 str(x) pO复制数据值,stO显示向量x的基本信 在输出窗口显示输入的数据,很多! #描述统计最 全距、均数、中位数、标准差、方差、四分位 ange(x).mean(x):sd(x)var(x).sd(x)/mean(x)100 数间距、变异系数,计算最小值、p25、p50(中 summary(x) 位数)、p75、最大值 shapiro.test(x) 进行正态性检验 stem(x) 作茎叶图、箱式图、正态概率图,且绘制正态 gqnorm(x);qqline(x) 参若线 <-density(x bw=1) 估计概率密度,指定组距 <-hist(x.breaks-g.right=F.col-red.prob-T) 绘制直方图,设置颜色,且保留相关计算过程 ines(d) 值,在图上绘制概率密度曲线 h 显示有关的计算结果 四、评 1、第 题R运行参考结果 频数表 >t 频数 。.辆界计须数紧计率 6.71 2.5000000 3.333333 [7,8) 6.66666日 10.000000 411.6666 30.00 [1 53 44.166666 2, 13,14 9.166666 8 5,833399 [16,17 .666666 119 99.166666 10.833333 120100.0000000 描述统计量计算主要结果
卫生/医学统计学实习指导(R2.1x 版)/实习 1 计量资料的描述 3/8 问题 3:计算描述其变异程度的指标。 第 2 小题 R 参考程序。 R 计算程序 程序解释 f<-c(1,37,256,232,126,72,38,18,22,5,8,2,1) g<-3:15+0.5 x<-rep(g,f) str(x) 数据输入程序;先输入频数,保存为向量 f, 然后输入频数分组保存为向量 g 根据频数分组和各组频数还原数据保存为向量 x,rep()复制数据值,str()显示向量 x 的基本信 息 x 在输出窗口显示输入的数据,很多! #描述统计量 range(x);mean(x);sd(x);var(x);sd(x)/mean(x)*100 summary(x) shapiro.test(x) stem(x) qqnorm(x);qqline(x) d<-density(x,bw=1) h<-hist(x,breaks=g, right=F,col='red',prob=T) lines(d) h 全距、均数、中位数、标准差、方差、四分位 数间距、变异系数,计算最小值、p25、p50(中 位数)、p75、最大值 进行正态性检验 作茎叶图、箱式图、正态概率图,且绘制正态 参考线 估计概率密度,指定组距 绘制直方图,设置颜色,且保留相关计算过程 值,在图上绘制概率密度曲线 显示有关的计算结果 四、评价 1、第一小题 R 运行参考结果。 频数表 描述统计量计算主要结果
卫生医学统计学实习指导R2.1x版)实习1计量资料的描述48 [1】11.12833 5609g.85288n89.86n56 正态性检验结果 >shap1ro.test(x Shapiro-Wilk normality test 4 P-value0.92 茎叶图 stem(x) The decimal point is at the I 7101244558 88229969677889 10100000001223345557 12880032489555589 13122245555555 148883566 16108 1715 >1 盒式图和正态概率图
卫生/医学统计学实习指导(R2.1x 版)/实习 1 计量资料的描述 4/8 正态性检验结果 茎叶图 盒式图和正态概率图