【练习题】一、填空题1.描述定量资料集中趋势的指标有2.描述定量资料资料离散趋势的指标有3.抗体滴度宜用描述集中趋势。和4.描述对称分布资料集中趋势和离散趋势的指标分别是0和5.描述偏态分布资料集中趋势和离散趋势的指标分别是?和6.定量变量可分为6二、选择题1.描述一组偏态分布资料的变异度,以()指标较好A.全距B.标准差C.变异系数D.四分位数间距E.方差2.用均数和标准差可以全面描述()资料的特征A.正偏态分布B.负偏态分布C.对称分布D.对数正态分布3.比较身高和体重两组数据变异度大小宜采用(),A.变异系数B.方差C.极差D.标准差E.四分位数间距4.偏态分布宜用()描述其分布的集中趋势A.算术均数B.标准差C.中位数D.四分位数间距E.方差5.最小组段无下限或最大组段无上限的频数分布资料,可用()描述其集中趋势.A.均数B.标准差C.中位数D.四分位数间距E.几何均数6.血清学滴度资料最常用来表示其平均水平的指标是().A.算术平均数B.中位数C.几何均数D.变异系数E.标准差7.变异系数越大说明()A.标准差越大B.标准差、平均数都大C.以均数为准变异程度大D.平均数小8.已知某疾病患者10人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>12,其潜伏期的平均水平约为()A.9天B.9.5天C.10天D.11天9.对于同一组资料,哪个指标没有考虑到每个观察值的变异()A.方差B.总体标准差C.变异系数D.四分位数间数10.描述一组数值变量资料的分布特征时()A.应同时选用算术平均数和标准差B.应同时选用中位数和四分位数间距C.根据分布类型选用相应的集中、离散趋势指标D.以上都不正确三、判断题1.对数正态分布资料最好计算儿何均数以表示其平均水平。()2.不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。()3.理论上只有服从正态分布条件的变量的算术均数等于中位数。()4.少数几个数据比大部分数据大几百倍,一般不宜用算术均数表示平均水平。()5.数据按等比级数分组时,不管分布如何,都应该计算几何均数表示平均水平。()6.样本中位数不受样本中的极端值影响。()7.分组的连续分布资料,计算百分位数要求组距相等。()8.对于连续分布资料,单位相同时,也可用变异系数比较两个变量的相对离散度。()9.从同一连续分布总体中随机抽样,样本含量越大,理论上从样本算得的变异系数越小。()10.对于计量数据,不应按分组方式决定是否计算几何均数。()15
15 【练习题】 一、填空题 1.描述定量资料集中趋势的指标有 。 2.描述定量资料资料离散趋势的指标有 。 3.抗体滴度宜用 描述集中趋势。 4.描述对称分布资料集中趋势和离散趋势的指标分别是 和 。 5. 描述偏态分布资料集中趋势和离散趋势的指标分别是 和 。 6.定量变量可分为 和 。 二、选择题 1.描述一组偏态分布资料的变异度,以( )指标较好. A. 全距 B. 标准差 C. 变异系数 D. 四分位数间距 E.方差 2.用均数和标准差可以全面描述( )资料的特征. A. 正偏态分布 B. 负偏态分布 C. 对称分布 D.对数正态分布 3.比较身高和体重两组数据变异度大小宜采用( ). A. 变异系数 B. 方差 C. 极差 D. 标准差 E.四分位数间距 4.偏态分布宜用( )描述其分布的集中趋势. A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 E.方差 5.最小组段无下限或最大组段无上限的频数分布资料,可用( )描述其集中趋势. A. 均数 B. 标准差 C. 中位数 D. 四分位数间距 E.几何均数 6.血清学滴度资料最常用来表示其平均水平的指标是( ). A.算术平均数 B.中位数 C.几何均数 D.变异系数 E.标准差 7. 变异系数越大说明( ) A.标准差越大 B.标准差、平均数都大 C.以均数为准变异程度大 D.平均数小 8.已知某疾病患者 10 人的潜伏期(天)分别为:6,13,5,9,12,10,8,11,8,>12, 其潜伏期的平均水平约为( ) A. 9 天 B. 9.5 天 C. 10 天 D. 11 天 9.对于同一组资料,哪个指标没有考虑到每个观察值的变异( ) A.方差 B.总体标准差 C.变异系数 D.四分位数间数 10.描述一组数值变量资料的分布特征时( ) A.应同时选用算术平均数和标准差 B.应同时选用中位数和四分位数间距 C.根据分布类型选用相应的集中、离散趋势指标 D.以上都不正确 三、判断题 1.对数正态分布资料最好计算几何均数以表示其平均水平。( ) 2.不论数据呈什么分布,用算术均数和用中位数表示平均水平都一样合理。( ) 3.理论上只有服从正态分布条件的变量的算术均数等于中位数。( ) 4.少数几个数据比大部分数据大几百倍,一般不宜用算术均数表示平均水平。( ) 5.数据按等比级数分组时,不管分布如何,都应该计算几何均数表示平均水平。( ) 6.样本中位数不受样本中的极端值影响。( ) 7.分组的连续分布资料,计算百分位数要求组距相等。( ) 8.对于连续分布资料,单位相同时,也可用变异系数比较两个变量的相对离散度。( ) 9.从同一连续分布总体中随机抽样,样本含量越大,理论上从样本算得的变异系数越小。( ) 10.对于计量数据,不应按分组方式决定是否计算几何均数。( )
四、思考题1.描述定量资料集中趋势的指标有哪些,各适用于什么情况,有什么优缺点?2.描述定量资料离散趋势的指标有哪些,各适用于什么情况,有什么优缺点?3.为什么要根据数据的性质和分布来选择不同的描述集中趋势和离散趋势的指标?【作业】1.从某地20岁男青年中随机抽查120名,根据他们的身高和体重测量结果计算均数和标准差,算得身高X(厘米)为166.06±4.95,体重Y(公斤)为53.72±4.47。试判断两者离散程度的大小。3.某研究者随机调查了唐山市2010年某单位30名44罗健康男性的体重指数(kg/m)如下:26.32,24.11,25.80,18.10,26.37,25.01,25.61,26.96,29.76,28.74,21.97,22.86,27.34,24.93,22.09,27.68,24.80,24.57,23.66,26.70,25.39,27.13,26.78,28.70,26.61,30.42,25.14,22.54,26.78,26.81。试编制体重指数数据的频数表,绘制直方图概括其分布特征,并选择合适的统计量描述其集中趋势、离散趋势。(使用SPSS软件分析)16
16 四、思考题 1.描述定量资料集中趋势的指标有哪些,各适用于什么情况,有什么优缺点? 2.描述定量资料离散趋势的指标有哪些,各适用于什么情况,有什么优缺点? 3.为什么要根据数据的性质和分布来选择不同的描述集中趋势和离散趋势的指标? 【作业】 1.从某地 20 岁男青年中随机抽查 120 名,根据他们的身高和体重测量结果计算均数和标准 差,算得身高 X(厘米)为 166.064.95,体重 Y(公斤)为 53.724.47。试判断两者离散 程度的大小。 3.某研究者随机调查了唐山市 2010 年某单位 30 名 44 岁健康男性的体重指数(kg/m2)如下: 26.32,24.11,25.80,18.10,26.37,25.01,25.61,26.96,29.76,28.74,21.97,22.86, 27.34,24.93,22.09,27.68,24.80,24.57,23.66,26.70,25.39,27.13,26.78,28.70, 26.61,30.42,25.14,22.54,26.78,26.81。试编制体重指数数据的频数表,绘制直方图, 概括其分布特征,并选择合适的统计量描述其集中趋势、离散趋势。(使用 SPSS 软件分析)
实习四:定性资料的统计描述【目的要求】1.掌握相对数各指标的意义及其spss分析过程。2.掌握应用相对数时的注意事项【案例分析】案例1:某医生在一个有5万人口的社区进行肺癌调查,通过随机抽样共调查2000人,全部调查工作在10天内完成,调查内容包括流行病学资料和临床实验室检查资料。调查结果列于下表,该医生对表中资料进行统计分析,认为男性肺癌的发病率高于女性,而死亡情况则完全相反。某社区不同性别人群肺癌调查情况性别检查人数有病人数死亡人数死亡率(%)发病率(%)男6350.00. 571050女3295066.70. 329合计5200055.60. 45请讨论:1)该医生所选择的统计指标正确吗?2)该医生对指标的计算方法恰当吗?3)应该如何作适当的统计分析?案例2:根据某医生统计了本医院从1960年至1999年的住院病例,得到表1和表2的数据,根据表1,该医生认为“40年来,10种心脏病总的发病率逐年代增高”:根据表2,该医生认为“在10种心脏病中,冠心病发病率迅速增高,从20世纪70年代起居心脏病中第一位”。应如何评价这位医生的分析结论?这两份资料各有什么用处?表11960一1999年住院患者中心脏病患者的频率住院患者中10种心脏病患住院患者中10种心脏病年度年度者的频率(%)患者的频率(%)4.68.91960~1980~7. 31970~1990~200010.1表21960一1999年住院患者中心脏病患者中冠心病患者的频率10种心脏病住院患者中冠心10种心脏病住院患者中年度年度病患者的频率(%)冠心病患者的频率(%)1960~9.381980~29.211970~30.101990~200051.4517
17 实习四:定性资料的统计描述 【目的要求】 1. 掌握相对数各指标的意义及其 spss 分析过程。 2. 掌握应用相对数时的注意事项 【案例分析】 案例 1:某医生在一个有 5 万人口的社区进行肺癌调查,通过随机抽样共调查 2000 人,全 部调查工作在 10 天内完成,调查内容包括流行病学资料和临床实验室检查资料。调查结果 列于下表,该医生对表中资料进行统计分析,认为男性肺癌的发病率高于女性,而死亡情况 则完全相反。 某社区不同性别人群肺癌调查情况 性别 检查人数 有病人数 死亡人数 死亡率(%) 发病率(%) 男 1050 6 3 50.0 0.57 女 950 3 2 66.7 0.32 合计 2000 9 5 55.6 0.45 请讨论: 1)该医生所选择的统计指标正确吗? 2) 该医生对指标的计算方法恰当吗? 3)应该如何作适当的统计分析? 案例 2:根据某医生统计了本医院从 1960 年至 1999 年的住院病例,得到表 1 和表 2 的数据, 根据表 1,该医生认为“40 年来,10 种心脏病总的发病率逐年代增高”;根据表 2,该医生 认为“在 10 种心脏病中,冠心病发病率迅速增高,从 20 世纪 70 年代起居心脏病中第一位”。 应如何评价这位医生的分析结论?这两份资料各有什么用处? 表 1 1960-1999 年住院患者中心脏病患者的频率 年度 住院患者中 10 种心脏病患 者的频率(%) 年度 住院患者中 10 种心脏病 患者的频率(%) 1960~ 4.6 1980~ 8.9 1970~ 7.3 1990~2000 10.1 表 2 1960-1999 年住院患者中心脏病患者中冠心病患者的频率 年度 10 种心脏病住院患者中冠心 病患者的频率(%) 年度 10 种心脏病住院患者中 冠心病患者的频率(%) 1960~ 9.38 1980~ 29.21 1970~ 30.10 1990~2000 51.45
案例3:某医生对某地某年2-4岁儿童麻疹发病情况进行调查,以发病例数除以观察儿童数得到了两个年龄组儿童的麻疹发病率(下表),该医生认为:从发病率看,该地3-4岁的儿童麻疹发病的危险性比2岁儿童低。你认为该医生的结论是否正确?某地某年3-4岁儿童麻疹发病情况年龄儿童总人数易感儿童书麻疹发病例数发病率(%)2-141378349334.893-491822817118.63【SPSS操作】1.单个定性变量的描述分析Analyze——DescriptiveStatistics——Frequencies——选择分析的变量——Display一取消所有的基本统计量frequencytablesStatistics—Continue——Charts——选择合适的统计图——Percentages——Continue——OK2.多指标的描述分析一一交叉表(Crosstabs)Analyze-Descriptive Statistics--Crosstabs一一选择行变量Row(s)一一选择列变量Column(s)——Cells——选择表内统计量——Continue——DisplayClusteredbar-OKCharts...【练习题】一、填空题和1.定性变量可分为2.常用的相对数指标包括和3.标准化率的计算方法有4.标准化法的目的是5.动态数列说明二、选择题1.某医院某年住院病人中胃癌患者占5%,则()A.5%是构成比指标B.5%是频率指标C.5%是相对比指标D.5%说明胃癌在人群中的严重性2.计算麻疹疫苗接种后血清检查的阳转率,分母为()A.麻疹易感人群B.麻疹患者数C.麻疹疫苗接种人数D.麻疹疫苗接种后的阳转人数3.某部队夏季拉练,发生中暑21例,其中北方籍战士为南方籍战士的2.5倍,则结论为()A.北方战士易中暑B.南方战士易中暑C.北方比南方战士中暑率高D.尚不能得出结论4.一项新式治疗方法可延长病人的生命,但不能治愈该病,则最有可能发生的情况是()A.该病患病率增加B.该病患病率减少C.该病发病率减少D.该病发病率与患病率均减少5.某市有30万人口,2002年共发现2500名肺结核患者,全年总死亡人数为3000人,其中肺结死亡98人,要说明肺结核死亡的严重程度,最好应用()A.初死亡率B.肺结核死亡率C.肺结核死亡构成D.肺结核的病死率6.某病患者120人,其中男性114人,女性6人,分别占95%与5%,则结论为()A.该病男性易得B.该病女性易得C.尚不能得出结论D.根据该资料可计算男女的患病率7.要比较甲乙两厂某工种工人某种职业病患病率的高低,采取标准化法的原理是()A.假设甲乙两厂的工人数相同B.假设甲乙两厂患某职业病的工人数相同C.假设甲乙两厂某工种工人的工龄构成比相同D.假设甲乙两厂某职业病的患病率相同18
18 案例 3:某医生对某地某年 2-4 岁儿童麻疹发病情况进行调查,以发病例数除以观察儿童数, 得到了两个年龄组儿童的麻疹发病率(下表),该医生认为:从发病率看,该地 3-4 岁的儿 童麻疹发病的危险性比 2 岁儿童低。你认为该医生的结论是否正确? 某地某年 3-4 岁儿童麻疹发病情况 年龄 儿童总人数 易感儿童书 麻疹发病例数 发病率(%) 2- 1413 783 493 34.89 3-4 918 228 171 18.63 【SPSS 操作】 1.单个定性变量的描述分析 Analyze——Descriptive Statistics——Frequencies——选择分析的变量——Display frequency tables —— Statistics.—— 取 消 所 有 的 基 本 统 计 量 ——Continue——Charts.——选择合适的统计图——Percentages ——Continue ——OK 2.多指标的描述分析——交叉表(Crosstabs) Analyze——Descriptive Statistics——Crosstabs ——选择行变量 Row(s) ——选择列 变量 Column(s) ——Cells ——选择表内统计量—— Continue ——Display Clustered bar Charts. —— OK 【练习题】 一、填空题 1.定性变量可分为 和 。 2.常用的相对数指标包括 。 3.标准化率的计算方法有 和 。 4.标准化法的目的是 。 5.动态数列说明 。 二、选择题 1.某医院某年住院病人中胃癌患者占 5%,则( ) A.5%是构成比指标 B.5%是频率指标 C.5%是相对比指标 D.5%说明胃癌在人群中的严重性 2. 计算麻疹疫苗接种后血清检查的阳转率,分母为( ) A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 3.某部队夏季拉练,发生中暑 21 例,其中北方籍战士为南方籍战士的 2.5 倍,则结论为( ) A.北方战士易中暑 B.南方战士易中暑 C.北方比南方战士中暑率高 D.尚不能得出结论 4.一项新式治疗方法可延长病人的生命,但不能治愈该病,则最有可能发生的情况是( ) A.该病患病率增加 B.该病患病率减少 C.该病发病率减少 D.该病发病率与患病率均减少 5.某市有 30 万人口,2002 年共发现 2500 名肺结核患者,全年总死亡人数为 3000 人,其中 肺结死亡 98 人,要说明肺结核死亡的严重程度,最好应用( ) A.初死亡率 B.肺结核死亡率 C.肺结核死亡构成 D.肺结核的病死率 6.某病患者 120 人,其中男性 114 人,女性 6 人,分别占 95%与 5%,则结论为( ) A.该病男性易得 B.该病女性易得 C.尚不能得出结论 D.根据该资料可计算男女的患病率 7.要比较甲乙两厂某工种工人某种职业病患病率的高低,采取标准化法的原理是( ). A.假设甲乙两厂的工人数相同 B.假设甲乙两厂患某职业病的工人数相同 C.假设甲乙两厂某工种工人的工龄构成比相同 D.假设甲乙两厂某职业病的患病率相同