第十三章x2检验与方差分析 第一节拟合优度检验 拟合优度检验(比率拟合检验)·正态拟合检验 第二节无关联性检验 独立性、理论频数及自由度·频数比较和连续性修正·关系强度的量度 第三节方差分析 总变差及其分解·自由度·检验统计量F的计算·相关比率·方差分析的 几点讨论 第四节回归方程与相关系数的检验 回归系数的检验·积差系数的检验·回归方程的区间估计 、填空 1.方差分析可以对多个总体()是否相等进行检验 2.列联表是按()标志把两个变量的频数进行交互分类的。 3.在使用z2检验法进行列联表检验所使用的自由度为()。 4.在对()的列联表进行检验时,存在着x2(1)=Z2的关系。 5.列联表检验是通过()而不是通过相对频数的比较进行的。 6.方差分析是()检验的推广,一般用于处理自变量是一个()定类变量和 因变量是一个定距变量之间的关系。 7.在对6×5的列联表进行方差分析时,与组间平方和相联系的自由度为(),与 组内平方和相联系的自由度为(),与总平方和相联系的自由度为()。 8.方差分析中把已解释的变差对总变差的比值称为()。 9.检验两个总体变量(定距一定距变量)是否具有线性关系,主要是检验总体的() 是否等于零 10.对于定距一定距变量计算积差系数r时,要求相关的两个变量均为()变量 在回归分析中,只有()变量才是随机的 l1.在实际运用中,方差分析的结果常用一种称为()的标准形式的表格表示出来 12.取Y±1Sx,那么在散点图上约有()%的观测点落在其间 13.取Y±2Sx,那么在散点图上约有()%的观测点落在其间 4.取X±3Smx,那么在散点图上约有()%的观测点落在其间
1 第十三章 2 检验与方差分析 第一节 拟合优度检验 拟合优度检验(比率拟合检验)·正态拟合检验 第二节 无关联性检验 独立性、理论频数及自由度·频数比较和连续性修正·关系强度的量度 第三节 方差分析 总变差及其分解·自由度·检验统计量 Fo 的计算·相关比率·方差分析的 几点讨论 第四节 回归方程与相关系数的检验 回归系数的检验·积差系数的检验·回归方程的区间估计 一、填空 1.方差分析可以对多个总体( )是否相等进行检验。 2.列联表是按( )标志把两个变量的频数进行交互分类的。 3.在使用 2 检验法进行列联表检验所使用的自由度为( )。 4.在对( )的列联表进行检验时,存在着 (1) 2 = 2 Z 的关系。 5.列联表检验是通过( )而不是通过相对频数的比较进行的。 6.方差分析是( )检验的推广,一般用于处理自变量是一个( )定类变量和 因变量是一个定距变量之间的关系。 7.在对 6×5 的列联表进行方差分析时,与组间平方和相联系的自由度为( ),与 组内平方和相联系的自由度为( ),与总平方和相联系的自由度为( )。 8.方差分析中把已解释的变差对总变差的比值称为( )。 9.检验两个总体变量(定距—定距变量)是否具有线性关系,主要是检验总体的( ) 是否等于零。 10.对于定距—定距变量计算积差系数 r 时,要求相关的两个变量均为( )变量。 在回归分析中,只有( )变量才是随机的。 11.在实际运用中,方差分析的结果常用一种称为( )的标准形式的表格表示出来。 12.取 Yc ±1SY/X ,那么在散点图上约有( )%的观测点落在其间。 13.取 Yc ±2SY/X ,那么在散点图上约有( )%的观测点落在其间 14.取 Yc ±3SY/X ,那么在散点图上约有( )%的观测点落在其间
二、单项选择 1.在x2比率拟合优度检验中,对于选定的显著性水平a求临界值x2,此时的自由 度是()。 A实验数据总数n- B变量X的取值种类数c-1 C实验数据总数n一变量X的取值种类数c D实验数据总数n+变量X的取值种类数c 2.在x2正态拟合优度检验中,对于选定的显著性水平a求临界值x2,此时的自由度 是() A数据的分组数 B数据的分组数一1 C数据的分组数-2 D数据的分组数-3 3.使用x2检验法对nxc列联表进行无关联性检验,与x。这个检验统计量相联系的自 由度()。 B D(n-1)x(c-1) 4.对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部 分卡方x2影响最大。这是利用了卡方分布的() A恒正性B方差为期望值的2倍C可加性D前三者 5.在方差分析中,自变量是 A定类变量B定序变量 C定距变量D定比变量 6.在直线回归分析中,相关比率PRC=0.750。那么,积差系数r=( A0.750 B0.5625 C1.333 D0.866 三、多项选择 1.可以用于拟和优度检验的方法有() Ax检验 BF检验 C累计频数检验 D游程检验 2.方差分析法()。 A可以用于一个总体均值是否相等的检验 B可以用于两个总体均值是否相等的检验 C可以用于三个总体均值是否相等的检验 D可以用于多个总体均值是否相等的检验 3.对拟和优度推断结果,下列说法正确的是() A当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表 明实际情况切合零假设 B数据少如果否定了零假设,这一否定的可靠性是很大的 C规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多 大实际意义
2 二、单项选择 1.在 2 比率拟合优度检验中,对于选定的显著性水平α求临界值 2 ,此时的自由 度是( )。 A 实验数据总数 n―1 B 变量 X 的取值种类数 c―l C 实验数据总数 n — 变量 X 的取值种类数 c D 实验数据总数 n + 变量 X 的取值种类数 c 2.在 2 正态拟合优度检验中,对于选定的显著性水平α求临界值 2 ,此时的自由度 是( )。 A 数据的分组数 B 数据的分组数―l C 数据的分组数―2 D 数据的分组数―3 3.使用 2 检验法对 n×c 列联表进行无关联性检验,与 2 o 这个检验统计量相联系的自 由度( )。 A n―1 B c―l C n ―c D (n—1)×(c—1) 4.对于一个复杂的列联表,还可以把它进一步分解为许多子表,以确定表格的那一部 分卡方 2 o 影响最大。这是利用了卡方分布的( )。 A 恒正性 B 方差为期望值的 2 倍 C 可加性 D 前三者 5.在方差分析中,自变量是( )。 A 定类变量 B 定序变量 C 定距变量 D 定比变量 6.在直线回归分析中,相关比率 PRC=0.750。那么,积差系数 r=( )。 A 0.750 B 0.5625 C 1.333 D 0.866 三、多项选择 1.可以用于拟和优度检验的方法有( )。 A 2 检验 B F 检验 C 累计频数检验 D 游程检验 2.方差分析法( )。 A 可以用于一个总体均值是否相等的检验 B 可以用于两个总体均值是否相等的检验 C 可以用于三个总体均值是否相等的检验 D 可以用于多个总体均值是否相等的检验 3.对拟和优度推断结果,下列说法正确的是( )。 A 当试验规模很小而作出维持原假设决定时,这可能只是数据太少,不是真的表 明实际情况切合零假设 B 数据少如果否定了零假设,这一否定的可靠性是很大的 C 规模极大的试验可把零假设有极细微的差别检测出来,而这种差别可能并无多 大实际意义
D若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持 4.使用x2检验拟和优度,下列说法正确的是() A相对频数相同的列联表,在统计检验中其显著性相同 B相对频数相同的列联表,在统计检验中其显著性并不相同 C相对频数相同的列联表,样本容量增加K倍,x。不变 D相对频数相同的列联表,样本容量增加K倍,x2变也扩大K倍 5.相关比率PRE度量的可以是()。 A定类一定距变量之间的相关程度 B定距一定距变量之间的相关程度 线性相关 D非线性相关 6.下列说法正确的是()。 A方差分析的优点在于,一个检验可以代替多个均值差检验 B方差分析总是优于一系列的均值差检验 C方差分析中的自变量X如果是二分变量,不论采用方差分析或均值差检验,其 结果完全相同 D总变差分解的思想可以直接推广至多因素显著性检验 7.方差分析所包含的假定包括()。 A正态分布 B独立随机样本 C等方差性 D非负性 四、名词解释 拟和优度检验2.列联表3.理论频数4.方差分析5.方差分析表 6.总变差7.组内变差8.组间平方和9.相关比率10.估计标准误差 五、判断题 1.理论频数∫与观测频数后越接近,经验分布与理论分布拟合程度越好 2.对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不 3.规模极大的试验可把零假设有极细微的差别检测出来。 4.如何求得列联表中的理论频数就成了独立性检验的关键 ))) 5.x2检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点。 6.x2检验不适用于定类变量和定序变量的相关统计 ()
3 D 若试验规模很大而仍能维持原假设,则可视为是对原假设的有力支持 4.使用 2 检验拟和优度,下列说法正确的是( )。 A 相对频数相同的列联表,在统计检验中其显著性相同 B 相对频数相同的列联表,在统计检验中其显著性并不相同 C 相对频数相同的列联表,样本容量增加 K 倍, 2 o 不变 D 相对频数相同的列联表,样本容量增加 K 倍, 2 o 变也扩大 K 倍 5.相关比率 PRE 度量的可以是( )。 A 定类—定距变量之间的相关程度 B 定距—定距变量之间的相关程度 C 线性相关 D 非线性相关 6.下列说法正确的是( )。 A 方差分析的优点在于,一个检验可以代替多个均值差检验 B 方差分析总是优于一系列的均值差检验 C 方差分析中的自变量 X 如果是二分变量,不论采用方差分析或均值差检验,其 结果完全相同 D 总变差分解的思想可以直接推广至多因素显著性检验 7.方差分析所包含的假定包括( )。 A 正态分布 B 独立随机样本 C 等方差性 D 非负性 四、名词解释 1.拟和优度检验 2.列联表 3.理论频数 4.方差分析 5.方差分析表 6.总变差 7.组内变差 8.组间平方和 9.相关比率 10.估计标准误差 五、判断题 1.理论频数 fe 与观测频数 fo 越接近,经验分布与理论分布拟合程度越好。 ( ) 2.对于拟合优度检验,在试验规模大时,否定零假设的意义大,接受零假设的意义不 大。 ( ) 3.规模极大的试验可把零假设有极细微的差别检测出来。 ( ) 4.如何求得列联表中的理论频数就成了独立性检验的关键。 ( ) 5. 2 检验法用于对交互分类资料的独立性检验,有其它方法无法比拟的优点。 ( ) 6. 2 检验不适用于定类变量和定序变量的相关统计。 ( )
7.在2×2列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测 方向的(Z)2来找出x2的近似值 8.相对频数相同的列联表,在统计检验中其显著性也相同 9.组内变差反映了数据的c个“中心”的散布程度 ((( ))) 10.组间平方和反映了数据围绕各“中心”的散布程度 11.方差分析是用(可以解释的方差)/(不能解释的方差)作为检验统计量。 12.我们不可以从总平方和减去组间平方和来求组内平方和 13.n2只可用于一个定类变量与一个定距变量的相关程度的测定。 方差分析的优点在于,一个检验可以代替多个检验。 )))) 15.如果仔细运用均值差检验,它可能会提供比方差分析更多的信息。 16.拟合值Y上下设置一个合适区间,那么Y被估计到的可能性便会大大增加。 六、计算题 1.一位社会学家想知道私立本科大学每年的生源是否呈均匀分布。为此,他在某校随 机抽取了4500个本科生,这些学生的分布是:一年级1200人,二年级1100人,三年级1150 人,四年级1050人。试问,在给定显著性水平a为0.05下,四个年级学生人数构成是否 均匀? 2.一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规 律两种粉色杂交后,后代将以白:粉:红=1:2:1的比例出现。他做了一项杂交实验,植 株了100株后代,结果发现:21株白,61株粉,18株红。试问,在给定显著性水平α为0.05 下,是否植株后代以白:粉:红=1:2:1的比例出现? 3.某种动物的两个品种杂交后可能出现四种特征。某种理论分析表明,可能出现的四 种特征的数量将以9:3:3:1的比例出现。生物学家为此做了一项实验,检查了160个后 代,结果发现具有着四种特征的后代的数量分别是72、38、32、18。试问,在给定显著性 水平a为0.05下,是否杂交后代以9:3:3:1的比例出现? 4.某公司对电视机的可靠性进行了一次调查,使用100台电视机作样本,记录了在电 视机出现故障之前所经历的月份。根据经历的月份(按等级划分),下表给出了出现故障的 实际分布月份和故障按照正态概率分布月份 出现故障之前的月 出现故障之前的实际月份 出现故障之前的期望月份 份(等级)
4 7.在 2×2 列联表中,若不能从卡方表中准确得到所需要的临界值,可以取事先未预测 方向的 (Zα/2) 2 来找出 2 的近似值。 ( ) 8.相对频数相同的列联表,在统计检验中其显著性也相同。 ( ) 9.组内变差反映了数据的 c 个“中心”的散布程度。 ( ) 10 . 组 间 平 方 和 反 映 了 数 据 围 绕 各 “ 中 心 ” 的 散 布 程 度 。 ( ) 11.方差分析是用(可以解释的方差)/(不能解释的方差)作为检验统计量。 ( ) 12.我们不可以从总平方和减去组间平方和来求组内平方和。 ( ) 13. 2 只可用于一个定类变量与一个定距变量的相关程度的测定。 ( ) 14.方差分析的优点在于,一个检验可以代替多个检验。 ( ) 15.如果仔细运用均值差检验,它可能会提供比方差分析更多的信息。 ( ) 16.拟合值 Yc上下设置一个合适区间,那么 Y 被估计到的可能性便会大大增加。 ( ) 六、计算题 1.一位社会学家想知道私立本科大学每年的生源是否呈均匀分布。为此,他在某校随 机抽取了 4500 个本科生,这些学生的分布是:一年级 1200 人,二年级 1100 人,三年级 1150 人,四年级 1050 人。试问,在给定显著性水平α为 0.05 下,四个年级学生人数构成是否 均匀? 2 .一位遗传学家想知道某种紫花的颜色是否符合孟德尔隐性遗传规律,按照这种规 律两种粉色杂交后,后代将以白∶粉∶红 =1∶2∶1 的比例出现。他做了一项杂交实验,植 株了 100 株后代,结果发现:21 株白,61 株粉,18 株红。试问,在给定显著性水平α为 0.05 下,是否植株后代以白:粉:红 =1∶2∶1 的比例出现? 3.某种动物的两个品种杂交后可能出现四种特征。某种理论分析表明,可能出现的四 种特征的数量将以 9∶3∶3∶1 的比例出现。生物学家为此做了一项实验,检查了 160 个后 代,结果发现具有着四种特征的后代的数量分别是 72、38、32、18。试问,在给定显著性 水平α为 0.05 下,是否杂交后代以 9∶3∶3∶1 的比例出现? 4.某公司对电视机的可靠性进行了一次调查,使用 100 台电视机作样本,记录了在电 视机出现故障之前所经历的月份。根据经历的月份(按等级划分),下表给出了出现故障的 实际分布月份和故障按照正态概率分布月份: 出现故障之前的月 份(等级) 出现故障之前的实际月份 出现故障之前的期望月份
17以下 6 17-20 18 30以上 要求:检验故障的实际分布与正态分布是否有明显差别(α取0.05)。 5.下表是三个年龄组的100名居民对生活质量要求的分布频数(按高、中、低分类): 生活质量要求 年龄(岁) 总计 17—30 12 45-65 7 总计 31 100 试问,居民对生活质量的要求与年龄是否有明显的关系(a取0.05)。 6.下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。 小于5次 5-10次 5次以上 合计 10公里以内 31 10-20公里 20公里以上 19 试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?(α取0.05) 7.为研究职业的代际流动问题,在某地随机抽取了160名职业区民进行调查,调查的 结果如下表所示: 父辈职业 合计 脑力劳动 体力劳动 农业劳动 脑力劳动 子辈 体力劳动 35 0 农业劳动 5
5 17 以下 17—20 21—23 24—26 27—29 30 以上 6 24 28 18 14 10 9 17 27 25 15 7 要求:检验故障的实际分布与正态分布是否有明显差别(α取 0.05)。 5.下表是三个年龄组的 100 名居民对生活质量要求的分布频数(按高、中、低分类): 年龄(岁) 生活质量要求 总计 高 中 低 17—30 11—35 45—65 12 11 8 15 13 10 13 11 7 40 35 20 总计 31 38 31 100 试问,居民对生活质量的要求与年龄是否有明显的关系(α取 0.05)。 6.下列表中是有关车祸事故的频数与司机单程驾车的路程分布资料。 小于 5 次 5—10 次 5 次以上 合计 10 公里以内 10—20 公里 20 公里以上 42 32 19 31 23 7 30 5 11 103 60 37 合计 93 61 46 200 试问,车祸事故的频数与司机单程驾车的路程是否有明显的关系?(α取 0.05) 7.为研究职业的代际流动问题,在某地随机抽取了 160 名职业区民进行调查,调查的 结果如下表所示: 父辈职业 合计 脑力劳动 体力劳动 农业劳动 子辈 职业 脑力劳动 体力劳动 农业劳动 25 15 5 8 35 7 5 10 50 38 60 62 合计 45 50 65 160