第七章假设检验 第一节二项分布 二项分布的数学形式·二项分布的性质 第二节统计检验的基本步骤 建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定 第三节正态分布 正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态 近似法 第四节中心极限定理 抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理 第五节总体均值和成数的单样本检验 σ已知,对总体均值的检验·学生t分布(小样本总体均值的检验)·关于总 体成数的检验 、填空 1.不论总体是否服从正态分布,只要样本容量n足够大,样本平均数的抽样分布就趋 分布 2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的 它决定了否定域的大小。 3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越 ),原假设为真而被拒绝的概率越( 4.二项分布的正态近似法,即以将B(x;n,p)视为( 查表进行计算 5已知连续型随机变量X~N(0),若概率P(≥;=010,则常数2=( 6.已知连续型随机变量X~N(29,函数值中0(2)=072,则概率P{<8 单项选择 1.关于学生t分布,下面哪种说法不正确( A要求随机样本B适用于任何形式的总体分布 C可用于小样本D可用样本标准差S代替总体标准差σ 2.二项分布的数学期望为 A n(l-n)p B np(1-p) Cnp Dn(1-p) 3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为( A大于0.5 B-0.5 D0.5
1 第七章 假设检验 第一节 二项分布 二项分布的数学形式·二项分布的性质 第二节 统计检验的基本步骤 建立假设·求抽样分布·选择显著性水平和否定域·计算检验统计量·判定 第三节 正态分布 正态分布的数学形式·标准正态分布·正态分布下的面积·二项分布的正态 近似法 第四节 中心极限定理 抽样分布·总体参数与统计量·样本均值的抽样分布·中心极限定理 第五节 总体均值和成数的单样本检验 已知,对总体均值的检验·学生 t 分布(小样本总体均值的检验)·关于总 体成数的检验 一、填空 1.不论总体是否服从正态分布,只要样本容量 n 足够大,样本平均数的抽样分布就趋 于( )分布。 2.统计检验时,被我们事先选定的可以犯第一类错误的概率,叫做检验的( ), 它决定了否定域的大小。 3.假设检验中若其他条件不变,显著性水平的取值越小,接受原假设的可能性越 ( ),原假设为真而被拒绝的概率越( )。 4.二项分布的正态近似法,即以将 B(x;n,p)视为( ) 查表进行计算。 5.已知连续型随机变量 X ~ N (0,1),若概率 P{ X ≥ }=0.10,则常数 =( )。 6.已知连续型随机变量 X ~ N (2,9),函数值 0 (2) = 0.9772 ,则概率 P{X 8} = ( )。 二、单项选择 1.关于学生 t 分布,下面哪种说法不正确( )。 A 要求随机样本 B 适用于任何形式的总体分布 C 可用于小样本 D 可用样本标准差 S 代替总体标准差 2.二项分布的数学期望为( )。 A n(1-n)p B np(1- p) C np D n(1- p)。 3.处于正态分布概率密度函数与横轴之间、并且大于均值部分的面积为( )。 A 大于 0.5 B -0.5 C 1 D 0.5
4.假设检验的基本思想可用( )来解释。 A中心极限定理 B置信区间 C小概率事件 D正态分布的性质 5.成数与成数方差的关系是 A成数的数值越接近0,成数的方差越大 B成数的数值越接近0.3,成数的方差越大 C成数的数值越接近1,成数的方差越大 D成数的数值越接近0.5,成数的方差越大 6.在统计检验中,那些不大可能的结果称为( )。如果这类结果真的发生了, 我们将否定假设。 A检验统计量B显著性水平C零假设D否定域 对于大样本双侧检验,如果根据显著性水平查正态分布表得Zn2=1.96,则当零假 设被否定时,犯第一类错误的概率是( A20% B10 C5%D.1% 8.关于二项分布,下面不正确的描述是( A它为连续型随机变量的分布 B它的图形当p=0.5时是对称的,当p≠0.5时是非对称的,而当n愈大 时非对称性愈不明显 C二项分布的数学期望E(X)=H=m,变异数D(X)=a2=mpg D二项分布只受成功事件概率p和试验次数n两个参数变化的影响。 9.事件A在一次试验中发生的概率为,则在3次独立重复试验中,事件A恰好发生2 次的概率为( 10.设离散型随机变量X~B(2,p),若数学期望E(X)=24,方差D(X)=144, 则参数n,P的值为() An=4,p=0.6Bn=6,p=0.4 Cn=8,p=0.3Dn=12,p=0.2 三、多项选择 1.关于正态分布的性质,下面正确的说法是( A正态曲线以x=H呈钟形对称,其均值、中位数和众数三者必定相等。 B对于固定的O值,不同均值的正态曲线的外形完全相同,差别只在于曲线在 横轴方向上整体平移了一个位置
2 4.假设检验的基本思想可用( )来解释。 A 中心极限定理 B 置信区间 C 小概率事件 D 正态分布的性质 5.成数与成数方差的关系是( )。 A 成数的数值越接近 0,成数的方差越大 B 成数的数值越接近 0.3,成数的方差越大 C 成数的数值越接近 1,成数的方差越大 D 成数的数值越接近 0.5,成数的方差越大 6.在统计检验中,那些不大可能的结果称为( )。如果这类结果真的发生了, 我们将否定假设。 A 检验统计量 B 显著性水平 C 零假设 D 否定域 7.对于大样本双侧检验,如果根据显著性水平查正态分布表得 Zα/2=1.96,则当零假 设被否定时,犯第一类错误的概率是( )。 A 20% B 10% C 5% D.1% 8.关于二项分布,下面不正确的描述是( )。 A 它为连续型随机变量的分布; B 它的图形当 p=0.5 时是对称的,当 p≠ 0.5 时是非对称的,而当 n 愈大 时非对称性愈不明显; C 二项分布的数学期望 E(X ) = =np ,变异数 D(X ) = 2 =npq ; D 二项分布只受成功事件概率 p 和试验次数 n 两个参数变化的影响。 9.事件 A 在一次试验中发生的概率为 4 1 ,则在 3 次独立重复试验中,事件 A 恰好发生 2 次的概率为( )。 A 2 1 B 16 1 C 64 3 D 64 9 10.设离散型随机变量 X ~ B(2, p) ,若数学期望 E(X ) = 2.4 ,方差 D(X ) =1.44 , 则参数 n, p 的值为( ). A n = 4, p =0.6 B n = 6, p =0.4 C n = 8 , p =0.3 D n =12, p =0.2 三、多项选择 1.关于正态分布的性质,下面正确的说法是( )。 A 正态曲线以 x = 呈钟形对称,其均值、中位数和众数三者必定相等。 B 对于固定的 值,不同均值 的正态曲线的外形完全相同,差别只在于曲线在 横轴方向上整体平移了一个位置
C对于固定的H值,不同均值的正态曲线的外形完全相同,差别只在于曲线在 横轴方向上整体平移了一个位置 D对于固定的H值,σ值越大,正态曲线越陡峭 2.下列概率论定理中,两个最为重要,也是统计推断的数理基础的是( A加法定理 B乘法定理 C大数定律 D中心极限定理E贝叶斯定理 3.统计推断的具体内容很广泛,归纳起来,主要是( )问题 A抽样分布 B参数估计 方差分析 D回归分析 E假设检验 4.下列关于假设检验的陈述正确的是( A假设检验实质上是对原假设进行检验 B假设检验实质上是对备择假设进行检验; C当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误 D假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更 有可能正确 E当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确 5.选择一个合适的检验统计量是假设检验中必不可少的一个步骤,其中“合适”实质 上是指( A选择的检验统计量应与原假设有关 B选择的检验统计量应与备择假设有关 C在原假设为真时,所选的检验统计量的抽样分布已知 D在备择假设为真时,所选的检验统计量的抽样分布已知 E所选的检验统计量的抽样分布已知,不含未知参数。 6.关于t检验,下面正确的说法是( At检验实际是解决大样本均值的检验问题 Bt检验实际是解决小样本均值的检验问题 Ct检验适用于任何总体分布 Dt检验对正态总体适用 Et检验要求总体的σ已知。 四、名词解释 1.零假设2.第一类错误3.第二类错误4.显著性水平 5.总体参数 6.检验统计量 7.中心极限定理 五、判断题 1.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危 险不变的情况下,减少犯第二类错误的危险。 2.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。( 3.检验的显著性水平(用∝表示)被定义为能允许犯第一类错误的概率,它决定了否定
3 C 对于固定的 值,不同均值 的正态曲线的外形完全相同,差别只在于曲线在 横轴方向上整体平移了一个位置。 D 对于固定的 值, 值越大,正态曲线越陡峭。 2.下列概率论定理中,两个最为重要,也是统计推断的数理基础的是( ) A 加法定理 B 乘法定理 C 大数定律 D 中心极限定理 E 贝叶斯定理。 3.统计推断的具体内容很广泛,归纳起来,主要是( )问题。 A 抽样分布 B 参数估计 C 方差分析 D 回归分析 E 假设检验 4.下列关于假设检验的陈述正确的是( )。 A 假设检验实质上是对原假设进行检验; B 假设检验实质上是对备择假设进行检验; C 当拒绝原假设时,只能认为肯定它的根据尚不充分,而不是认为它绝对错误; D 假设检验并不是根据样本结果简单地或直接地判断原假设和备择假设哪一个更 有可能正确; E 当接受原假设时,只能认为否定它的根据尚不充分,而不是认为它绝对正确 5.选择一个合适的检验统计量是假设检验中必不可少的一个步骤,其中“合适”实质 上是指( ) A 选择的检验统计量应与原假设有关; B 选择的检验统计量应与备择假设有关; C 在原假设为真时,所选的检验统计量的抽样分布已知; D 在备择假设为真时,所选的检验统计量的抽样分布已知; E 所选的检验统计量的抽样分布已知,不含未知参数。 6.关于 t 检验,下面正确的说法是( )。 A t 检验实际是解决大样本均值的检验问题; B t 检验实际是解决小样本均值的检验问题; C t 检验适用于任何总体分布; D t 检验对正态总体适用; E t 检验要求总体的 已知。 四、名词解释 1.零假设 2.第一类错误 3.第二类错误 4.显著性水平 5.总体参数 6.检验统计量 7.中心极限定理 五、判断题 1.在同样的显著性水平的条件下,单侧检验较之双侧检验,可以在犯第一类错误的危 险不变的情况下,减少犯第二类错误的危险。 ( ) 2.统计检验可以帮助我们否定一个假设,却不能帮助我们肯定一个假设。 ( ) 3.检验的显著性水平(用 表示)被定义为能允许犯第一类错误的概率,它决定了否定
域的大小。 4.第一类错误是,零假设H实际上是错的,却没有被否定。第二类错误则是,零假设 H实际上是正确的,却被否定了 每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合 六、计算题 1.根据统计,北京市初婚年龄服从正态分布,其均值为25岁,标准差为5岁,问25 岁到30岁之间结婚的人:其百分数为多少? 2.共有5000个同龄人参加人寿保险,设死亡率为01%。参加保险的人在年初应交纳 保险费10元,死亡时家属可领2000元。求保险公司一年内从这些保险的人中,获利不少于 30000元的概率。 3.为了验证统计报表的正确性,作了共50人的抽样调查,人均收入的结果有: X=871元,S=21元,问能否证明统计报表中人均收入u=880元是正确的(显著性水平a 0.05)。 4.某单位统计报表显示,人均月收入为3030元,为了验证该统计报表的正确性,作了 共100人的抽样调查,样本人均月收入为3060元,标准差为80元,问能否说明该统计报表 显示的人均收入的数字有误(取显著性水平a=0.05)。 5.已知初婚年龄服从正态分布,根据9个人的抽样调查有:X=235(岁),S=3(岁)。 问是否可以认为该地区平均初婚年龄已超过20岁(α=0.05)? 6.某地区成人中吸烟者占75%,经过戒烟宣传之后,进行了抽样调查,发现了100名 被调查的成人中,有63人是吸烟者,问戒烟宣传是否收到了成效?(a=0.05) 7.据原有资料,某城市居民彩电的拥有率为60%,现根据最新100户的抽样调查,彩 电的拥有率为62%。问能否认为彩电拥有率有所增长?(c=0.05) 8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。但 有16个小组,将它们配对成一个实验组和控制组,实验组和控制组各有8个小组,问怎样 用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平 0.05,请指出否定域。 9.孟德尔遗传定律表明:在纯种红花豌豆与白花豌豆杂交后所生的,子二代豌豆中, 红花对白花之比为3:1。某次种植试验的结果为:红花豌豆352株,白花豌豆%6株。试在 a=0.05的显著性水平上,检定孟德尔定律。 10.一个样本容量为50的样本,具有均值10.6和标准差2.2,要求 (1)请用单侧检验,显著性水平0.05检验总体均值为10.0的假设: (2)请用双侧检验,显著性水平005检验总体均值为10.0的假设
4 域的大小。 ( ) 4.第一类错误是,零假设 H0 实际上是错的,却没有被否定。第二类错误则是,零假设 H0 实际上是正确的,却被否定了。 ( ) 5.每当方向能被预测的时候,在同样显著性水平的条件下,双侧检验比单侧检验更合 适。 ( ) 六、计算题 1.根据统计,北京市初婚年龄服从正态分布,其均值为 25 岁,标准差为 5 岁,问 25 岁到 30 岁之间结婚的人;其百分数为多少? 2.共有 5000 个同龄人参加人寿保险,设死亡率为 0.1%。参加保险的人在年初应交纳 保险费 10 元,死亡时家属可领 2000 元。求保险公司一年内从这些保险的人中,获利不少于 30000 元的概率。 3.为了验证统计报表的正确性,作了共 50 人的抽样调查,人均收入的结果有: X = 871元, S = 21元, 问能否证明统计报表中人均收入μ=880 元是正确的(显著性水平α =0.05)。 4.某单位统计报表显示,人均月收入为 3030 元,为了验证该统计报表的正确性,作了 共 100 人的抽样调查,样本人均月收入为 3060 元,标准差为 80 元,问能否说明该统计报表 显示的人均收入的数字有误(取显著性水平α=0.05)。 5.已知初婚年龄服从正态分布,根据 9 个人的抽样调查有: X = 23.5 (岁), S = 3 (岁)。 问是否可以认为该地区平均初婚年龄已超过 20 岁(α=0.05)? 6.某地区成人中吸烟者占 75%,经过戒烟宣传之后,进行了抽样调查,发现了 100 名 被调查的成人中,有 63 人是吸烟者,问戒烟宣传是否收到了成效?(α=0.05) 7.据原有资料,某城市居民彩电的拥有率为 60%,现根据最新 100 户的抽样调查,彩 电的拥有率为 62%。问能否认为彩电拥有率有所增长?(α=0.05) 8.一个社会心理学家试图通过实验来表明采取某种手段有助于增加群体的凝聚力。但 有 16 个小组,将它们配对成一个实验组和控制组,实验组和控制组各有 8 个小组,问怎样 用二项分布去检验无效力的零假设,列出检验所需的零假设,计算抽样分布,用显著水平 0.05,请指出否定域。 9.孟德尔遗传定律表明:在纯种红花豌豆与白花豌豆杂交后所生的,子二代豌豆中, 红花对白花之比为 3:1。某次种植试验的结果为:红花豌豆 352 株,白花豌豆 96 株。试在 =0.05 的显著性水平上,检定孟德尔定律。 10.一个样本容量为 50 的样本,具有均值 10.6 和标准差 2.2,要求: (1) 请用单侧检验,显著性水平 0.05 检验总体均值为 10.0 的假设; (2)请用双侧检验,显著性水平 0.05 检验总体均值为 10.0 的假设;
(3)请比较上述单、双侧检验犯第一类错误和犯第二类错误的情况。 设要评价某重点中学教学质量情况,原计划升学率为60%,在高校录取工作结束 后,现在一个由81个学生组成的随机样本中,发现升学率55%,用显著性水平为0.02,你 能否就此得出该校的工作没有达到预期要求的结论。为什么? 12.在重复抛掷一枚硬币49次的二项试验中,试求成功29次的概率? 13.某市2003年居民的户均收入是3500元,为了了解该市居民2004年的收入情况 有关调查部门作了一个共100户的收入情况的抽样调查,样本户均月收入为3525,标准差 为100元。据此,你有多大把握说该市居民户均收入是增加了 14.某单位共有5名孕妇,求以下概率(设婴儿性别男为22/43,21/43): (1)全为男婴:(2)全为女婴:(3)3男2女。 15.某地区回族占全体居民人数的6%,今随机抽取10位居民,问其中恰有2名是回 族的概率是多少? 16.工人中吸烟的比例为05%。某车间有工人300名,求以下概率 (1)全部吸烟:(2)2人吸烟;(3)100人吸烟;(4)160人吸烟。 17.某工厂总体的10%是技术人员,求7人委员会中4人是技术员的概率,并指出检 验所需的假设 18.设某股民在股票交易中,每次判断正确的概率是60%。该股民最近作了100次交 易。试求至少有50次判断正确的概率。 19.某市去年的数字显示:进城农民工参加社保的比例是30%。今年在进城农民工中 随机抽取400人进行调查,经计算得该样本总体的参保率为33%,试在α=0.05的显著性 水平上,检定“今年该市农民工参保情况有了改进”的零假设。 20.根据调查,儿童的智商分布为N(100,102),某幼儿园共有儿童250名,问智商 在110~120之间的儿童共有多少名? 21.根据调查,女大学生的身高分布为N(163,62),某大学共有女大学生1500名, 问身高在164~168厘米之间的女大学生共有多少名? 22.已知连续型随机变量X~N(0,1),求 (1)概率P{X=1}; (2)概率P{0<X<3} 3)概率P(X<-1.5 (4)概率P{X>1.2} )概率P{x≤1): (6概率P(x≥3
5 (3)请比较上述单、双侧检验犯第一类错误和犯第二类错误的情况。 11.设要评价某重点中学教学质量情况,原计划升学率为 60%,在高校录取工作结束 后,现在一个由 81 个学生组成的随机样本中,发现升学率 55%,用显著性水平为 0.02,你 能否就此得出该校的工作没有达到预期要求的结论。为什么? 12.在重复抛掷一枚硬币 49 次的二项试验中,试求成功 29 次的概率? 13.某市 2003 年居民的户均收入是 3500 元,为了了解该市居民 2004 年的收入情况, 有关调查部门作了一个共 100 户的收入情况的抽样调查,样本户均月收入为 3525,标准差 为 100 元。据此,你有多大把握说该市居民户均收入是增加了。 14.某单位共有 5 名孕妇,求以下概率(设婴儿性别男为 22/43,21/43): (1)全为男婴;(2)全为女婴;(3)3 男 2 女。 15.某地区回族占全体居民人数的 6%,今随机抽取 10 位居民,问其中恰有 2 名是回 族的概率是多少? 16.工人中吸烟的比例为 0.5%。某车间有工人 300 名,求以下概率: (1)全部吸烟;(2)2 人吸烟;(3)100 人吸烟; (4)160 人吸烟。 17.某工厂总体的 10%是技术人员,求 7 人委员会中 4 人是技术员的概率,并指出检 验所需的假设。 18.设某股民在股票交易中,每次判断正确的概率是 60%。该股民最近作了 100 次交 易。试求至少有 50 次判断正确的概率。 19.某市去年的数字显示:进城农民工参加社保的比例是 30%。今年在进城农民工中 随机抽取 400 人进行调查,经计算得该样本总体的参保率为 33%,试在 =0.05 的显著性 水平上,检定“今年该市农民工参保情况有了改进”的零假设。 20.根据调查,儿童的智商分布为 N(100,102),某幼儿园共有儿童 250 名,问智商 在 110 ~ 120 之间的儿童共有多少名? 21.根据调查,女大学生的身高分布为 N(163,6 2),某大学共有女大学生 1500 名, 问身高在 164 ~ 168 厘米之间的女大学生共有多少名? 22.已知连续型随机变量 X ~ N (0,1),求 (1)概率 P { X =1}; (2)概率 P {0< X <3}; (3)概率 P { X <-1.5; (4)概率 P { X >1.2}; (5)概率 P { X ≤1}; (6)概率 P { X ≥3}