8.3 列联表与独立性检验 课后训练提升 基础巩固 1高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人 数后,得到如下列联表 单位:人 数学成绩 班级 合计 优秀 及格 甲班 11 34 45 乙班 8 37 45 合计 19 71 90 则随机变量,2的值约为( A.0.600 B.0.828 C.2.712 D.6.004 答案A 解析:根据列联表中的数据,可得随机变量_90xx734×8≈0.600.故选A 45×45×19×71 2.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么 这两个比值为( A与 c+d Ba与 Ca与 D品a与 答案:A 解析:由题意d ac+ad-ac-bc ad-bc 因为ad-bc的值越大,两个分 (a+b)(c+d) (a+bX(c+a)l 类变量有关系的可能性就越大,故选A, 3.有两个分类变量X,Y,其列联表如下所示 20-a 15-a 30+a 其中a,15-a均为大于5的整数,若变量X与Y不独立,这个结论犯错误的概率不 超过0.05,则a的值为( ) A.8 B.9 C.8或9 D.6或8 答案:C 解析根据公式,得_65a30+a520-a_1x3603.841, 20×45×15×50 20×45×3×2
8.3 列联表与独立性检验 课后· 基础巩固 1.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人 数后,得到如下列联表: 单位:人 班级 数学成绩 合计 优秀 及格 甲班 11 34 45 乙班 8 37 45 合计 19 71 90 则随机变量 χ 2 的值约为( ) A.0.600 B.0.828 C.2.712 D.6.004 答案:A 解析:根据列联表中的数据,可得随机变量 χ 2= 90×(11×37-34 ×8) 2 45×45×19×71 ≈0.600.故选 A. 2.在 2×2 列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么 这两个比值为( ) A. 𝑎 𝑎+𝑏 与 𝑐 𝑐+𝑑 B. 𝑎 𝑐+𝑑 与 𝑐 𝑎+𝑏 C. 𝑎 𝑎+𝑑 与 𝑐 𝑏+𝑐 D. 𝑎 𝑏+𝑑 与 𝑐 𝑎+𝑐 答案:A 解析:由题意,| 𝑎 𝑎+𝑏 - 𝑐 𝑐+𝑑 | = | 𝑎𝑐+𝑎𝑑-𝑎𝑐-𝑏𝑐 (𝑎+𝑏)(𝑐+𝑑) | = | 𝑎𝑑-𝑏𝑐 (𝑎+𝑏)(𝑐+𝑑) |,因为|ad-bc|的值越大,两个分 类变量有关系的可能性就越大,故选 A. 3.有两个分类变量 X,Y,其列联表如下所示, X Y Y1 Y2 X1 a 20-a X2 15-a 30+a 其中 a,15-a 均为大于 5 的整数,若变量 X 与 Y 不独立,这个结论犯错误的概率不 超过 0.05,则 a 的值为( ) A.8 B.9 C.8 或 9 D.6 或 8 答案:C 解析:根据公式,得 χ 2= 65×[𝑎(30+𝑎)-(15-𝑎)(20-𝑎)] 2 20×45×15×50 = 13×(13𝑎-60) 2 20×45 ×3×2 >3.841
根据a>5,且15-a>5,a∈Z求得当a=8或9时满足题意 4.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据,并根据小 概率值α=0.01的独立性检验,得到打鼾与患心脏病有关的结论.下列说法中正 确的是() A.100个心脏病患者中至少有99人打鼾 B.若1个人患心脏病,则这个人有99%的概率打鼾 C.100个心脏病患者中一定有打鼾的人 D.100个心脏病患者中可能一个打鼾的人都没有 答案D 5.下列关于等高堆积条形图的叙述正确的是() A.从等高堆积条形图中可以精确地判断两个分类变量是否有关系 B.从等高堆积条形图中可以看出两个变量频数的相对大小 C.从等高堆积条形图中可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 答案:C 6.(多选题)下列说法正确的是( 附:x独立性检验中常用的小概率值和相应的临界值 0. 0.05 0.01 0.005 0.001 Xa 2.706 3.841 6.635 7.879 10.828 A.经验回归方程对应的直线y=bx+a至少经过其样本数据点 (x1y),(x22),…,(xmm)中的一个点 B.命题“Vx≥1,x2+3≥4”的否定是3x≥1,x2+3<4” C样本相关系数r越小,表明两个变量相关性越弱 D.由一个2×2列联表,得2=13.079,根据小概率值a=0.001的独立性检验,认为这 两个变量间有关系 答案BD 解析:经验回归方程对应的直线y=br+a一定经过(?,,可能不经过样本数据点, 故A不正确: 命题Vx≥1x2+3≥4”的否定是“3x≥1x2+3<4”,故B正确: 样本相关系数越小,表明两个变量的相关性越弱,故C不正确: 列联表中计算X2=13.079>10.828=x0.001, 故D正确 故选BD 7.某班主任对全班50名学生进行了作业量的调查,数据如下表所示: 单位:人 性别 作业量 合计
根据 a>5,且 15-a>5,a∈Z,求得当 a=8 或 9 时满足题意. 4.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据,并根据小 概率值 α=0.01 的独立性检验,得到“打鼾与患心脏病有关”的结论.下列说法中正 确的是( ) A.100 个心脏病患者中至少有 99 人打鼾 B.若 1 个人患心脏病,则这个人有 99%的概率打鼾 C.100 个心脏病患者中一定有打鼾的人 D.100 个心脏病患者中可能一个打鼾的人都没有 答案:D 5.下列关于等高堆积条形图的叙述正确的是( ) A.从等高堆积条形图中可以精确地判断两个分类变量是否有关系 B.从等高堆积条形图中可以看出两个变量频数的相对大小 C.从等高堆积条形图中可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 答案:C 6.(多选题)下列说法正确的是( ) 附:χ 2 独立性检验中常用的小概率值和相应的临界值 α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 A.经验回归方程对应的直线𝑦 ^ = b ^ x+𝑎 ^ 至少经过其样本数据点 (x1,y1),(x2,y2),…,(xn,yn)中的一个点 B.命题“∀x≥1,x 2+3≥4”的否定是“∃x≥1,x 2+3<4” C.样本相关系数 r 越小,表明两个变量相关性越弱 D.由一个 2×2 列联表,得 χ 2=13.079,根据小概率值 α=0.001 的独立性检验,认为这 两个变量间有关系 答案:BD 解析:经验回归方程对应的直线𝑦 ^ = b ^ x+𝑎 ^ 一定经过(𝑥, 𝑦),可能不经过样本数据点, 故 A 不正确; 命题“∀x≥1,x 2+3≥4”的否定是“∃x≥1,x 2+3<4”,故 B 正确; 样本相关系数|r|越小,表明两个变量的相关性越弱,故 C 不正确; 列联表中计算 χ 2=13.079>10.828=x0.001, 故 D 正确. 故选 BD. 7.某班主任对全班 50 名学生进行了作业量的调查,数据如下表所示: 单位:人 性别 作业量 合计
认为作业量大 以为作业量不大 男生 18 27 女生 8 15 23 合计 24 50 根据上述数据分析,我们得出的2值约为」 答案:5.059 解析:由18+a=27,得a=9,18+8=b=26. 由公式得2-50X19x158x92≈5.059, 27×23×26×24 8.某学生对其亲属30人的饮食进行了一次调查,30人的饮食指数如图所示.(说明: 图中饮食指数低于70的人,饮食以蔬菜为主:饮食指数高于70的人,饮食以肉类 为主) 甲(50岁以下) 214345587476777882838590 20212526262732333637394244 乙(50岁以上) 4558617578 (1)根据以上数据完成下列2×2列联表; 单位:人 住食 年龄 合计 主食蔬菜 主食肉类 50岁以下 50岁以上 合计 (2)根据小概率值=0.01的独立性检验分析其亲属的饮食习惯与年龄是否有关, 并写出简要分析. 解(1)2×2列联表如下 单位:人 主食 年龄 合计 主食蔬莱 主食肉类 50岁以下 4 8 12 50岁以上 16 2 18 合计 20 10 30 (2)零假设为H0:亲属的饮食习惯与年龄无关联根据列联表中的数据,经计算得到 X2-30x4x216x82 12×18×20×10 10>6.635=x0.01. 根据小概率值α=0.01的独立性检验,推断H0不成立,即认为其亲属的饮食习惯与 年龄有关,此推断犯错误的概率不大于0.01
认为作业量大 认为作业量不大 男生 18 a 27 女生 8 15 23 合计 b 24 50 根据上述数据分析,我们得出的 χ 2 值约为 . 答案:5.059 解析:由 18+a=27,得 a=9,18+8=b=26. 由公式得 χ 2= 50×(18×15-8 ×9) 2 27 ×23×26×24 ≈5.059. 8.某学生对其亲属 30 人的饮食进行了一次调查,30 人的饮食指数如图所示.(说明: 图中饮食指数低于 70 的人,饮食以蔬菜为主;饮食指数高于 70 的人,饮食以肉类 为主) 甲(50 岁以下) 21 43 45 58 74 76 77 78 82 83 85 90 乙(50 岁以上) 20 21 25 26 26 27 32 33 36 37 39 42 44 45 58 61 75 78 (1)根据以上数据完成下列 2×2 列联表; 单位:人 年龄 主食 合计 主食蔬菜 主食肉类 50 岁以下 50 岁以上 合计 (2)根据小概率值 α=0.01 的独立性检验分析其亲属的饮食习惯与年龄是否有关, 并写出简要分析. 解:(1)2×2 列联表如下: 单位:人 年龄 主食 合计 主食蔬菜 主食肉类 50 岁以下 4 8 12 50 岁以上 16 2 18 合计 20 10 30 (2)零假设为 H0:亲属的饮食习惯与年龄无关联.根据列联表中的数据,经计算得到 χ 2= 30×(4×2-16×8) 2 12 ×18×20×10 =10>6.635=x0.01. 根据小概率值 α=0.01 的独立性检验,推断 H0 不成立,即认为其亲属的饮食习惯与 年龄有关,此推断犯错误的概率不大于 0.01
9.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市 民,得到数据如下表所示: 单位:人 是否喜欢 年龄 合计 喜欢 不喜欢 大于40岁 20 5 25 20岁至40岁 10 20 30 合计 30 25 55 (1)根据小概率值α=0.005的独立性检验分析喜欢“人文景观”景点与年龄是否有 关 (2)用分层随机抽样的方法从喜欢“人文景观°景点的市民中随机抽取6人作进一 步调查,将这6名市民作为一个样本,从中任选2人,求恰有1名大于40岁的市民 和1名20岁至40岁的市民的概率 解(1)零假设为H0:喜欢“人文景观”景,点与年龄无关联根据列联表中的数据,经计 算得2-55120x20-5x1011.978>7.879=00s. 25×30×30×25 根据小概率值α=0.005的独立性检验,推断Ho不成立,因此可以认为喜欢“人文景 观”景点与年龄有关联,此推断犯错误的概率不大于0.005. (2)由题意知抽取的6人中大于40岁的市民有4人,20岁至40岁的市民有2人, 分别记为B1,B2,B3,B4,C1,C2, 从中任选2人的可能结果有 (B1,B2),B1,B3),B1,B4),B1,C1),B1,C2,B2,B3),B2,B4),.B2,C)B2,C2,B3,B4),B3,C1) (B3,C2),B4,C1),B4,C2),(C1,C2,共15个,其中恰有1名大于40岁的市民和1名20 岁至40岁的市民的结果有 (B1,C1),B1,C2),B2,C1),(B2,C2,B3,C),B3,C2),B4,C1),B4,C2),共8个,因此恰有1名 大于40岁的市民和1名20岁至40岁的市民的概率为号 10.某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民 仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100 分)数据,统计结果如表所示, 组别 [40, [50, [60, [70, [80, [90, 50) 50) 70) 180) 90) 100) 男 2 5 15 18 12 女 0 10 13 (1)若规定问卷得分不低于70分的市民称为“环保关注者”,请列出2×2列联表,根 据小概率值α=0.05的独立性检验,分析“环保关注者”是否与性别有关 (2)若问卷得分不低于80分的人称为环保达人”,视频率为概率:
9.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了 55 名市 民,得到数据如下表所示: 单位:人 年龄 是否喜欢 合计 喜欢 不喜欢 大于 40 岁 20 5 25 20 岁至 40 岁 10 20 30 合计 30 25 55 (1)根据小概率值 α=0.005 的独立性检验分析喜欢“人文景观”景点与年龄是否有 关. (2)用分层随机抽样的方法从喜欢“人文景观”景点的市民中随机抽取 6 人作进一 步调查,将这 6 名市民作为一个样本,从中任选 2 人,求恰有 1 名大于 40 岁的市民 和 1 名 20 岁至 40 岁的市民的概率. 解:(1)零假设为 H0:喜欢“人文景观”景点与年龄无关联.根据列联表中的数据,经计 算得 χ 2= 55×(20×20-5 ×10) 2 25×30×30×25 ≈11.978>7.879=x0.005. 根据小概率值 α=0.005 的独立性检验,推断 H0 不成立,因此可以认为喜欢“人文景 观”景点与年龄有关联,此推断犯错误的概率不大于 0.005. (2)由题意知抽取的 6 人中大于 40 岁的市民有 4 人,20 岁至 40 岁的市民有 2 人, 分别记为 B1,B2,B3,B4,C1,C2, 从中任选 2 人的可能结果有 (B1,B2),(B1,B3),(B1,B4),(B1,C1),(B1,C2),(B2,B3),(B2,B4),(B2,C1),(B2,C2),(B3,B4),(B3,C1) ,(B3,C2),(B4,C1),(B4,C2),(C1,C2),共 15 个,其中恰有 1 名大于 40 岁的市民和 1 名 20 岁至 40 岁的市民的结果有 (B1,C1),(B1,C2),(B2,C1),(B2,C2),(B3,C1),(B3,C2),(B4,C1),(B4,C2),共 8 个,因此恰有 1 名 大于 40 岁的市民和 1 名 20 岁至 40 岁的市民的概率为 8 15 . 10.某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民 仅有一次参加机会,通过随机抽样,得到参与问卷调查的 100 人的得分(满分:100 分)数据,统计结果如表所示. 组别 [40, 50) [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) 男 2 3 5 15 18 12 女 0 5 10 10 7 13 (1)若规定问卷得分不低于 70 分的市民称为“环保关注者”,请列出 2×2 列联表,根 据小概率值 α=0.05 的独立性检验,分析“环保关注者”是否与性别有关. (2)若问卷得分不低于 80 分的人称为“环保达人”,视频率为概率:
①在我市所有“环保达人”中,随机抽取3人,求抽取的3人中,既有男“环保达人”又 有女“环保达人”的概率, ②为了鼓励市民关注环保,针对此次的调查制定了如下奖励方案:“环保达人”获得 两次抽奖活动:其他参与的市民获得一次抽奖活动,每次抽奖获得红包的金额和对 应的概率如下表: 红包金额(单位:元) 10 20 概率 4 现某市民要参加此次问卷调查,记(单位:元)为该市民参加问卷调查获得的红包 金额,求X的分布列及数学期望 附表及公式: n(ad-bc) (a bNcaxabcd. ?独立性检验中常用的小概率值和相应的临界值 a b.1 0.05 0.01 0.005 0.001 a 2.706 3.841 6.635 7.879 10.828 解(1)零假设为Ho:“环保关注者”与性别无关联 由题中表格可得2×2列联表如下: 单位:人 性别 是否为“环保关注者” 合计 非“环保关注者” “环保关注者” 男 10 45 55 女 15 3o 45 合计 25 75 100 将2×2列联表中的数据代入公式 n(ad-bc)2 X=(axbxc+tdxa+cl(b+dn=a+b+c+d, 得2-100x0X305X152≈3.03<3.841=00s 55×45×25×75 根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为 H0成立,即认为性别与“环保关注者”无关联 (2)视频率为概率,则抽取1人为男“环保达人”的概率为为女“环保达人”的概率 为娟 ①抽取的3人中既有男“环保达人”又有女“环保达人”的概率为 p=1-0-)=是 ②X的取值为10,20,30,40; P0X=10)-×2=系
①在我市所有“环保达人”中,随机抽取 3 人,求抽取的 3 人中,既有男“环保达人”又 有女“环保达人”的概率; ②为了鼓励市民关注环保,针对此次的调查制定了如下奖励方案:“环保达人”获得 两次抽奖活动;其他参与的市民获得一次抽奖活动,每次抽奖获得红包的金额和对 应的概率如下表: 红包金额(单位:元) 10 20 概率 3 4 1 4 现某市民要参加此次问卷调查,记 X(单位:元)为该市民参加问卷调查获得的红包 金额,求 X 的分布列及数学期望. 附表及公式: χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) ,n=a+b+c+d. χ 2 独立性检验中常用的小概率值和相应的临界值 α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 解:(1)零假设为 H0:“环保关注者”与性别无关联. 由题中表格可得 2×2 列联表如下: 单位:人 性别 是否为“环保关注者” 合计 非“环保关注者” “环保关注者” 男 10 45 55 女 15 30 45 合计 25 75 100 将 2×2 列联表中的数据代入公式 χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) ,n=a+b+c+d, 得 χ 2= 100 ×(10×30-45 ×15) 2 55 ×45×25×75 ≈3.03<3.841=x0.05. 根据小概率值 α=0.05 的独立性检验,没有充分证据推断 H0 不成立,因此可以认为 H0 成立,即认为性别与“环保关注者”无关联. (2)视频率为概率,则抽取 1 人为男“环保达人”的概率为3 5 ,为女“环保达人”的概率 为 2 5 . ①抽取的 3 人中既有男“环保达人”又有女“环保达人”的概率为 P=1-( 2 5 ) 3 − ( 3 5 ) 3 = 18 25 . ②X 的取值为 10,20,30,40; P(X=10)= 1 2 × 3 4 = 3 8 ;