8.2一元线性回归模型及其应用 课后训练提升 基础巩固 1.在回归分析中,R2的值越小,说明残差平方和( A越小 B.越大 C.可能大也可能小 D.以上都不对 答案B 2.有一名同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计得 到了一个热饮销售杯数与当天气温之间的线性关系,其经验回归方程为y= 2.35x+155.47.如果某天气温为4℃,那么该小卖部大约能卖出热饮的杯数是 () A.140 B.146 C.151 D.164 答案B 解析:当某天气温为4℃时,即x=4,则y=-2.35×4+155.47=146.07≈146. 3.某产品在某零售摊位的零售价x(单位:元)与每天的销售量(单位:个)的统计资 料如下表所示: 16 17 18 19 50 34 41 31 由上表可得经验回归方程y=bx+a中的b=-5,据此模型预测当零售价为14.5元 时,每天的销售量为( A.51个 B.50个 C.54个D48个 答案:C 解析:由题意知x=17.5,y=39,代入经验回归方程得=126.5,经验回归方程为y= 5x+126.5,当x=14.5时,y=126.5-14.5×5=54,故选C. 4.某奶茶店为了解奶茶销售量(单位:杯)与气温x(单位:℃)之间的关系,随机统计 了某4天卖出的奶茶杯数与当天的气温,得到下表中的数据,并根据该样本数据用 最小二乘法建立了经验回归方程y=-2x+60,则样本数据中污损的数据o应为 ) 气温x/C 1 13 10 18 杯数杯 o 34 38 24 A.58 B.64 C.62 D.60 答案B 解析:由表中数据易知元=10,代入y=-2x+60中,得=40.由0+34+38+24=40,得0=64
8.2 一元线性回归模型及其应用 课后· 基础巩固 1.在回归分析中,R 2 的值越小,说明残差平方和( ) A.越小 B.越大 C.可能大也可能小 D.以上都不对 答案:B 2.有一名同学家开了一个小卖部,他为了研究气温对热饮销售的影响,经过统计得 到了一个热饮销售杯数与当天气温之间的线性关系,其经验回归方程为𝑦 ^ =- 2.35x+155.47.如果某天气温为 4 ℃,那么该小卖部大约能卖出热饮的杯数是 ( ) A.140 B.146 C.151 D.164 答案:B 解析:当某天气温为 4 ℃时,即 x=4,则𝑦 ^ =-2.35×4+155.47=146.07≈146. 3.某产品在某零售摊位的零售价 x(单位:元)与每天的销售量 y(单位:个)的统计资 料如下表所示: x 16 17 18 19 y 50 34 41 31 由上表可得经验回归方程𝑦 ^ = b ^ x+𝑎 ^ 中的𝑏 ^ =-5,据此模型预测当零售价为 14.5 元 时,每天的销售量为( ) A.51 个 B.50 个 C.54 个 D.48 个 答案:C 解析:由题意知𝑥=17.5,𝑦=39,代入经验回归方程得𝑎 ^ =126.5,经验回归方程为y ^ =- 5x+126.5,当 x=14.5 时,𝑦 ^ =126.5-14.5×5=54,故选 C. 4.某奶茶店为了解奶茶销售量 y(单位:杯)与气温 x(单位:℃)之间的关系,随机统计 了某 4 天卖出的奶茶杯数与当天的气温,得到下表中的数据,并根据该样本数据用 最小二乘法建立了经验回归方程𝑦 ^ =-2x+60,则样本数据中污损的数据 y0 应为 ( ) 气温 x/℃ -1 13 10 18 杯数 y/杯 y0 34 38 24 A.58 B.64 C.62 D.60 答案:B 解析:由表中数据易知𝑥=10,代入𝑦 ^ =-2x+60 中,得y ^ =40.由 𝑦0 +34+38+24 4 =40,得 y0=64
5.(多选题)为研究需要,统计了两个变量x,y的数据情况如表 X2 2 … 其中数据x1,2,3,…,xm和数据y123,…m的平均数分别为x和y,并且计算得样本 相关系数r=-0.8,经验回归方程为y=bx+a,下列结论正确的是( A.将以上数据的每个数据都加一个相同的常数后,方差不变 B.变量x,y的相关性强 C.若x=x1,则必有y=y1 D.b<0 答案:ABD 解析:对A,方差是表示数据波动大小的量,将一组数据的每个数都加一个相同的 常数后,方差不变,故A正确; 对B,样本相关系数r=-0.8,r>0.75,变量xy的相关性强,故B正确; 对C,当x=x1时,不一定有y=y1,因此C错误; 对D,因为r=-0.8<0,是负相关,所以b<0,D正确 故选ABD 6.对变量x,y进行回归分析时,依据得到的4个不同的回归模型画出残差图,则下 列模型拟合精度最高的是( 残差 06 02 020304布5动0交编号 -04 6 残差 0.8 0.6 0.4 0.2 -0.2 02迹304动的0欢编号 -0.4 0.6 -0.8 残差 0 0.3 D2D3边430动0效编号 0.6 g
5.(多选题)为研究需要,统计了两个变量 x,y 的数据情况如表: x x1 x2 x3 … xn y y1 y2 y3 … yn 其中数据 x1,x2,x3,…,xn 和数据 y1,y2,y3,…,yn的平均数分别为𝑥和𝑦,并且计算得样本 相关系数 r=-0.8,经验回归方程为𝑦 ^ = b ^ x+𝑎 ^ ,下列结论正确的是( ) A.将以上数据的每个数据都加一个相同的常数后,方差不变 B.变量 x,y 的相关性强 C.若 x=x1,则必有𝑦 ^ =y1 D.𝑏 ^ <0 答案:ABD 解析:对 A,方差是表示数据波动大小的量,将一组数据的每个数都加一个相同的 常数后,方差不变,故 A 正确; 对 B,样本相关系数 r=-0.8,|r|>0.75,变量 x,y 的相关性强,故 B 正确; 对 C,当 x=x1 时,不一定有𝑦 ^ =y1,因此 C 错误; 对 D,因为 r=-0.8<0,是负相关,所以b ^ <0,D 正确. 故选 ABD. 6.对变量 x,y 进行回归分析时,依据得到的 4 个不同的回归模型画出残差图,则下 列模型拟合精度最高的是( )
残差 08 0 0.4 03 020304纳5动6动心8t编号 _0.8 D 答案:A 解析:用残差图判断模型的拟合效果,残差,点比较均匀地落在水平的带状区域中, 说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高! 7.在一组样本数据x1y1),x22),…,nmn)n≥2,x1,x2,…,xm不全相等)的散点图中,若 所有样本点i=1,2,,n)都在直线y=x+1上,则这组样本数据的样本相关系 数为 答案1 解析:根据样本相关系数的定义可知,当所有样本点都在一条直线上时,又0,故样 本相关系数为1. 8.已知一个经验回归方程为y=1.5x+45,x∈{1,5,7,13,19},则=」 答案58.5 解析:元=1+5+7+13+19=9, 5 且y=1.5x+45 .=1.5×9+45=58.5 9.关于x与y有如下数据 4 5 5 8 30 40 50 50 70 有以下两个线性模型: (1)y=6.5x+17.5 (2y=7x+17. 试比较哪一个模型拟合效果更好 解:由(1)可得-y与-的关系如下表: A Y-Yi -0.5 -3.5 10 6.5 0.5 -20 -10 10 20 ∴.20-y2=(-0.5y+(-3.5+102+(-6.5+0.52=155, i=1 5 0m-2=(-202+(-102+102+02+202-1000. =1 (0%-)2 ∴.R2=1g =1.155=0.845. (-可2 1000 1
答案:A 解析:用残差图判断模型的拟合效果,残差点比较均匀地落在水平的带状区域中, 说明这样的模型比较合适.带状区域的宽度越窄,说明模型的拟合精度越高. 7.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn 不全相等)的散点图中,若 所有样本点(xi,yi)(i=1,2,…,n)都在直线 y= 1 2 x+1 上,则这组样本数据的样本相关系 数为 . 答案:1 解析:根据样本相关系数的定义可知,当所有样本点都在一条直线上时,又 1 2 >0,故样 本相关系数为 1. 8.已知一个经验回归方程为𝑦 ^ =1.5x+45,x∈{1,5,7,13,19},则y= . 答案:58.5 解析:∵𝑥 = 1+5+7+13+19 5 =9, 且𝑦 ^ =1.5x+45, ∴y=1.5×9+45=58.5. 9.关于 x 与 y 有如下数据: x 2 4 5 6 8 y 30 40 60 50 70 有以下两个线性模型: (1)𝑦 ^ =6.5x+17.5; (2)y ^ =7x+17. 试比较哪一个模型拟合效果更好. 解:由(1)可得 yi-𝑦 ^ 𝑖与 yi-𝑦的关系如下表: yi-y ^ i -0.5 -3.5 10 -6.5 0.5 yi-y -20 -10 10 0 20 ∴ ∑ 𝑖=1 5 (yi-y ^ 𝑖 ) 2=(-0.5)2+(-3.5)2+102+(-6.5)2+0.5 2=155, ∑ 𝑖=1 5 (yi-𝑦) 2=(-20)2+(-10)2+102+0 2+202=1 000. ∴𝑅1 2=1- ∑ 𝑖=1 5 (𝑦𝑖 -𝑦 ^ 𝑖 ) 2 ∑ 𝑖=1 5 (𝑦𝑖 -𝑦) 2 =1- 155 1 000 =0.845
由(2)可得y:与r的关系如下表: Yi-Yi -1 5 8 -9 -3 -20 10 10 0 20 5 ∴.∑0m-y2=(-12+(52+82+(-9P+(-32=180, 1=1 5 20-5=(20P+109+10+02+202=100, (-%)2 ∴R吃=1 1180 =0.82. 0%- 1000 由于R2=0.845,R2=0.82,0.845>0.82,∴.R2>R,第一个模型拟合效果更好 10.某运动员训练次数与成绩之间的数据关系如下 次数x 30 B3 35 87 39 44 46 50 成绩y 30 34 37 39 42 46 48 51 (1)作出散点图: (2)求出经验回归方程 (3)作出残差图; (4)计算R2; (⑤)试预测该运动员训练47次及55次的成绩, 解:(1)作出该运动员训练次数x与成绩y之间的散点图,如图,由散点图可知,它们 之间具有线性相关关系」 成绩() 60 50 。4 20 10 020 4060次数) (2)计算可得x=39.25,y=40.875 含x好=12656宫=13180, i=1 A 设经验回归方程为y=bx+a, Σx收-8版 则b= ≈1.04148,a=y-bx=-0.00309, i=1 故经验回归方程为y=1.04148x-0.00309 (3)残差分析 作残差图如图
由(2)可得 yi-𝑦 ^ 𝑖与 yi-𝑦的关系如下表: yi-y ^ i -1 -5 8 -9 -3 yi-y -20 -10 10 0 20 ∴ ∑ 𝑖=1 5 (yi-y ^ 𝑖 ) 2=(-1)2+(-5)2+8 2+(-9)2+(-3)2=180, ∑ 𝑖=1 5 (yi-𝑦) 2=(-20)2+(-10)2+102+0 2+202=1 000. ∴𝑅2 2=1- ∑ 𝑖=1 5 (𝑦𝑖 -𝑦 ^ 𝑖 ) 2 ∑ 𝑖=1 5 (𝑦𝑖 -𝑦) 2 =1- 180 1 000 =0.82. 由于𝑅1 2=0.845,𝑅2 2=0.82,0.845>0.82,∴𝑅1 2 > 𝑅2 2 ,第一个模型拟合效果更好. 10.某运动员训练次数与成绩之间的数据关系如下: 次数 x 30 33 35 37 39 44 46 50 成绩 y 30 34 37 39 42 46 48 51 (1)作出散点图; (2)求出经验回归方程; (3)作出残差图; (4)计算 R 2 ; (5)试预测该运动员训练 47 次及 55 次的成绩. 解:(1)作出该运动员训练次数 x 与成绩 y 之间的散点图,如图,由散点图可知,它们 之间具有线性相关关系. (2)计算可得𝑥=39.25,𝑦=40.875, ∑ 𝑖=1 8 xi 2=12 656, ∑ i=1 8 xiyi=13 180, 设经验回归方程为𝑦 ^ = 𝑏 ^ x+𝑎 ^ , 则𝑏 ^ = ∑ 𝑖=1 8 𝑥𝑖𝑦𝑖 -8𝑥 𝑦 ∑ 𝑖=1 8 𝑥𝑖 2 -8𝑥 2 ≈1.041 48,𝑎 ^ = 𝑦 − 𝑏 ^ 𝑥=-0.003 09, 故经验回归方程为𝑦 ^ =1.041 48x-0.003 09. (3)残差分析. 作残差图如图
残差 3 1.5 0.5 0.0 -0.5 810编号 -1 -1.5 由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适」 (4)计算R2 计算得R2≈0.9855.说明了该运动员的成绩的差异有98.55%是由训练次数引起的. (⑤)作出预报 由上述分析可知,我们可用经验回归方程y=1.04148x-0.00309作为该运动员成绩 的预报值 将x=47和x=55分别代入该方程可得y~49和y~57.故预测该运动员训练47次和 55次的成绩分别为49和57. 拓展提高 1.(多选题)对于经验回归方程y=bx+a(b>0),下列说法正确的是( A.当x增加一个单位时,y的值平均增加b个单位 B.点元,)一定在y=bx+a所表示的直线上 C.当x=t时,一定有y=b1+a D.当x=t时,y的值近似为bt+a 答案:ABD 解析:经验回归方程是一个模拟函数,它表示的是一系列离散的点大致所在直线的 位置及其大致变化规律,因此有些散点不一定在经验回归直线上 2.符合下列数据的函数模型为( 1 3 4 2 2.69 3 3.38 3.6 6 7 8 9 10 3.8 4 4.08 4.2 4.3 Ay=2+字 B.y=2er Cy-2ei D.y=2+Inx 答案D 解析:分别将x值代入解析式判断知满足y=2+lnx 3.为了考查两个变量x和y之间的线性相关性,甲、乙两名同学各自独立地做了 100次和150次试验,并且利用最小二乘法求得的经验回归直线分别为h和h.已
由图可知,残差点比较均匀地分布在水平带状区域中,说明选用的模型比较合适. (4)计算 R 2 . 计算得 R 2≈0.985 5.说明了该运动员的成绩的差异有 98.55%是由训练次数引起的. (5)作出预报. 由上述分析可知,我们可用经验回归方程𝑦 ^ =1.041 48x-0.003 09 作为该运动员成绩 的预报值. 将 x=47 和 x=55 分别代入该方程可得𝑦 ^ ≈49 和𝑦 ^ ≈57.故预测该运动员训练 47 次和 55 次的成绩分别为 49 和 57. 拓展提高 1.(多选题)对于经验回归方程𝑦 ^ = b ^ x+𝑎 ^ (𝑏 ^ >0),下列说法正确的是( ) A.当 x 增加一个单位时,𝑦 ^的值平均增加𝑏 ^ 个单位 B.点(𝑥, 𝑦)一定在𝑦 ^ = 𝑏 ^ x+𝑎 ^ 所表示的直线上 C.当 x=t 时,一定有 y=𝑏 ^ t+𝑎 ^ D.当 x=t 时,y 的值近似为𝑏 ^ t+𝑎 ^ 答案:ABD 解析:经验回归方程是一个模拟函数,它表示的是一系列离散的点大致所在直线的 位置及其大致变化规律,因此有些散点不一定在经验回归直线上. 2.符合下列数据的函数模型为( ) x 1 2 3 4 5 y 2 2.69 3 3.38 3.6 x 6 7 8 9 10 y 3.8 4 4.08 4.2 4.3 A.y=2+ 1 3 x B.y=2ex C.y=2e 1 𝑥 D.y=2+ln x 答案:D 解析:分别将 x 值代入解析式判断知满足 y=2+ln x. 3.为了考查两个变量 x 和 y 之间的线性相关性,甲、乙两名同学各自独立地做了 100 次和 150 次试验,并且利用最小二乘法求得的经验回归直线分别为 l1 和 l2.已