第十章 第三节 变量间的相关关系与统计案例 一、选择题 1.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线 (如图),以下结论正确的是(  ) A.x和y的相关系数为直线l的斜率 B.x和y的相关系数在0到1之间 C.当n为偶数时,分布在l两侧的样本点的个数一定相同 D.直线l过点(,) 2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:[来源: ] 男 女 总计  爱好 40 20 60  不爱好[来源:] 20 30 50  总计 60 50 110   由K2=算得, K2=≈7.8. 附表: P(K2≥k) 0.050 0.010 0.001  k 3.841 6.635 10.828   参照附表,得到的正确结论是(  ) A.有99%以上的把握认为“爱好该项运动与性别有关” B.有99%以上的把握认为“爱好该项运动与性别无关” C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关” D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关” 3.一位母亲记录了自己儿子3~9岁的身高数据(略),由此建立的身高与年龄的回归模型为=7.19x+73.93,用这个模型预测这个孩子10岁时的身高,则正确的叙述是(  ) A.身高一定是145.83 cm B.身高在145.83 cm以上 C.身高在145.83 cm左右 D.身高在145.83 cm以下 4.如图5个(x,y)数据,去掉D(3,10)后,下列说法错误的是(  )  A.相关系数r变大 B.残差平方和变大 C.相关指数R2变大 D.解释变量x与预报变量y的相关性变强 5.某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是(  ) A.=-10x+200 B.=10x+200 C.=-10x-200 D.=10x-200 6.下列四个命题正确的是(  ) ①线性相关系数r越大,两个变量的线性相关性越强;反之,线性相关性越弱; ②残差平方和越小的模型,拟合的效果越好; ③用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好; ④随机误差e是衡量预报精确度的一个量,它满足E(e)=0. A.①③ B.②④ C.①④ D.②③ 二、填空题 7.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:=0.254x+0.321.由回归方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元. 8.某数学老师身高176 cm,他爷爷、父亲和儿子的身高分别是173 cm、170 cm和182 cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm. 9.第二十届世界石油大会将于2011年12月4日~8日在卡塔尔首都多哈举行,能源问题已经成为全球关注的焦点.某工厂经过技术改造后,降低了能源消耗,经统计该厂某种产品的产量x (单位:吨)与相应的生产能耗y(单位:吨)有如下几组样本数据: x 3 4 5 6  y 2.5 3 4 4.5   根据相关性检验,这组样本数据具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7.已知该产品的年产量为10吨,则该工厂每年大约消耗的汽油为________吨. 三、解答题 10.已知x,y的一组数据如下表: x 1 3 6 7 8  y 1 2 3 4 5   (1)从x,y中各取一个数,求x+y≥10的概率; (2)对于表中数据,甲、乙两同学给出的拟合直线分别为y=x+1与y=x+,试利用“最小平方法(也称最小二乘法)”判断哪条直线拟合程度更好. 11.为了分析某个高三学生的学习状态,对其下一阶段的学习提供指导性建议.现对他前7次考试的数学成绩x、物理成绩y进行分析.下面是该生7次考试的成绩. 数学 88 83 117 92 108 100 112  物理 94 91 108 96 104 101 106   (1)他的数学成绩与物理成绩哪个更稳定?请给出你的证明; (2)已知该生的物理成绩y与数学成绩x是线性相关的,若该生的物理成绩达到115分,请你估计他的数学成绩大约是多少?并请你根据物理成绩与数学成绩的相关性,给出该生在学习数学、物理上的合理建议.(其中,数据(xi,yi)(i=1,2,…,n)的线性回归方程为=x+,=,=-) 12.某学生对其亲属30人的饮食习惯进行了一次调查,并用如图所示的茎叶图表示30人的饮食指数.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主.) 甲(50岁以下)  乙(50岁以上)  1 5 3 8 6 7 8 4 5 3 2 0 2 3 4 5 6 7 8 9 0 1 5 6 7 6 2 3 7 9 6  4 5 2 8 1 5 8  (1)根据茎叶图,帮助这位学生说明其亲属30人的饮食习惯; (2)根据以上数据完成下列2×2的列联表: 主食蔬菜 主食肉类 合计  50岁以下     50岁以上     合计      (3)能否有99%的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析. 附:K2=. P(K2≥k0) 0.25 0.15 0.10 0.05 0.025 0.010 0.005 0.001  k0 1.323 2.072[来源: ] 2.706 3.841 5.024 6.635 7.879 10.828   详解答案 一、选择题 1. 解析:回归直线过样本中心(,). 答案:D 2.解析:根据独立性检验的思想方法,正确选项为A. 答案:A 3.解析:用回归模型=7.19x+73.93,只能作预测,其结果不一定是一个确定值. 答案: C 4.解析:相关系数r越接近1,R2越大,残差平方和越小,拟合效果越好. 答案:B 5.解析:由图象可知,选项B、D为正相关,选项C不符合实际意义,只有A项符合要求. 答案:A 6.解析:线性相关系数r满足|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱,故①错误;③相关指数是度量模型拟合效果的一种指标.相关指数越大,模型拟合效果越好.故②④正确 答案:B 二、填空题 7.解析:以x+1代x,得=0.254(x+1)+0.321,与=0.254x+0.321相减可得,年饮食支出平均增加0.254万元. 答案:0.254 8.解析:设父亲身高为x cm,儿子身高为y cm,则 x 173 170 176  y 170 176 182   =173,=176,==1, =-=176-1×173=3,∴=x+3,当x=182时,=185. 答案:185 9.解析:由题知,==4.5,==3.5,故样本数据的中心点为A(4.5,3.5).设回归方程为y=0.7x+b,将中心点坐标代入得:3.5=0.7×4.5+b,解得b=0.35,故回归方程为y=0.7x+0.35,所以当x=10时,y=0.7×10+0.35=7.35,即该工厂每年大约消耗的汽油为7.35吨. 答案:7.35 三、解答题 10.解:(1)从x,y中各取一个数组成数对(x,y),共有25对,其中满足x+y≥10的有(6,4),(6,5),(7,3),(7,4),(7,5),(8,2),(8,3),(8,4),(8,5),共9对.故所求概率P=. (2)用y=x+1作为拟合直线时,所得y值与y的实际值的差的平方和为S1=(-1)2+(2-2)2+(3-3)2+(-4)2+(-5)2=. 用y=x+作为拟合直线时,所得y值与y的实际值的差的平方和为S2=(1-1)2+ (2-2)2+(-3)2+(4-4)2+(-5)2=. ∵S2s,∴该生的物理成绩更稳定. (2)由于x 与y之间具有线性相关关系, ∴===0.5,=-=100-0.5×100=50, ∴线性回归方程为=0.5x+50.当y=115时,x=130. 建议: 进一步加强对数学的学习,提高数学成绩的稳定性,这将有助于物理成绩的进一步提高. 12.解:(1)在30位亲属中,50岁以上的人多以食蔬菜为主,50岁以下的人多以食肉为主. (2)2×2的列联表如下: 主食蔬菜 主食肉类 合计  50岁以下 4 8 12  50岁以上 16 2 18  合计 20 10 30   (3)因为K2===10>6.635, 所以有99%的把握认为其亲属的饮食习惯与年龄有关.

【点此下载】