【备战2022】高考数学选择题专题强化训练:统计
展开一、选择题(共23小题;共115分)
1. 某校为了丰富校园文化,举行初中生书法大赛,决赛设置了 6 个获奖名额,共有 11 名选手进入决赛,选手决赛得分均不相同.若知道某位选手的决赛的得分,要判断他是否获奖,只需知道这 11 名学生决赛得分的
A. 中位数B. 平均数C. 众数D. 方差
2. 相关变量 x,y 的散点图如图所示,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程 y=b1x+a1 ,相关系数为 r1;方案二:剔除点 10,21,根据剩下数据得到线性回归方程 y=b2x+a2m,相关系数为 r2,则
A. 0
3. 某调査机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布扇形图、 90 后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是
注:90 后指 1990 年及以后出生,80 后指 1980−1989 年之间出生,80 前指 1979 年及以前出生.
A. 互联网行业从业人员中 90 后占一半以上
B. 互联网行业中 90 后从事技术岗位的人数超过总人数的 20%
C. 互联网行业中从事运营岗位的人数 90 后比 80 前多
D. 互联网行业中从事技术岗位的人数 90 后比 80 后多
4. 为了解儿子身高与其父亲身高的关系,随机抽取 5 对父子的身高数据如下:
父亲身高x/cm174176176176178儿子身高Y/cm175175176177177
则 Y 对 x 的线性回归方程为
A. y=x−1B. y=x+1C. y=88+12xD. y=176
5. 一批产品的合格率为 90%,检验员抽检时岀错率为 10%,则检验员抽取一件产品,检验为合格品的概率为
A. 0.81B. 0.82C. 0.90D. 0.91
6. 已知一组数据按从小到大的顺序排列为 −8,−1,4,x,10,13,且这组数据的中位数是 7,则这组数据的众数是
A. 7B. 6C. 4D. 10
7. 10 名工人生产某一零件,生产的件数分别是 10,12,14,14,15,15,16,17,17,17.设其平均数为 a,中位数为 b,众数为 c,则
A. a>b>cB. b>c>aC. c>a>bD. c>b>a
8. 根据下面给出的 2004 年至 2013 年我国二氧化硫年排放量(单位:万吨)柱形图,以下结论中不正确的是
A. 逐年比较,2008 年减少二氧化硫排放量的效果最显著
B. 2007 年我国治理二氧化硫排放显现成效
C. 2006 年以来我国二氧化硫年排放量呈减少趋势
D. 2006 年以来我国二氧化硫年排放量与年份正相关
9. 某班有 34 位同学,座位号记为 01,02,⋯,34,用下面的随机数表选取 5 组数作为参加青年志愿者活动的五位同学的座号.
495443548217379323788735209643842634916457245506887704744767217633502583921206
选取方法是从随机数表第一行的第 6 列和第 7 列数字开始,由左到右依次选取两个数字,则选出来的第 4 个志愿者的座号是
A. 23B. 09C. 02D. 16
10. 2019 年国庆黄金周影市火爆依旧,《我和我的祖国》《中国机长》《攀登者》票房不断刷新,为了解我校高一 2300 名学生的观影情况,随机调查了 100 名在校学生,其中看过《我和我的祖国》或《中国机长》的学生共有 80 名,看过《中国机长》的学生共有 60 名,看过《中国机长》且看过《我和我的祖国》的学生共有 50 名,则该校高一年级看过《我和我的祖国》的学生人数的估计值为
A. 1150B. 1380C. 1610D. 1860
11. 某旅游城市为向游客介绍本地的气温情况,绘制了一年中各月平均最高气温和平均最低气温的雷达图.图中 A 点表示十月的平均最高气温约为 15 ∘,B 点表示四月的平均最低气温约为 5 ∘C.下面叙述不正确的是
A. 各月的平均最低气温都在 0 ∘C 以上
B. 七月的平均温差比一月的平均温差大
C. 三月和十一月的平均最高气温基本相同
D. 平均最高气温高于 20 ∘C 的月份有 5 个
12. 假设有两个变量 X 与 Y,它们的取值分别为 x1,x2 和 y1,y2,其 2×2 列联表为
y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d
对于以下数据,对同一样本能说明 X 与 Y 有关的可能性最大的一组为
A. a=5,b=4,c=3,d=2B. a=5,b=3,c=2,d=4
C. a=5,b=2,c=4,d=3D. a=2,b=3,c=5,d=4
13. 在一次独立性检验中,得出 2×2 列联表如表所示,且最后发现两个分类变量 A 和 B 没有任何关系,则 a 的可能值是
AA合计B3090120B24a24+a合计5490+a144+a
A. 72B. 30C. 24D. 20
14. 调查中学生假期里玩手机的情况,可知某校 200 名男生中有 120 名假期里每天玩手机时间超过 1 小时,150 名女生中有 70 名假期里每天玩手机时间超过 1 小时,在检验这些中学生假期里每天玩手机超过 1 小时是否与性别有关时,最有说服力的方法是
A. 平均数B. 方差C. 回归分析D. 独立性检验
15. 变量 X 与 Y 相对应的一组数据为 10,1,11.3,2,11.8,3,12.5,4,13,5;变量 U 与 V 相对应的一组数据为 10,5,11.3,4,11.8,3,12.5,2,13,1,r1 表示变量 Y 与 X 之间的线性相关系数,r2 表示变量 V 与 U 之间的线性相关系数,则
A. r2
16. 已知 X 与 Y 之间的几组数据如下表:
X123456Y021334
假设根据上表数据所得线性回归方程为 Y=bX+a,若某同学根据上表中的前两组数据 1,0 和 2,2,求得的直线方程为 Y=bʹX+aʹ,则以下结论正确的是
A. b>bʹ,a>aʹB. b>bʹ,aaʹ
17. 根据如下样本数据得到的线性回归方程为 Y=bX+a,则
X345678Y4.02.5−0.50.5−2.0−3.0
A. a>0,b>0B. a>0,b<0C. a<0,b>0D. a<0,b<0
18. 某校从高一年级学生中随机抽取部分学生,将他们的模块测试成绩分成 6 组:40,50,50,60,60,70,70,80,80,90,90,100 加以统计,得到如图所示的频率分布直方图.已知高一年级共有学生 600 名,据此估计,该模块测试成绩不少于 60 分的学生人数为
A. 588B. 480C. 450D. 120
19. 已知样本数据 x1,x2,⋯,x10,其中 x1,x2,x3 的平均数为 a;x4,x5,⋯,x10 的平均数为 b,则样本数据的平均数为
A. 3a+7b10B. a+b2C. 7a+3b10D. a+b10
20. 从某高中随机选取 5 名高三男生,其身高和体重的数据如表所示:
身高x/cm160165170175180体重y/kg6366707274
根据上表可得回归直线方程 y=0.56x+a,据此模型预报身高为 172 cm 的高三男生的体重约为
A. 70.09 kgB. 70.12 kgC. 70.55 kgD. 71.05 kg
21. 某校团委对“学生性别和喜欢某热门软件是否有关”作了一次调查,其中被调查的女生人数是男生人数的 12,男生喜欢该软件的人数占男生人数的 16,女生喜欢该软件的人数占女生人数 23.若有 95% 的把握认为是否喜欢该软件和性别有关,则男生至少有
Pχ2≥
A. 12 人B. 6 人C. 10 人D. 18 人
22. 假设有两个分类变量 X 和 Y,其 2×2 列联表如下:
注:χ2=nad−bc2a+bc+da+cb+d=naa+c−bb+d⋅aa+b−cc+d,对于同一样本,以下数据能说明 X 和 Y 有关系的可能性最大的一组是
A. a=45,c=15B. a=40,c=20C. a=35,c=25D. a=30,c=30
23. 已知四个命题:
①在回归分析中,R2可以用来刻画回归效果,R2的值越大,模型的拟合效果越好;
②在独立性检验中,随机变量K2的值越大,说明两个分类变量有关系的可能性越大;
③在回归方程=0.2x+12中,当解释变量x每增加1个单位时,预报变量平均增加1个单位;
④两个随机变量相关性越弱,则相关系数的绝对值越接近于1;
其中真命题是( )
A. ①④B. ②④C. ①②D. ②③
二、选择题(共7小题;共35分)
24. 设 x1,y1,x2,y2,⋯,xn,yn 是变量 x 和 y 的 n 对数据,直线 l 是由这些样本点通过最小二乘法得到的线性回归直线,如图所示,则以下结论正确的是
A. 直线 l 过点 x,y
B. 回归直线必通过散点图中的多个点
C. x 和 y 的相关系数在 −1 和 0 之间
D. 当 n 为偶数时,分布在 l 两侧的样本点的个数一定相同
25. 下列有关样本线性相关系数 r 的说法,正确的是
A. 相关系数 r 可用来衡量 x 与 y 之间的线性相关程度
B. ∣r∣≤1,且 ∣r∣ 越接近 0,相关程度越小
C. ∣r∣≤1,且 ∣r∣ 越接近 1,相关程度越大
D. ∣r∣≤1,且 ∣r∣ 越接近 1,相关程度越小
26. 下列说法中正确的有
A. 在对分类变量 X 和 Y 进行独立性检验时,随机变量 χ2 的值越大,则“X 与 Y 有关”可信程度越小
B. 在经验回归方程 Y=0.1X+10 中,当解释变量 X 每增加一个单位时,响应变量 Y 增加 0.1 个单位
C. 两个变量的线性相关性越强,相关系数的绝对值越接近于 1
D. 在回归分析模型中,若 r 越大,则模型的拟合效果越好
27. 有关独立性检验的四个命题,其中正确的是
A. 两个变量的 2×2 列联表中,对角线上数据的乘积相差越大,说明两个变量有关系的可能性就越大
B. 对分类变量 X 与 Y 的随机变量 χ2 来说,χ2 越小,“X 与 Y 有关系”的可信程度越小
C. 从独立性检验可知:有 95% 的把握认为秃顶与患心脏病有关,我们说某人秃顶,那么他有 95% 的可能患有心脏病
D. 从独立性检验可知:有 99% 的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过 1% 的前提下,认为吸烟与患肺癌有关
28. 已知变量 x,y 之间的线性回归方程为 y=−0.4x+7.6,且变量 x,y 之间的一组相关数据如表所示,则下列说法正确的是
x681012y6m32
A. 变量 x,y 之间呈现负相关关系
B. m 的值等于 5
C. 变量 x,y 之间的相关系数 r=−0.4
D. 由表格数据知,该回归直线必过点 9,4
29. 针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调査,其中被调査的男女生人数相同,男生喜欢抖音的人数占男生人数的 45,女生喜欢抖音的人数占女生人数的 35,若有 95% 的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有
附表:
Pχ2≥
附:χ2=nad−bc2a+bc+da+cb+d
A. 25 人B. 45 人C. 60 人D. 75 人
30. 已知由样本数据点集合 xi,yii=1,2,⋯,n,求得的回归直线方程为 y=1.5x+0.5,且 x=3,现发现两个数据点 1.2,2.2 和 4.8,7.8 误差较大,去除后重新求得的回归直线 l 的斜率为 1.2,则
A. 变量 x 与 y 具有正相关关系
B. 去除后的回归方程为 y=1.2x+1.4
C. 去除后 y 的估计值增加速度变快
D. 去除后相应于样本点 2,3.75 的残差为 0.05
答案
第一部分
1. A【解析】中位数的概念,即最中间一个或两个数据的平均数,可知 11 成绩的中位数是第 6 名的得分.根据题意可得:参赛选手要想知道自己是否能进入前 6 名,只需要了解自己的得分以及全部得分的中位数,比较即可.
2. D【解析】由散点图得负相关,所以 r1,r2<0.
因为剔除点 10,21 后,剩下点数据更具有线性相关性,∣r∣ 更接近 1,
所以 −1
对于选项B,互联网行业中 90 后从事技术岗位的人数占总人数的 39.6%×56%=22.176%,超过总人数的 20%,所以该选项正确;
对于选项C,互联网行业中从事运营岗位的人数 90 后占总人数的 56%×17%=9.52%,比 80 前多,所以该选项正确;
对于选项D,互联网行业中从事运营岗位的人数 90 后占总人数的 9.52%,80 后占总人数的 41%,所以互联网行业中从事运营岗位的人数 90 后不一定比 80 后多,所以该选项不一定正确.
4. C【解析】设 Y 对 x 的线性回归方程为 y=a+bx,
因为 b=−2×−1+0×−1+0×0+0×1+2×1−22+22=12,a=y−bx=176−12×176=88 所以 Y 对 x 的回归方程为 y=88+12x.
5. B
【解析】因为一批产品的合格率为 90%,检验员抽检时出错率为 10%,
所以检验员抽取一件产品,检验为合格品的概率是 0.9×0.9+0.1×0.1=0.82.
6. D【解析】因为 −8,−1,4,x,10,13 的中位数是 7,
所以 12x+4=7,
所以 x=10,
所以这组数据的众数是 10 .
7. D【解析】依题意,a=10+12+14+14+15+15+16+17+17+1710=14.7,中位数 b=15,众数 c=17,故 c>b>a.
8. D【解析】由柱形图可知:A,B,C均正确,2006 年以来我国二氧化硫年排放量在逐渐减少,
所以排放量与年份负相关,
所以D不正确.
9. D【解析】根据题意,利用随机数表法,从随机数表第一行的第 6 列和第 7 列数字开始,由左向右依次选两个数,如下:
35(去掉),48(去掉),21(第 1 个),73(去掉),79(去掉),32(第 2 个),37(去掉),88(去掉),73(去掉),52(去掉),09(第 3 个),64(去掉),38(去掉),42(去掉),63(去掉),49(去掉),16(第 4 个),⋯.
所以,选出来的第 4 个志愿者的座号是 16.
10. C
【解析】依题意接受调查的 100 名学生中有 70 名看过《我和我的祖国》,故全校学生中约有 2300×0.7=1610 人看过《我和我的祖国》这部影片.
11. D【解析】由题中雷达图易知 A,C正确.七月份平最高气温超过 20 ∘C,平均最低气温约为 13 ∘C;一月份平均最高气温约为 6 ∘C,平均最低气温约为 2 ∘C,所以七月的平均温差比一月平均温差大,故B正确.由题图知平均最高气温超过 20 ∘C 的月份为六、七、八月,有 3 个.
12. B【解析】因为 χ2=nad−bc2a+bc+da+cb+d,
所以A中 χ2=14×10−1229×8×5×6≈0.026,
B中 χ2=14×20−628×7×6×7≈1.17,
C中 χ2=14×15−827×9×7×5=0.31,
D中 χ2=14×8−1525×7×9×7≈0.31,比较可知 1.17 最大,故选B.
13. A【解析】因为两个分类变量 A 和 B 没有任何关系,
所以 χ2=144+a30a−90×242120×24+a×54×90+a=0,
则 30a−90×24=0,解得 a=72.
验证可知 a=72 满足题意.故选A.
14. D【解析】分析已知条件,易得如下 2×2 列联表:
男生女生合计玩手机超过1小时12070190玩手机不超过1小时8080160合计200150350
根据列联表可得 χ2 的值,再与临界值比较,检验可得这些中学生假期里每天玩手机超过 1 小时是否与性别有关的结论,故利用独立性检验的方法最有说服力.
15. C
【解析】由变量 X 与 Y 相对应的一组数据为 10,1,11.3,2,11.8,3,12.5,4,13,5,可得变量 Y 与 X 正相关,
所以 r1>0.
而由变量 U 与 V 相对应的一组数据为 10,5,11.3,4,11.8,3,12.5,2,13,1,可得变量 V 与 U 负相关,
所以 r2<0.
因此 r1 与 r2 的大小关系是 r2<0
根据公式求得
b=58−6×72×13691−6×722=57,
a=y−bx=136−57×72=−13.
又 bʹ=2,aʹ=−2,
所以 baʹ,
故选D.
17. B【解析】画出散点图,知 a>0,b<0.
18. B【解析】因为 cs2θ=−18=1−2sin2θ,
所以 sin2θ=916,
因为 θ∈π4,π2,
所以 sinθ=916=34.
19. A【解析】x1,x2,x3 的平均数为 a;x1,x2,x3 的和为 3a,x4,x5,⋯,x10 的平均数为 b,x4,x5,⋯,x10 的和为 7b,则样本数据的和为 3a+7b,样本数据的平均数为 3a+7b10.
20. B
【解析】x=160+165+170+175+1805=170,
y=63+66+70+72+745=69.
因为回归直线过点 x,y,
所以将点 170,69 代人 y=0.56x+a 中得 a=−26.2,
所以回归直线方程为 y=0.56x−26.2,
代人 x=172 cm,则其体重约为 70.12 kg.
21. A【解析】设男生人数为 x,则女生人数为 x2,
则列联表如下:
喜欢该软件不喜欢该软件合计男生x65x6x女生x3x6x2合计x2x3x2
若有 95% 的把握认为是否喜欢该软件和性别有关,则 χ2≥3.841,
即 χ2=3x2x6⋅x6−5x6⋅x32x⋅x2⋅x2⋅x=3x8≥3.841,
解得 x>10.24.
又因为 x2,x3,x6,5x6 为整数,
所以男生至少有 12 人.
22. A【解析】对于A选项,χ12=100×4560−10404555−1545=80033≈24.24;
对于B选项,χ22=100×4060−10404050−2050=1006;
对于C选项,χ32=100×3560−10403545−2555=3200297≈10.77;
对于D选项,χ42=100×3060−10403040−3060=254.
由于 χ12 最大,故可以判断出,X 与 Y 有关系的可能性最大.
23. C【解析】【分析】对4个选项分别进行判断,即可得出结论.
【解析】解:①相关指数R2是用来刻画回归效果的,R2表示解释变量对预报变量的贡献率,
R2越接近于1,表示解释变量和预报变量的线性相关关系越强,越趋近0,关系越弱,
故R2的值越大,说明回归模型的拟合效果越好,故①正确.
②由K2的计算公式可知,对分类变量X与Y的随机变量K2的观测值k来说,k越小,判断“X与Y有关系”的把握越小,
随机变量K2的值越大,说明两个分类变量有关系的可能性越大,故②正确;
③在回归直线方程=0.2x+12中,当解释变量x每增加一个单位时,预报变量平均增加0.2个单位,故③错误.
④两个随机变量相关性越强,则相关系数的绝对值越接近于1;两个随机变量相关性越弱,则相关系数的绝对值越接近于0,故④不正确.
故选:C.
【点评】本题以命题的真假判断为载体,考查了抽样方法,相关系数,回归分析,独立性检验等知识点,难度不大,属于基础题.
第二部分
24. A, C
【解析】A是正确的;
回归直线可以不经过散点图中的任何点,故B错误;
由题设中提供的直线的图象可知 x 和 y 是负相关,相关系数在 −1 到 0 之间,故C正确;
分布在 l 两侧的样本点的个数不一定相同,故D错误.
25. A, B, C
【解析】相关系数是来衡量两个变量之间的线性相关程度的,线性相关系数是一个绝对值小于等于 1 的量,并且它的绝对值越大就说明相关程度越大.
26. C, D
【解析】由题意得,根据 χ2 的值越大,分类变量的有关联的可信度就越大,所以A是错误的;
根据线性回归方程中回归系数的含义,可知在线性回归方程 Y=0.1X+10 中,当解释变量 X 每增加一个单位时,响应变量 Y 平均增加 0.1 个单位,B是错误的;
根据相关系数的计算公式可知,相关系数的绝对值越接近 1,两个变量的相关性就越强,所以C是正确的;
根据回归分析的基本思想可知 r 越大,则模型的拟合效果越好,D是正确的.故选CD.
27. A, B, D
【解析】两个变量的 2×2 列联表中,对角线上数据的乘积相差越大,则 χ2 越大,两个变量有关系的可能性越大,所以选项A正确;
根据 χ2 越小,则“X 与 Y 有关系”的可信度越小,所以选项B正确;
从独立性检验可知,有 95% 的把握认为秃顶与患心脏病有关,不表示某人秃顶他有 95% 的可能患有心脏病,所以选项C不正确;
从独立性检验可知,有 99% 的把握认为吸烟与患肺癌有关,是指在犯错误的概率不超过 1% 的前提下,认为吸烟与患肺癌有关,是独立性检验的解释,所以选项D正确.
28. A, B, D
29. B, C
【解析】设男生的人数为 5nn∈N*,根据题意列出 2×2 列联表如下表所示:
男生女生合计喜欢抖音4n3n7n不喜欢抖音n2n3n合计5n5n10n
则 χ2=10n×4n×2n−3n×n25n×5n×7n×3n=10n21,
由于有 95% 的把握认为是否喜欢抖音和性别有关,
则 3.841≤χ2<6.635,
即 3.841≤10n21<6.635,
得 8.0661≤n<13.9335,
又 因为 n∈N*,则 n 的可能取值有 9,10,11,12,
因此,调查人数中男生人数的可能值为 45 或 60.
故选 BC.
30. A, B
【解析】x=3,代入 y=1.5x+0.5,y=5,
因为重新求得的回归直线 l 的斜率为 1.2,故正相关,
设新的数据所以横坐标的平均值 xʹ,
则 n−2xʹ=nx−1.2+4.8=3n−6=3n−2,
故 xʹ=3,
纵坐标的平均数为 yʹ,
则 n−2yʹ=ny−2.2+7.8=ny−10=5n−10=5n−2,
yʹ=5,
设新的线性回归方程为 y=1.2x+b,把 3,2 代入 5=1.2×3+b,b=1.4,
故新的线性回归方程为 y=1.2x+1.4,
故A,B正确,
因为斜率为 1.2 不变,所以 y 的增长速度不变,C错误,
把 x=2 代入,y=3.8,3.75−3.8=−0.05,故D错误.
【备战2022】高考数学选择题专题强化训练:数列: 这是一份【备战2022】高考数学选择题专题强化训练:数列,共9页。试卷主要包含了选择题等内容,欢迎下载使用。
【备战2022】高考数学选择题专题强化训练:函数: 这是一份【备战2022】高考数学选择题专题强化训练:函数,共12页。试卷主要包含了选择题,多选题等内容,欢迎下载使用。
【备战2022】高考数学选择题专题强化训练:概率: 这是一份【备战2022】高考数学选择题专题强化训练:概率,共9页。试卷主要包含了选择题等内容,欢迎下载使用。