【2023届必备】2023版高考一轮复习训练33 统计与统计案例
展开训练33 统计与统计案例
一、单选题
1.(2022·上饶模拟)根据如下样本数据,得到线性回归方程=x+,则( )
x | 3 | 4 | 5 | 6 | 7 | 8 |
y | -3.0 | -2.0 | 0.5 | -0.5 | 2.5 | 4.0 |
A.>0,>0 B.>0,<0
C.<0,>0 D.<0,<0
答案 C
解析 如图,
从整体上看这些点大致分布在一条直线的周围,且该回归直线的斜率为正,在y轴上的截距为负,则<0,>0.
2.(2022·成都模拟)某校随机抽取100名同学进行“垃圾分类”的问卷测试,测试结果发现这100名同学的得分都在[50,100]内,按得分分成5组:[50,60),[60,70),[70,80),[80,90),[90,100],得到如图所示的频率直方图,则这100名同学的得分的中位数为( )
A.72.5 B.75 C.77.5 D.80
答案 A
解析 在频率直方图中,小长方形的面积表示这组数据的频率,
∴中位数为70+×10
=72.5.
3.(2022·贵州模拟)小明处理一组数据,漏掉了一个数10,计算得平均数为10,方差为2,加上这个数后的这组数据( )
A.平均数等于10,方差等于2
B.平均数等于10,方差小于2
C.平均数大于10,方差小于2
D.平均数小于10,方差大于2
答案 B
解析 设这组数据为x1,x2,…,xn,它的平均数为10,方差为2,
所以x1+x2+…+xn=10n,(x1-10)2+(x2-10)2+…+(xn-10)2=2n,
添上数据10后,这组数据的平均数为×(x1+x2+…+xn+10)=×(10n+10)=10,
方差为[(x1-10)2+(x2-10)2+…+(xn-10)2+(10-10)2]=2·<2.
所以加上这个数后的这组数据平均数等于10,方差小于2.
4.(2022·湘豫名校模拟)疫苗是为预防、控制传染病的发生、流行,用于人体预防接种的预防性生物制品,其前期研发过程中,一般都会进行动物保护测试,为了考察某种疫苗预防效果,在进行动物试验时,得到如下统计数据:
| 未发病 | 发病 | 合计 |
未注射疫苗 | 20 |
|
|
注射疫苗 | 30 |
|
|
合计 | 50 | 50 | 100 |
附表及公式:
χ2=,
n=a+b+c+d.
P(χ2≥x0) | 0.05 | 0.01 | 0.005 | 0.001 |
x0 | 3.841 | 6.635 | 7.879 | 10.828 |
现从试验动物中任取一只,取得“注射疫苗”的概率为,则下列判断错误的是( )
A.注射疫苗发病的动物数为10
B.从该试验未注射疫苗的动物中任取一只,发病的概率为
C.能在犯错概率不超过0.001的前提下,认为疫苗有效
D.该疫苗的有效率为75%
答案 D
解析 由题意知,注射疫苗的动物共40只,未注射疫苗的动物为60只,
补充列联表,
| 未发病 | 发病 | 合计 |
未注射疫苗 | 20 | 40 | 60 |
注射疫苗 | 30 | 10 | 40 |
合计 | 50 | 50 | 100 |
由此可得A,B正确.
计算得χ2=
≈16.67>10.828,
故能在犯错概率不超过0.001的前提下认为疫苗有效.C正确,D错误.
二、多选题
5.研究变量x,y得到一组样本数据,进行回归分析,以下结论正确的是( )
A.可利用最小二乘思想求得使随机误差平方和最小的线性回归模型
B.用相关系数r来刻画回归效果,|r|越小说明拟合效果越好
C.线性回归方程对应的直线=x+至少经过其样本数据点中的一个点
D.若变量y和x之间的相关系数r=-0.946 2,则变量y和x之间的负相关性很强
答案 AD
解析 对于A,利用最小二乘法求得线性回归方程,A正确;
对于B,相关系数r来刻画回归的效果时,|r|越大,说明模型的拟合效果越好,B错误;
对于C,线性回归方程=x+必过点(,),但可能不经过样本数据点中的任何一个点,C错误;
对于D,变量y和x之间的相关系数r=-0.946 2时,说明变量y和x呈负相关关系,且负相关性很强,D正确.
6.(2022·南京模拟)下表显示的是2020年4月份到12月份中国社会消费品零售总额数据,其中同比增长率是指和去年同期相比较的增长率,环比增长率是指与上个月份相比较的增长率,则下列说法正确的是( )
中国社会消费品零售总额
月份 | 零售总额(亿元) | 同比增长 | 环比增长 | 累计(亿元) |
4 | 28 178 | -7.50% | 6.53% | 106 758 |
5 | 31 973 | -2.80% | 13.47% | 138 730 |
6 | 33 526 | -1.80% | 4.86% | 172 256 |
7 | 32 203 | -1.10% | -3.95% | 204 459 |
8 | 33 571 | 0.50% | 4.25% | 238 029 |
9 | 35 295 | 3.30% | 5.14% | 273 324 |
10 | 38 576 | 4.30% | 9.30% | 311 901 |
11 | 39 514 | 5.00% | 2.43% | 351 415 |
12 | 40 566 | 4.60% | 2.66% | 391 981 |
A.2020年4月份到12月份,社会消费品零售总额逐月上升
B.2020年4月份到12月份,11月份同比增长率最大
C.2020年4月份到12月份,5月份环比增长率最大
D.第4季度的月消费品零售总额相比第2季度的月消费品零售总额,方差更小
答案 BCD
解析 对于A选项,7月份的零售总额比6月份的少,A选项错误;
对于B选项,由表格中数据可知,2020年4月份到12月份,11月份同比增长率最大,B选项正确;
对于C选项,由表格中数据可知,2020年4月份到12月份,5月份环比增长率最大,C选项正确;
对于D选项,第4季度的月消费品零售总额在(38 000,41 000)内,而第2季度的月消费品零售总额在(28 000,34 000)内,前者数据更集中,方差更小,D选项正确.
三、填空题
7.如果数据x1,x2,…,xn的平均数为10,方差为3,则3x1+5,3x2+5,…,3xn+5的平均数为________,方差为________.
答案 35 27
解析 因为x1,x2,…,xn的平均数为10,
所以3x1+5,3x2+5,…,3xn+5的平均数为+5=35,
其方差为[(3x1-30)2+(3x2-30)2+…+(3xn-30)2]=9×3=27.
8.2021年7月15日,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:
价格x | 9 | 9.5 | m | 10.5 | 11 |
销售量y | 11 | n | 8 | 6 | 5 |
可知,销售量y与价格x之间有较强的线性相关关系,其线性回归方程是=-3.2x+40,且m+n=20,则其中的n=______.
答案 10
解析 依题意=,=,代入线性回归方程得=-3.2×+40,根据题意m+n=20,解方程组得m=n=10.
四、解答题
9.治理沙漠离不开优质的树苗,现从苗圃中随机地抽测了200株树苗的高度(单位:cm),得到以下频率直方图.
(1)求直方图中a的值及众数、中位数;
(2)若树高185 cm及以上是可以移栽的合格树苗.从样本中按分层抽样方法抽取20株树苗作进一步研究,不合格树苗、合格树苗应分别抽取多少株?
解 (1)∵(0.001 5+0.011 0+0.022 5+0.030 0+a+0.008 0+0.002 0)×10=1,
∴a=0.025 0,众数为=190,
设中位数为x,因为(0.001 5+0.011 0+0.022 5)×10=0.35<0.5,
(0.001 5+0.011 0+0.022 5+0.030 0)×10=0.65>0.5,
则185<x<195,
(0.001 5+0.011 0+0.022 5)×10+0.030 0(x-185)=0.5,
∴x=190.
故a=0.025 0,众数为190,中位数为190.
(2)由题可知合格树苗所占频率为(0.030 0+0.025 0+0.008 0+0.002 0)×10=0.65,不合格树苗所占频率为1-0.65=0.35,
不合格的抽取20×0.35=7(株),合格的抽取20×0.65=13(株),
故不合格树苗、合格树苗应分别抽取7株和13株.
10.成都是全国闻名的旅游城市,有许多很有特色的旅游景区.某景区为了提升服务品质,对过去100天每天的游客数进行了统计分析,发现这100天每天的游客数都没有超出八千人,统计结果见下面的频率直方图:
为了研究每天的游客数是否和当天的最高气温有关,从这一百天中随机抽取了5天,统计出这5天的游客数(千人)分别为0.8,3.7,5.1,5.6,6.8,已知这5天的最高气温(℃)依次为8,18,22,24,28.
(1)根据以上数据,求游客数y关于当天最高气温x的线性回归方程(系数保留一位小数);
(2)根据(1)中的线性回归方程,估计该景区这100天中最高气温在20℃~26℃内的天数(保留整数).
参考公式:由最小二乘法所得回归直线的方程是=x+;
其中:==,=-.
本题参考数据: (xi-)(yi-)=70, (xi-)2=232.
解 (1)由题意知,计算=×(8+18+22+24+28)=20,
=×(0.8+3.7+5.1+5.6+6.8)=4.4,
又 (xi-)(yi-)=70,
(xi-)2=232,
所以==≈0.3,
=-=4.4-0.3×20=-1.6,
所以y关于x的线性回归方程是=0.3x-1.6.
(2)当最高气温在20℃~26℃内时,
根据=0.3x-1.6,得游客数在4.4~6.2内,
频率分布直方图中这个范围内的条形图面积为(5-4.4)×0.18+0.14+(6.2-6)×0.07=0.262,
所以天数为0.262×100=26.2,
所以这100天中最高气温在20 ℃~26 ℃内的天数约为27天.
新高考数学一轮复习提升训练8.5 统计案例(精练)(含解析): 这是一份新高考数学一轮复习提升训练8.5 统计案例(精练)(含解析),共22页。
新高考数学一轮复习提升训练8.5 统计案例(精讲)(含解析): 这是一份新高考数学一轮复习提升训练8.5 统计案例(精讲)(含解析),共18页。试卷主要包含了独立性检验,线性回归方程,非线性回归方程等内容,欢迎下载使用。
高考数学一轮复习课时训练:第11章 统计与统计案例 56 Word版含解析(含答案): 这是一份高考数学一轮复习课时训练:第11章 统计与统计案例 56 Word版含解析(含答案),共8页。