高中数学高考专题26 统计(原卷版)
展开专题26 统计
命题规律 | 内 容 | 典 型 |
1 | 考查抽样方法 | 2019年高考全国Ⅰ卷文数 |
2 | 用样本估计总体 | 2019年高考全国Ⅱ卷文数 |
3 | 样本期望、方差计算与在决策者中的应用 | 2019年高考全国Ⅱ卷文数 |
4 | 以解答题形式考查独立性检验的应用 | 2020年高考全国Ⅲ卷文理数18 |
5 | 回归方程求解与回归分析在实际中应用 | 2020年高考全国Ⅱ卷文理数18 |
命题规律一 考查抽样方法
【解决之道】解决此类问题的关键在于理解简单随机抽、系统抽样、分层抽样,共同点是等可能抽样,区别为,简单随机抽样适合样本较少,系统抽样适合样本数目较多,是等距离抽样,分层抽样适合各部分差异较大,是按比例抽样.
【三年高考】
1.【2019年高考全国Ⅰ卷文数】某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
2.【2018年高考全国Ⅲ卷文数】公司有大量客户,且不同年龄段客户对其服务的评价有较大差异.为了解客户的评价,该公司准备进行抽样调查,可供选择的抽样方法有简单随机抽样、分层抽样和系统抽样,则最合适的抽样方法是______________.
命题规律二 利用样本估计总体
【解决之道】解决此类问题的关键在于认真阅读所给样本数据的图表,利用图表中的信息,提炼出样本的原始信息,再利用相关方法计算样本的中位数、均值、方差估计总体的中位数、均值、方差等.
【三年高考】
1.【2020年高考天津卷4】从一批零件中抽取80个,测量其直径(单位:),将所得数据分为9组:,并整理得到如下频率分布直方图,则在被抽取的零件中,直径落在区间内的个数为( )
A.10 B.18 C.20 D.36
2.【2018年高考全国Ⅰ卷文数】某地区经过一年的新农村建设,农村的经济收入增加了一倍,实现翻番.为更好地了解该地区农村的经济收入变化情况,统计了该地区新农村建设前后农村的经济收入构成比例,得到如下饼图:
建设前经济收入构成比例 建设后经济收入构成比例
则下面结论中不正确的是( )
A.新农村建设后,种植收入减少
B.新农村建设后,其他收入增加了一倍以上
C.新农村建设后,养殖收入增加了一倍
D.新农村建设后,养殖收入与第三产业收入的总和超过了经济收入的一半
3.【2019年高考全国Ⅲ卷文数】《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为( )
A.0.5 B.0.6
C.0.7 D.0.8
命题规律三 样本的期望与方差求解与在决策中的应用
【解决之道】通过对样本期望与方差的计算估计总体的期望与方差,通过对两组样本期望与方差的比较,即可做出决策.
【三年高考】
1.【2020年高考全国Ⅲ卷文数3】设一组样本数据的方差为,则数据的方差为 ( )
A. B. C. D.
2.【2020年高考江苏卷3】已知一组数据的平均数为,则的值是 .
3.【2020年高考上海卷8】已知有四个数,这四个数的中位数为3,平均数为4,则 .
4.【2019年高考江苏卷】已知一组数据6,7,8,8,9,10,则该组数据的方差是______________.
5.【2018年高考江苏卷】已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为______________.
6.【2019年高考全国Ⅱ卷文数】某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
的分组 | |||||
企业数 | 2 | 24 | 53 | 14 | 7 |
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:.
7..【2019年高考全国Ⅲ卷文数】为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
8.【2018年高考全国Ⅰ卷文数】某家庭记录了未使用节水龙头50天的日用水量数据(单位:m3)和使用了节水龙头50天的日用水量数据,得到频数分布表如下:
未使用节水龙头50天的日用水量频数分布表
日用水量 | |||||||
频数 | 1 | 3 | 2 | 4 | 9 | 26 | 5 |
使用了节水龙头50天的日用水量频数分布表
日用水量 | ||||||
频数 | 1 | 5 | 13 | 10 | 16 | 5 |
(1)在答题卡上作出使用了节水龙头50天的日用水量数据的频率分布直方图:
(2)估计该家庭使用节水龙头后,日用水量小于0.35 m3的概率;
(3)估计该家庭使用节水龙头后,一年能节省多少水?(一年按365天计算,同一组中的数据以这组数据所在区间中点的值作代表.)
9.【2020年高考全国Ⅰ卷文数17】某厂接受了一项加工业务,加工出来的产品(单位:件)按标准分为A,B,C,D四个等级.加工业务约定:对于A级品、B级品、C级品,厂家每件分别收取加工费90元,50元,20元;对于D级品,厂家每件要赔偿原料损失费50元.该厂有甲、乙两个分厂可承接加工业务.甲分厂加工成本费为25元/件,乙分厂加工成本费为20元/件.厂家为决定由哪个分厂承接加工业务,在两个分厂各试加工了100件这种产品,并统计了这些产品的等级,整理如下:
甲分厂产品等级的频数分布表 乙分厂产品等级的频数分布表
等级 | A | B | C | D |
频数 | 40 | 20 | 20 | 20 |
等级 | A | B | C | D |
频数 | 28 | 17 | 34 | 21 |
(1)分别估计甲、乙两分厂加工出来的一件产品为A级品的概率;
(2)分别求甲、乙两分厂加工出来的100件产品的平均利润,以平均利润为依据,厂家应选哪个分厂承接加工业务?
命题规律四 以解答题形式考查独立性检验的应用
【解决之道】独立性检验是研究两个分类变量相关关系的重要手段,独立性检验的一般步骤:(1)根据样本数据列出2×2列联表;(2)计算随机变量K2的观测值k,查下表确定临界值k0:(3)如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过P(K2≥k0);否则,就认为在犯错误的概率不超过P(K2≥k0)的前提下不能推断“X与Y有关”.
【三年高考】
1.【2020年高考全国Ⅲ卷文理数18】某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):
锻炼人次 空气质量等级 | |||
1(优) | 2 | 16 | 25 |
2(良) | 5 | 10 | 12 |
3(轻度污染) | 6 | 7 | 8 |
4(中度污染) | 7 | 2 | 0 |
(1)分别估计该市一天的空气质量等级为 1,2,3,4 的概率;
(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);
(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的列联表,并根据列联表,判断是否有的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?
| 人次 | 人次 |
空气质量好 |
|
|
空气质量不好 |
|
|
附:
2.【2020年高考山东卷19】
为加强环境保护,治理空气污染,环境监测部门对某市空气质量进行调研,随机抽查了天空气中的和浓度(单位:),得下表:
| |||
32 | 18 | 4 | |
6 | 8 | 12 | |
3 | 7 | 10 |
(1)估计事件“该市一天空气中浓度不超过,且浓度不超过”的概率;
(2)根据所给数据,完成下面列联表:
| ||
|
| |
|
|
(3)根据(2)中的列联表,判断是否有的把握认为该市一天空气中浓度与浓度有关?
附:,
3.【2019年高考全国Ⅰ卷文数】某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:
| 满意 | 不满意 |
男顾客 | 40 | 10 |
女顾客 | 30 | 20 |
(1)分别估计男、女顾客对该商场服务满意的概率;
(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?
附:.
P(K2≥k) | 0.050 | 0.010 | 0.001 |
k | 3.841 | 6.635 | 10.828 |
4.【2018年高考全国Ⅲ卷文数】某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:
| 超过 | 不超过 |
第一种生产方式 |
|
|
第二种生产方式 |
|
|
(3)根据(2)中的列联表,能否有99%的把握认为两种生产方式的效率有差异?
附:,.
命题规律五 回归方程与回归分析在实际中的应用
【解决之道】1.线性回归分析问题的类型及解题方法
(1)求线性回归方程
①利用公式,求出回归系数,.
②待定系数法:利用回归直线过样本点的中心求系数.
(2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值.
(3)利用回归直线判断正、负相关,决定正相关还是负相关的是系数.
(4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.
2.模型拟合效果的判断
(1)残差平方和越小,模型的拟合效果越好.
(2)相关指数R2越大,模型的拟合效果越好.
(3)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于1时,两变量的线性相关性越强.
【三年高考】
1.【2020年高考全国Ⅰ卷文理数5】某校一个课外学习小组为研究某作物种子的发芽率和温度(单位:)的关系,在20个不同的温度条件下进行种子发芽实验,由实验数据得到下面的散点图:
由此散点图,在至之间,下面四个回归方程类型中最适宜作为发芽率和温度的回归方程类型的是( ) ( )
A. B. C. D.
2.【2020年高考全国Ⅱ卷文理数18】某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据,其中和分别表示第个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得,,,,.
(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);
(2)求样本的相关系数(精确到);
(3)根据现有统计资料,各地块间植物覆盖面积差异很大,为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.
附:相关系数,.
3.【2018年高考全国Ⅱ卷文数】下图是某地区2000年至2016年环境基础设施投资额(单位:亿元)的折线图.
为了预测该地区2018年的环境基础设施投资额,建立了与时间变量的两个线性回归模型.根据2000年至2016年的数据(时间变量的值依次为)建立模型①:;根据2010年至2016年的数据(时间变量的值依次为)建立模型②:.
(1)分别利用这两个模型,求该地区2018年的环境基础设施投资额的预测值;
(2)你认为用哪个模型得到的预测值更可靠?并说明理由.
高三数学高考高分突破之概率统计专题26 建议问题(原卷版)40: 这是一份高三数学高考高分突破之概率统计专题26 建议问题(原卷版)40,共8页。
高中数学高考专题32 概率和统计【理】(原卷版): 这是一份高中数学高考专题32 概率和统计【理】(原卷版),共56页。
高中数学高考专题31 概率和统计【文】(原卷版): 这是一份高中数学高考专题31 概率和统计【文】(原卷版),共27页。