专题二十 统计与统计案例-2021届高三《新题速递•数学》1月刊(江苏专用 适用于高考复习)
展开专题二十 统计与统计案例
一、多选题
1.(2021·江苏高三月考)关于变量x,y的n个样本点及其线性回归方程.下列说法正确的有( )
A.相关系数r的绝对值|r|越接近0,表示x,y的线性相关程度越强
B.相关指数的值越接近1,表示线性回归方程拟合效果越好
C.残差平方和越大,表示线性回归方程拟合效果越好
D.若,则点一定在线性回归方程上
2.(2021·湖北黄冈市·高二期末)下列命题中正确的有( )
A.对立事件一定是互斥事件,但互斥事件不一定是对立事件
B.两个随机变量的线性相关系数越大,则两个变量的线性相关性越强
C.回归直线必过样本点的中心
D.相关指数越大,则模型的拟合效果越好
3.(2021·江苏常州市·高三期末)年的“金九银十”变成“铜九铁十”,全国各地房价“跳水”严重,但某地二手房交易却“逆市”而行.下图是该地某小区年月至年月间,当月在售二手房均价(单位:万元/平方米)的散点图.(图中月份代码分别对应年月年月)
根据散点图选择和两个模型进行拟合,经过数据处理得到的两个回归方程分别为和,并得到以下一些统计量的值:
注:是样本数据中的平均数,是样本数据中的平均数,则下列说法正确的是( )
A.当月在售二手房均价与月份代码呈负相关关系
B.由预测年月在售二手房均价约为万元/平方米
C.曲线与都经过点
D.模型回归曲线的拟合效果比模型的好
二、单选题
4.(2021·湖南长沙市·长沙一中高三月考)两个具有线性相关关系的变量的一组数据,,…,下列说法错误的是( )
A.相关系数越接近1,变量相关性越强
B.落在回归直线方程上的样本点越多,回归直线方程拟合效果越好
C.相关指数越小,残差平方和越大,即模型的拟合效果越差
D.若表示女大学生的身高,表示体重则表示女大学生的身高解释了的体重变化
第II卷(非选择题)
请点击修改第II卷的文字说明
三、解答题
5.(2020·山东高三专题练习)3月底,我国新冠肺炎疫情得到有效防控,但海外确诊病例却持续暴增,防疫物资供不应求,某医疗器械厂开足马力,日夜生产防疫所需物品.已知该厂有两条不同生产线和生产同一种产品各10万件,为保证质量,现从各自生产的产品中分别随机抽取20件,进行品质鉴定,鉴定成绩的茎叶图如下所示:
该产品的质量评价标准规定:鉴定成绩达到的产品,质量等级为优秀;鉴定成绩达到的产品,质量等级为良好;鉴定成绩达到的产品,质量等级为合格.将这组数据的频率视为整批产品的概率.
(1)从等级为优秀的样本中随机抽取两件,记为来自机器生产的产品数量,写出的分布列,并求的数学期望;
(2)请完成下面质量等级与生产线产品列联表,并判断能不能在误差不超过0.05的情况下,认为产品等级是否达到良好以上与生产产品的生产线有关.
生产线的产品
生产线的产品
合计
良好以上
合格
合计
附:
0.10
0.05
0.01
0.005
2.706
3.841
6.635
7.879
6.(2019·湖北省孝感市第一高级中学高二期末(文))“读书可以让人保持思想活跃,让人得到智慧启发,让人滋养浩然之气”,2018年第一期中国青年阅读指数数据显示,从供给的角度,文学阅读域是最多的,远远超过了其他阅读域的供给量.某校采用分层抽样的方法从1000名文科生和2000名理科生中抽取300名学生进行了在暑假阅读内容和阅读时间方面的调查,得到数据如表:
文学阅读人数
非文学阅读人数
调查人数
理科生
130
文科生
45
合计
(1)先完成上面的表格,并判断能否有90%的把握认为学生所学文理与阅读内容有关?
(2从300名被调查的学生中,随机进取30名学生,整理其日平均阅读时间(单位:分钟)如表:
阅读时间
男生人数
2
4
3
5
2
女生人数
1
3
4
3
3
试估计这30名学生日阅读时间的平均值(同一组中的数据以这组数据所在区间中点的值作代表)
(3)从(2)中日均阅读时间不低于120分钟的学生中随机选取2人介绍阅读心得,求这两人都是女生的概率.
参考公式: ,其中.
参考数据:
0.10
0.05
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
7.(2019·山东高考模拟(理))某手机公司生产某款手机,如果年返修率不超过千分之一,则生产部门当年考核优秀,现获得该公司2010-2018年的相关数据如下表所示:
年份
2010
2011
2012
2013
2014
2015
2016
2017
2018
年生产量(万台)
3
4
5
6
7
7
9
10
12
产品年利润(千万元)
3.6
4.1
4.4
5.2
6.2
7.8
7.5
7.9
9.1
年返修量(台)
47
42
48
50
92
83
72
87
90
(1)从该公司2010-2018年的相关数据中任意选取3年的数据,以表示3年中生产部门获得考核优秀的次数,求的分布列和数学期望;
(2)根据散点图发现2015年数据偏差较大,如果去掉该年的数据,试用剩下的数据求出年利润(千万元)关于年生产量(万台)的线性回归方程(精确到0.01).部分计算结果:,,.
附:;线性回归方程中,,.
8.(2020·云南省保山第九中学高二月考(理))某商店试销某种商品20天,获得如下数据:
日销售量(件)
0
1
2
3
频数
1
5
9
5
试销结束后(假设该商品的日销售量的分布规律不变),设某天开始营业时有该商品3件,当天营业结束后检查存货,若发现存货少于2件,则当天进货补充至3件,否则不进货,将频率视为概率.
(1)求当天商品不进货的概率;
(2)记X为第二天开始营业时该商品的件数,求X的分布列和数学期望.
9.(2021·安徽阜阳市·高三期末(文))为了解中学生是否近视与性别的相关性,某研究机构分别调查了甲、乙、丙三个地区的100名中学生是否近视的情况,得到三个列联表如表所示.
甲地区 乙地区 丙地区
近视
不近视
合计
近视
不近视
合计
近视
不近视
合计
男
21
29
50
男
25
25
50
男
23
27
50
女
19
31
50
女
15
35
50
女
17
33
50
合计
40
60
100
合计
40
60
100
合计
40
60
100
(1)分别估计甲、乙两地区的中学男生中男生近视的概率;
(2)根据列联表的数据,在这三个地区中,中学生是否近视与性别关联性最强与最弱的地区分别是哪个地区?
附:,其中.
10.(2021·柳州市第二中学高二期末(文))现对某市工薪阶层关于“楼市限购令”的态度进行调查,随机抽调了50人,他们月收入的频数分布及对“楼市限购令”赞成人数如表:
月收入(单位百元)
频数
5
10
15
10
5
5
赞成人数
4
8
12
6
3
2
(1)由以上统计数据填下面列联表并问是否有99%的把握认为“月收入以5500为分界点”对“楼市限购令”的态度有差异;
月收入低于55百元的人数
月收入不低于55百元的人数
合计
赞成
不赞成
合计
(2)若采用分层抽样在月收入在,的被调查人中共随机抽取6人进行追踪调查,并给予其中3人“红包”奖励,求收到“红包”奖励的3人中至少有1人收入在的概率.
参考公式:,其中.
参考数据:
()
0.050
0.010
0.001
3.841
6.635
10.828
11.(2021·青铜峡市高级中学高二期末(文))我国北方广大农村地区、一些城镇以及部分大中城市的周边区域,还在大量采用分散燃煤和散烧煤取暖,既影响了居民基本生活的改善,也加重了北方地区冬季的雾霾天气.推进北方地区冬季清洁取暖,是重大民生工程、民心工程,关系北方地区广大群众温暖过冬,关系雾霾天能不能减少,是能源生产和消费革命、农村生活方式革命的重要内容.2017年9月国家发改委制定了煤改气、煤改电价格扶植新政策,从而使得煤改气、煤改电用户大幅度增加,下面条形图反映了某省2018年1~7月份煤改气、煤改电的用户数量.
(1)在给定坐标系中作出煤改气、煤改电用户数量y随月份t变化的散点图,并用散点图和相关系数说明y与t之间具有线性相关性;
(2)建立y关于t的回归方程(系数精确到0.01),预测11月份该省煤改气、煤改电的用户数量.
参考数据:.
参考公式:相关系数.
回归方程中斜率和截距的最小二乘估计公式分别为:.
12.(2021·湖北黄冈市·高二期末)为了解国内不同年龄段的民众旅游消费基本情况,某旅游网站从其数据库中随机抽取了1000条客户信息进行分析,这些客户一年的旅游消费金额如下表:
旅游消费(千元)
合计
年轻人(人)
90
80
70
60
60
40
400
中老年(人)
55
90
125
130
110
90
600
把一年旅游消费金额满8千元的称为“高消费”,否则称为“低消费”.
(1)从这些客户中随机选一人,求该客户是“高消费”的年轻人的概率;
(2)完成列联表,并判断能否有99%的把握认为旅游消费高低与年龄有关.
低消费
高消费
合计
年轻人(人)
中老年(人)
合计
附:列联表参考公式:,其中.
临界值表:
0.100
0.050
0.025
0.010
0.001
2.706
3.841
5.024
6.635
10.828
13.(2021·陕西宝鸡市·高三一模(文))自从新型冠状病毒爆发以来,美国疫情持续升级,以下是美国2020年4月9日-12月14日每隔25天统计1次共11次累计确诊人数(万).
日期(月/日)
4/09
5/04
5/29
6/23
7/18
8/13
9/06
10/01
10/26
11/19
12/14
统计时间顺序
1
2
3
4
5
6
7
8
9
10
11
累计确诊人数
43.3
118.8
179.4
238.8
377.0
536.0
646.0
744.7
888.9
1187.4
1673.7
(1)将4月9日作为第1次统计,若将统计时间顺序作为变量,每次累计确诊人数作为变量,得到函数关系(、).对上表的数据作初步处理,得到部分数据已作近似处理的一些统计量的值,,,,,,,,,.根据相关数据,确定该函数关系式(函数的参数精确到0.01).
(2)为了了解患新冠肺炎与年龄的关系,已知某地患有新冠肺炎的老年、中年、青年的人数分别为45人,30人,15人,按分层抽样的方法随机抽取6人进行问卷调查,再从6人中随机抽取2人进行调查结果对比,求这2人中至少一人是老年人的概率.
14.(2020·安徽淮北市·高三一模(文))2020年11月某市进行了高中各年级学生的“国家体质健康测试”.现有1500名(男生1200名,女生300名)学生的测试成绩,根据性别按分层抽样的方法抽取100名学生进行分析,得到如下统计图表:
男生测试情况:
抽样情况
免试(病残等)
合格
合格
良好
优秀
人数
2
10
18
46
x
女生测试情况:
抽样情况
免试(病残等)
合格
合格
良好
优秀
人数
1
3
11
y
2
(1)现从抽取的100名且测试成绩为优秀的学生中随机挑选两名学生,求选出的这两名学生恰好是一男一女的概率;
(2)若测试成绩为良好或优秀的学生为“体育达人”,其他成绩的学生(含病残等免试学生)为“非体育达人”.根据以上统计数据填写下面的列联表,并回答能否在犯错误的概率不超过0.01的前提下认为“是否为体育达人与性别有关?”
男性
女性
总计
体育达人
非体育达人
总计
临界值表:
0.10
0.05
0.025
0.010
0.005
2.706
3.841
5.024
6.635
7.879
附:
15.(2021·湖南长沙市·长沙一中高三月考)定向越野起源于欧洲,是一种借助地图、指南针,在一个划定的区域内,通过对地形地貌的判断.设计合理路线到达各个目标点位,最后到达终点的运动.湖南青奠定向体育发展有限公司为了推广定向活动,对学生群体进行定向越野的介绍和培训,并对初步了解了定向活动的学生是否会参加定向越野活动进行调查.随机抽取了200位中小学生进行调查,得到如下数据:准备参加定向越野的小学生有80人,不准备参加定向越野的小学生有40人,准备参加定向越野的中学生有40人.
(1)完成下列列联表,并根据列联表判断是否有97.5%的把握认为这200位参与调查的中小学生是否准备参加定向越野与中学生、小学生年龄有关.
准备参加定向越野
不准备参加定向越野
合计
小学生
中学生
合计
(2)为了储备定向后备力量,备战全国赛,提高会员定向水平,俱乐部将小学生会员分组进行比赛.两人一组,每周进行一轮比赛,每小组两人每人跑两张地图(跑一张地图视为一次),达到教练设定的成绩标准的次数之和不少于3次称为“优秀小组”.小超与小红同一小组,小超、小红达到教练设定的成绩标准的概率分别为,,且,理论上至少要进行多少轮比赛,才能使得小超、小红小组在比赛中获得“优秀小组”次数的期望值达到16次?并求此时,的值.
附:,.
0.50
0.25
0.05
0.025
0.010
0.455
1.323
3.840
5.024
6.635
16.(2021·江苏常州市·高三期末)某公司在市场调查中,发现某产品的单位定价(单位:万元/吨)对月销售量(单位:吨)有影响.对不同定价和月销售量数据作了初步处理,
0.24
43
9
0.164
820
68
3956
表中.经过分析发现可以用来拟合与的关系.
(1)求关于的回归方程;
(2)若生产吨产品的成本为万元,那么预计价格定位多少时,该产品的月利润取最大值,求此时的月利润.
附:对于一组数据,,…,,其回归直线线的的斜率和截距的最小二乘估计分别为:,.
17.(2020·全国高三专题练习(理))某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了份,暴雨前的投票也收集了份,所得统计结果如下表:
支持
不支持
总计
北京暴雨后
北京暴雨前
总计
已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为.
(1)求列联表中的数据、、、的值;
(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?
(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关?
18.(2020·全国高三专题练习(理))某学生对其亲属人的饮食习惯进行了一次调查,并用茎叶图表示人的饮食指数.(说明:图中饮食指数低于的人,饮食以蔬菜为主;饮食指数高于的人,饮食以肉类为主.)
(1)根据茎叶图,帮助这位学生说明其亲属人的饮食习惯;
(2)根据以上数据完成下列列联表:
主食蔬菜
主食肉类
合计
岁以下
岁以上
合计
(3)能否有的把握认为其亲属的饮食习惯与年龄有关,并写出简要分析.
19.(2020·全国高三专题练习(理))某食品厂为了检查甲乙两条自动包装流水线的生产情况,随即在这两条抽流水线上各抽取件产品作为样本算出他们的重量(单位:克).重量落在的产品为合格品,否则为不合格.表一为甲流水线样本频率分布表,图一为乙流水线样本的频率分布直方图.
产品重量(克)
频数
6
8
14
8
4
表1:(甲流水线样本频数分布表)
(1)根据上表数据在答题卡上作出甲流水线样本的频率分布直方图;
(2)若以频率作为概率,试估计从乙流水线上任取件产品,恰有件产品为合格品的概率;
(3)由以上统计数据完成下面列联表,并回答有多大的把握认为“产品的包装质量与两条自动包装流水线的选择有关”.
甲流水线
乙流水线
合计
合格品
不合格品
合计
附:下面的临界值表供参考:(参考公式:,其中).
20.(2020·全国高三专题练习(理))《环境空气质量指标()技术规定(试行)》如表1:
表1:空气质量指标分组表
级别
Ⅰ级
Ⅱ级
Ⅲ级
Ⅳ级
Ⅴ级
Ⅵ级
类别
优
良
轻度污染
中度污染
重度污染
严重污染
表2是某市某气象观测点在某连续天里的记录,指数与当天的空气水平可见度()的情况.
表2:空气质量指标分组表
指数
空气水平可见度(千米)
表3是某气象观测点记录的该市年月日至月日指数频数统计表.
表3:
指数
频数
(1)设,根据表2的数据,求出关于的回归方程;
(2)小李在该市开了一家小洗车店,经小李统计:指数不高于时,洗车店平均每天亏损约元;指数在至时,洗车店平均每天收入约元;指数大于时,洗车店平均每天收入约元.计算小李的洗车店在当年月份每天收入的数学期望.
(用最小二乘法求线性回归方程系数公式,)
21.(2020·全国高三专题练习(理))电视传媒公司为了解某地区观众对某类体育节目的收视情况,随机抽取了名观众进行调查,其中女性有名.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:
将日均收看该体育节目时间不低于分钟的观众称为“体育迷”,已知“体育迷”中有名女性.
(1)根据已知条件完成下面的列联表,并据此资料判断是否有的把握认为“体育迷”与性别有关?
非体育迷
体育迷
合计
男
女
合计
(2)将日均收看该体育节目不低于分钟的观众称为“超级体育迷”,已知“超级体育迷”中有名女性,若从“超级体育迷”中任意选取人,求至少有名女性观众的概率.
附:
22.(2020·全国高三专题练习(文))某网站就“民众是否支持加大修建城市地下排水设施的资金投入”进行投票.按照北京暴雨前后两个时间收集有效投票,暴雨后的投票收集了份,暴雨前的投票也收集了份,所得统计结果如下表:
支持
不支持
总计
北京暴雨后
北京暴雨前
总计
已知工作人员从所有投票中任取一个,取到“不支持投入”的投票的概率为.
(1)求列联表中的数据、、、的值;
(2)绘制条形统计图,通过图形判断本次暴雨是否影响到民众对加大修建城市地下排水设施的投入的态度?
(3)能够有多大把握认为北京暴雨对民众是否赞成加大对修建城市地下排水设施的投入有关?
附:
四、填空题
23.(2020·常德市第二中学高三其他模拟(文))下表是某厂1~4月份用水量(单位:百吨)的一组数据:
月份
1
2
3
4
用水量
4.5
4
3
2.5
由散点图可知,用水量与月份之间有较好的线性相关关系,其线性回归直线方程是,则等于___
专题二十 统计与统计案例-2021届高三《新题速递•数学》10月刊(江苏专用 适用于高考复习): 这是一份专题二十 统计与统计案例-2021届高三《新题速递•数学》10月刊(江苏专用 适用于高考复习),文件包含专题二十统计与统计案例原卷版docx、专题二十统计与统计案例解析版docx等2份试卷配套教学资源,其中试卷共85页, 欢迎下载使用。
专题二十 统计与统计案例-2021届高三《新题速递•数学》9月刊(江苏专用 适用于高考复习): 这是一份专题二十 统计与统计案例-2021届高三《新题速递•数学》9月刊(江苏专用 适用于高考复习),文件包含专题二十统计与统计案例原卷版docx、专题二十统计与统计案例解析版docx等2份试卷配套教学资源,其中试卷共51页, 欢迎下载使用。
专题二十 统计与统计案例-2021届高三《新题速递•数学》11月刊(江苏专用 适用于高考复习): 这是一份专题二十 统计与统计案例-2021届高三《新题速递•数学》11月刊(江苏专用 适用于高考复习),文件包含专题二十统计与统计案例原卷版docx、专题二十统计与统计案例解析版docx等2份试卷配套教学资源,其中试卷共58页, 欢迎下载使用。