专题二十 统计与统计案例-2021届高三《新题速递•数学》12月刊(江苏专用 适用于高考复习)
展开一、多选题
1.(2020·湖南高三开学考试)2020年3月15日,某市物价部门对5家商场的某商品一天的销售量及其价格进行调查,5家商场的售价(元)和销售量(件)之间的一组数据如表所示:
按公式计算,与的回归直线方程是:,相关系数,则下列说法正确的有( )
A.变量,线性负相关且相关性较强;B.;
C.当时,的估计值为12.8;D.相应于点的残差约为0.4.
2.(2020·广东湛江市·高三其他模拟)因防疫的需要,多数大学开学后启用封闭式管理.某大学开学后也启用封闭式管理,该校有在校学生9000人,其中男生4000人,女生5000人,为了解学生在封闭式管理期间对学校的管理和服务的满意度,随机调查了40名男生和50名女生,每位被调查的学生都对学校的管理和服务给出了满意或不满意的评价,经统计得到如下列联表:
附表:
附:
以下说法正确的有( )
A.满意度的调查过程采用了分层抽样的抽样方法
B.该学校学生对学校的管理和服务满意的概率的估计值为0.6
C.有99%的把握认为学生对学校的管理和服务满意与否与性别有关系
D.没有99%的把握认为学生对学校的管理和服务满意与否与性别有关系
3.(2020·湖南天心区·长郡中学高三月考)针对当下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的男女生人数相同,男生喜欢抖音的人数占男生人数的,女生喜欢抖音的人数占女生人数的,若有的把握认为是否喜欢抖音和性别有关,则调查人数中男生可能有( )
附表:
附:
A.B.C.D.
二、单选题
4.(2020·全国高二单元测试)现在,很多人都喜欢骑“共享单车”,但也有很多市民并不认可.为了调查人们对这种交通方式的认可度,某同学从交通拥堵不严重的城市和交通拥堵严重的城市分别随机调查了20名市民,得到如下列联表:
附:.
根据表中的数据,下列说法中正确的是( )
A.没有95%以上的把握认为“是否认可与城市的拥堵情况有关”
B.有99%以上的把握认为“是否认可与城市的拥堵情况有关”
C.可以在犯错误的概率不超过0.01的前提下认为“是否认可与城市的拥堵情况有关”
D.可以在犯错误的概率不超过0.05的前提下认为“是否认可与城市的拥堵情况有关”
5.(2020·安徽省蚌埠第三中学高二月考(理))下列说法正确的个数是( )
①线性相关系数越大,两个变量的线性相关性越强;反之,线性相关性越弱;②已知随机变量,若.则;③以模型去拟合一组数据时,为了求出回归方程,设,将其变换后得到线性方程,则的值分别是和0.3;④.在线性回归模型中,计算其相关指数,则可以理解为:解释变量对预报变量的贡献率约为;⑤.甲、乙、丙、丁4个人到4个景点旅游,每人只去一个景点,设事件 “4个人去的景点各不相同”,事件 “甲独自去一个景点”,则.
A.2B.3C.4D.5
第II卷(非选择题)
请点击修改第II卷的文字说明
三、解答题
6.(2020·全国高三专题练习(文))某工厂为提高生产效率,开展技术创新活动,提出了完成某项生产任务的两种新的生产方式.为比较两种生产方式的效率,选取40名工人,将他们随机分成两组,每组20人,第一组工人用第一种生产方式,第二组工人用第二种生产方式.根据工人完成生产任务的工作时间(单位:min)绘制了如下茎叶图:
(1)根据茎叶图判断哪种生产方式的效率更高?并说明理由;
(2)求40名工人完成生产任务所需时间的中位数,并将完成生产任务所需时间超过和不超过的工人数填入下面的列联表:
7.(2020·甘肃省民乐县第一中学高三期中(理))某工厂,两条生产线生产同款产品,若产品按照一、二、三等级分类,则每件可分别获利10元、8元、6元,现从,生产线的产品中各随机抽取100件进行检测,结果统计如下图:
(1)根据已知数据,列出产品等级与生产线的列联表,并判断是否有99%的把握认为一等级产品与生产线有关?
(2)分别计算两条生产线抽样产品获利的方差,以此作为判断依据,说明哪条生产线的获利更稳定?
附:
8.(2020·全国高三专题练习(理))某电商为了解消费者的下一部手机是否会选购某一品牌手机,随机抽取了200位以前的客户进行调查,得到如下数据:准备购买该品牌手机的男性有80人,不准备买该品牌手机的男性有40人,准备买该品牌手机的女性有40人.
(1)完成下列2×2列联表,并根据列联表判断是否有97.5%的把握认为这200位参与调查者是否准备购买该品牌手机与性别有关.
(2)该电商将这200个样本中准备购买该品牌手机的被调查者按照性别分组,用分层抽样的方法抽取6人,再从这6人中随机抽取3人给予500元优惠券的奖励,另外3人给予200元优惠券的奖励,求获得500元优惠券与获得200元优惠券的被调查者中都有女性的概率.
附:,.
9.(2020·河北桃城区·衡水中学高三月考)为落实十三五规划节能减排的国家政策,某职能部门对市场上两种设备的使用寿命进行调查统计,随机抽取A型和B型设备各100台,得到如下频率分布直方图:
(1)将使用寿命超过2500小时和不超过2500小时的台数填入下面的列联表:
根据上面的列联表,能否有99%的把握认为使用寿命是否超过2500小时与型号有关?
(2)用分层抽样的方法从不超过2500小时A型和B型设备中抽取8台,再从这8台设备中随机抽取3台,其中A型设备为台,求的分布列和数学期望;
(3)已知用频率估计概率,现有一项工作需要10台同型号设备同时工作2500小时才能完成,工作期间设备损坏立即更换同型号设备(更换设备时间忽略不计),A型和B型设备每台的价格分别为1万元和0.6万元,A型和B型设备每台每小时耗电分别为2度和6度,电价为0.75元/度.只考虑设备的成本和电费,你认为应选择哪种型号的设备,请说明理由.
参考公式:,.
参考数据:
10.(2020·全国高三月考(文))某学校抽取部分学生,对他们是否喜欢学校的午餐进行调查,所得数据如下表所示;若在被调查的学生中任意抽取1人,抽到不喜欢吃学校午餐的男生的概率为.
(1)求的值;
(2)根据以上列联表,判断是否有99.9%的把握认为“性别与否喜欢吃学校午餐”有关?下面的临界值表仅供参考:
(参考公式:,其中.)
11.(2020·江苏宿城区·宿迁中学高三期中)解决留守儿童问题是全而建成小康社会的内在要求,也是党和人民的迫切希望.为调查某村留守儿童问题与家庭人均纯收入之间的关系,从该村的750户人家中随机抽取了100户调查家庭情况,得下表:
(1)中共十八大将小康水平定义为“农村居民家庭人均纯收入8000元”.根据此标准,估算该村750户人家中达到小康水平得家庭数目;
(2)根据所给数据,完成下面的2×2列联表:
(3)根据(2)中的列联表,判断是否有99.9%的把握认为留守儿童问题与家庭年均纯收入有关?
附:
12.(2020·湖南高二期中)湖南省从2021年开始将全面推行“”的新高考模式,新高考对化学、生物、地理和政治等四门选考科目,制定了计算转换T分(即记入高考总分的分数)的“等级转换赋分规则”(详见附1和附2),具体的转换步骤为:①原始分Y等级转换;②原始分等级内等比例转换赋分.某校的一次年级统考中,政治、生物两选考科目的原始分分布如下表:
现从政治、生物两学科中分别随机抽取了20个原始分成绩数据,作出茎叶图:
(1)根据茎叶图,分别求出政治成绩的中位数和生物成绩的众数;
(2)该校的甲同学选考政治学科,其原始分为82分,乙同学选考生物学科,其原始分为91分,根据赋分转换公式,分别求出这两位同学的转化分;
(3)根据生物成绩在等级B的6个原始分和对应的6个转化分,得到样本数据,请计算生物原始分与生物转换分之间的相关系数,并根据这两个变量的相关系数谈谈你对新高考这种“等级转换赋分法”的看法.
附1:等级转换的等级人数占比与各等级的转换分赋分区间.
附2:计算转换分T的等比例转换赋分公式:.(其中:,,分别表示原始分Y对应等级的原始分区间下限和上限;,分别表示原始分对应等级的转换分赋分区间下限和上限.T的计算结果按四舍五入取整数)
附3:,,.
13.(2020·湖北高三月考)近年来,我国肥胖人群的规模急速增长,肥胖人群有着很大的健康隐患.目前,国际上常用身体质量指数(英文为,简称)来衡量人体胖瘦程度以及是否健康,其计算公式是中国成人的数值标准为:为偏瘦;为正常;为偏胖;为肥胖.某地区随机调查了6000名35岁以上成人的身体健康状况,其中有1000名高血压患者,得到被调查者的频率分布直方图如图:
(1)求被调查者中肥胖人群的平均值;
(2)根据频率分布直方图,完成下面的2×2列联表,并判断能有多大(百分数)的把握认为35岁以上成人高血压与肥胖有关?
参考公式:,其中.
参考数据:
14.(2020·江苏如皋市·高三期中)利用简单随机抽样的方法,从某校高一年级男生体验表格中抽取名同学的胸围与肺活量的样本,计算平均值,,并求出线性回归方程为.
高一男生胸围与肺活量样本统计表
(1)求的值;
(2)求样本与的相关系数,并根据相关性检验的临界值表,判断有无把握认为肺活量与胸围线性关系是有意义的(精确到);
(3)将肺活量不低于视为大肺活量,用样本大肺活量的频率作为全校高一男生大肺活量的概率,求从本校高一年级任意抽取名男同学,恰有两名是大肺活量的概率.
(参考公式及数据:,,,.)
附:相关性检验的临界值表
15.(2020·安徽省潜山第二中学高二期中(理))某地区2009年至2015年农村居民家庭人均纯收入y(单位:千元)的数据如下表:
(1)求关于的线性回归方程.
(2)利用(1)中的线性回归方程,分析2009年至2015年该地区农村居民家庭人均纯收入的变化情况,并预测该地区2018年农村居民家庭纯收入.
参考公式: , .
16.(2020·岳麓区·湖南师大附中高三月考)在传染病学中,通常把从致病刺激物侵入机体或者对机体发生作用起,到机体出现反应或开始呈现该疾病对应的相关症状的这一阶段称为潜伏期.各种传染疾病的潜伏期不同,数小时、数天、甚至数月不等.某市疾病预防控制中心统计了该市200名传染病患者的相关信息,得到如下表格:
(1)该传染病的潜伏期受诸多因素的影响,为研究潜伏期与患者年龄的关系,根据上表数据将如下列联表补充完整,并根据列联表判断是否有的把握认为该传染病的潜伏期与患者年龄有关.
(2)将200名患者的潜伏期超过6天的频率视为该市每名患者潜伏期超过6天发生的概率,每名患者的潜伏期是否超过6天相互独立.为了深入研究,该市疾病预防控制中心随机调查了该地区30名患者,其中潜伏期超过6天的人数为,求随机变量的期望和方差.
附:
,其中.
17.(2020·四川省成都市郫都区第四中学高二期中(理))近年来,“双11”网购的观念逐渐深入人心.某人统计了近年某网站“双11”当天的交易额,统计结果如下表:
(1)请根据上表提供的数据,用相关系数说明与的线性相关程度,线性相关系数保留三位小数.(统计中用相关系数来衡量两个变量之间线性关系的强弱.若相应于变量的取值,变量的观测值为(),则两个变量的相关系数的计算公式为:.统计学认为,对于变量,如果,那么负相关很强;如果,那么正相关很强;如果或,那么相关性一般;如果,那么相关性较弱);
(2)求出关于的线性回归方程,并预测年该网站“双11”当天的交易额.
参考公式:,;参考数据:.
18.(2020·江苏扬州市·高三期中)某校从高二年级随机抽取了20名学生的数学总评成绩和物理总评成绩,记第i位学生的成绩为() (i=1,2,),其中分别为第i位学生的数学总评成绩和物理总评成绩.抽取的数据列表如下( 按数学成绩降序整理):
(1)根据统计学知识,当相关系数|r|≥0.8时,可视为两个变量之间高度相关.根据抽取的数据,能否说明数学总评成绩与物理总评成绩高度相关?请通过计算加以说明.
参考数据:
参考公式:相关系数
(2)规定:总评成绩大于等于85分者为优秀,小于85分者为不优秀,对优秀赋分1,对不优秀赋分0,从这20名学生中随机抽取2名学生,若用X表示这2名学生两科赋分的和,求X的分布列和数学期望.
19.(2020·拉孜县中学高三月考(理))年播放的电影《我不是药神》引起了很大的轰动,治疗特种病的创新药研发成了当务之急.为此,某药企加大了研发投入,市场上治疗一类慢性病的特效药品的研发费用(百万元)和销量(万盒)的统计数据如下:
(1)根据最小二乘法求出与的线性回归方程;
(2)利用(1)中的回归方程,预测销售万盒特效药品需要多少研发费用?
附:回归直线的斜率和截距的最小二乘法估计公式为:,.
四、填空题
20.(2018·辉县市第一高级中学高二月考(理))如果由一个列联表中的数据计算得,那么有__________的把握认为两变量有关系,已知,.价格
9
9.5
10
10.5
11
销售量
11
10
8
6
5
满意
不满意
男
20
20
女
40
10
P(K2≥k)
0.100
0.05
0.025
0.010
0.001
k
2.706
3 .841
5.024
6.635
10.828
0.050
0.010
3.841
6.635
总计
认可
13
5
18
不认可
7
15
22
总计
20
20
40
0.1
0.05
0.010
0.005
2.706
3.841
6.635
7.879
超过
不超过
第一种生产方式
第二种生产方式
0.050
0.010
0.001
3.841
6.635
10.828
准备买该品牌手机
不准备买该品牌手机
合计
男性
女性
合计
0.50
0.25
0.05
0.025
0.010
0.455
1.321
3.840
5.024
6.635
超过2500小时
不超过2500小时
总计
A型
B型
总计
0.050
0.010
0.001
3.841
6.635
10.828
男生
女生
喜欢吃学校午餐
90
120
不喜欢吃学校午餐
60
0.100
0.050
0.025
0.010
0.005
0.001
2.706
3.841
5.024
6.635
7.879
10.828
家庭人均收入
留守儿童问题
存在
22
35
3
不存在
13
12
15
家庭人均纯收入
留守儿童问题
存在
不存在
0.050
0.010
0.001
k
3.841
6.635
10.828
等级
A
B
C
D
E
比例
约15%
约35%
约35%
约13%
约2%
政治学科各等级对应的原始分区间
生物学科各等级对应的原始分区间
等级
A
B
C
D
E
原始分从高到低排序的等级人数占比
约15%
约35%
约35%
约13%
约2%
转换分T的赋分区间
肥胖
不肥胖
总计
高血压
非高血压
总计
0.25
0.10
0.050
0.010
0.001
1.323
2.706
3.841
6.635
10.828
胸围
肺活量
胸围
肺活量
检验水平
年份
2009
2010
2011
2012
2013
2014
2015
年份代号
1
2
3
4
5
6
7
人均纯收入
2.9
3.3
3.6
4.4
4.8
5.2
5.9
潜伏期(单位:天)
人数
17
43
60
50
26
3
1
潜伏期天
潜伏期天
总计
50岁以上(含50岁)
100
50岁以下
55
总计
200
0.05
0.025
0.010
3.841
5.024
6.635
年份
2015
2016
2017
2018
2019
年份代码x
1
2
3
4
5
交易额y/百亿元
9
12
17
21
26
序号
1
2
3
4
5
6
7
8
9
10
数学总评成绩x
95
92
91
90
89
88
88
87
86
85
物理总评成绩y
96
90
89
87
92
81
86
88
83
84
序号
11
12
13
14
15
16
17
18
19
20
数学总评成绩x
83
82
81
80
80
79
78
77
75
74
物理总评成绩
81
80
82
85
80
78
79
81
80
78
研发费用(百万元)
销量(万盒)
专题二十 统计与统计案例-2021届高三《新题速递•数学》10月刊(江苏专用 适用于高考复习): 这是一份专题二十 统计与统计案例-2021届高三《新题速递•数学》10月刊(江苏专用 适用于高考复习),文件包含专题二十统计与统计案例原卷版docx、专题二十统计与统计案例解析版docx等2份试卷配套教学资源,其中试卷共85页, 欢迎下载使用。
专题二十 统计与统计案例-2021届高三《新题速递•数学》9月刊(江苏专用 适用于高考复习): 这是一份专题二十 统计与统计案例-2021届高三《新题速递•数学》9月刊(江苏专用 适用于高考复习),文件包含专题二十统计与统计案例原卷版docx、专题二十统计与统计案例解析版docx等2份试卷配套教学资源,其中试卷共51页, 欢迎下载使用。
专题二十 统计与统计案例-2021届高三《新题速递•数学》11月刊(江苏专用 适用于高考复习): 这是一份专题二十 统计与统计案例-2021届高三《新题速递•数学》11月刊(江苏专用 适用于高考复习),文件包含专题二十统计与统计案例原卷版docx、专题二十统计与统计案例解析版docx等2份试卷配套教学资源,其中试卷共58页, 欢迎下载使用。