微专题18 统计与成对数据的统计分析
展开1.(2023·南充诊断)某校高中生共有1 000人,其中高一年级300人,高二年级200人,高三年级500人,现采用分层随机抽样的方法抽取容量为50人的样本,那么高一、高二、高三年级抽取的人数分别为( )
A.15,10,25 B.20,10,20
C.10,10,30 D.15,5,30
2.(2023·宁波质检)若一组样本数据x1,x2,…,xn的平均数为10,另一组样本数据2x1+4,2x2+4,…,2xn+4的方差为8,则两组样本数据合并为一组样本数据后的平均数和方差分别为( )
A.17,54 B.17,48
C.15,54 D.15,48
3.(2023·昆明三诊)某单位职工参加某APP推出的“二十大知识回答竞赛”活动,参与者每人每天可以作答三次,每次作答20题,每题答对得5分,答错得0分.该单位从职工中随机抽取了10位,他们一天中三次作答的得分情况如下图:
根据上图,估计该单位职工答题情况,则下列说法正确的是( )
A.该单位职工一天中各次作答的平均分保持一致
B.该单位职工一天中各次作答的正确率保持一致
C.该单位职工一天中第三次作答得分的极差小于第二次的极差
D.该单位职工一天中第三次作答得分的标准差小于第一次的标准差
4.(多选)(2023·广州模拟)某校随机抽取了100名学生测量体重.经统计,这些学生的体重数据(单位:kg)全部介于45至70之间,将数据整理得到如图所示的频率分布直方图,则( )
A.频率分布直方图中a的值为0.07
B.这100名学生中体重的众数为52.5
C.据此可以估计该校学生体重的第78百分位数为62
D.据此可以估计该校学生体重的平均数为62.5
5.(多选)为了解高中生选科时是否选物理与数学成绩之间的关系,某教研机构随机抽取了50名高中生,通过问卷调查,得到以下数据:
由以上数据,计算得到
χ2=eq \f(50×(13×20-10×7)2,23×27×20×30)≈4.844,
根据临界值表,以下说法正确的是( )
参考数据:
A.依据小概率值α=0.05的独立性检验认为是否选择物理与数学成绩有关
B.在犯错误的概率不超过0.01的前提下,认为是否选择物理与数学成绩无关
C.95%的数学成绩优异的同学选择物理
D.若表格中的所有数据都扩大为原来的10倍,在相同条件下,结论不会发生
变化
6.(多选)(2023·长沙模拟)自然环境中,大气压强受到各种因素的影响,如温度、湿度、风速和海拔等方面的改变,都将导致大气压强发生相应的变化,其中以海拔的影响最为显著.下图是根据一组观测数据得到的海拔6 km~15 km的大气压强散点图,根据一元线性回归模型得到经验回归方程为eq \(y,\s\up6(^))1=-4.0x+68.5,决定系数为Req \\al(2,1)=0.99;根据非线性回归模型得到非线性经验回归方程为
eq \(y,\s\up6(^))2=132.9e-0.163x,决定系数为Req \\al(2,2)=0.99,则下列说法正确的是( )
A.由散点图可知,大气压强与海拔负相关
B.由方程eq \(y,\s\up6(^))1=-4.0x+68.5可知,海拔每升高1 km,大气压强必定降低4.0 kPa
C.由方程eq \(y,\s\up6(^))1=-4.0x+68.5可知,样本点(11,22.6)的残差为-1.9
D.对比两个回归模型,结合实际情况,方程eq \(y,\s\up6(^))2=132.9e-0.163x的预报效果更好
7.某设备的使用年限与所支出的维修费用的统计数据如下表:
根据上表可得经验回归方程为eq \(y,\s\up6(^))=1.3x+eq \(a,\s\up6(^)),据此模型预测,若使用年限为14年,估计维修费约为________万元.
8.某驾驶员培训学校为对比了解“科目二”的培训过程采用大密度集中培训与周末分散培训两种方式的效果,调查了105名学员,统计结果为:接受大密度集中培训的55名学员中有45名学员一次考试通过,接受周末分散培训的50名学员一次考试通过的有30名.根据统计结果,认为“能否一次考试通过与是否集中培训有关”犯错误的概率不超过________.
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)).
9.某校抽取100名学生做体能测试,其中百米测试中,成绩全部介于13秒与18秒之间,将测试结果分成五组:第一组[13,14),第二组[14,15),…,第五组[17,18].如图是按上述分组方法得到的频率分布直方图,若成绩低于a即为优秀,如果优秀的人数为14,则a的估计值是________.
10.(2023·重庆诊断)某学校有男生400人,女生600人.为了调查该校全体学生每天睡眠时间,采用分层随机抽样的方法抽取样本,计算得男生每天睡眠时间均值为7.5小时,方差为1,女生每天睡眠时间均值为7小时,方差为0.5.若男、女样本量按比例分配,则可估计总体方差为________.
11.(2023·全国乙卷)某厂为比较甲、乙两种工艺对橡胶产品伸缩率的处理效应,进行10次配对试验,每次配对试验选用材质相同的两个橡胶产品,随机地选其中一个用甲工艺处理,另一个用乙工艺处理,测量处理后的橡胶产品的伸缩率,甲、乙两种工艺处理后的橡胶产品的伸缩率分别记为xi,yi(i=1,2,…,10),试验结果如下:
记zi=xi-yi(i=1,2,…,10),z1,z2,…,z10的样本平均数为eq \(z,\s\up6(-)),样本方差为s2.
(1)求eq \(z,\s\up6(-)),s2;
(2)判断甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率是否有显著提高(如果eq \(z,\s\up6(-))≥2eq \r(\f(s2,10)),则认为甲工艺处理后的橡胶产品的伸缩率较乙工艺处理后的橡胶产品的伸缩率有显著提高,否则不认为有显著提高).
12.(2023·长春模拟)某学校号召学生参加“每天锻炼1小时”活动,为了了解学生参与活动的情况,随机调查了100名学生一个月(30天)完成锻炼活动的天数,制成如下频数分布表:
(1)由频数分布表可以认为,学生参加体育锻炼活动的天数X近似服从正态分布N(μ,σ2),其中μ近似为样本的平均数(每组数据取区间的中间值),且σ=6.1,若全校有3 000名学生,求参加“每天锻炼1小时”活动超过21天的人数(精确到1);
(2)调查数据表明,参加“每天锻炼1小时”活动的天数在(15,30]的学生中有30名男生,天数在[0,15]的学生中有20名男生,学校对当月参加“每天锻炼1小时”活动超过15天的学生授予“运动达人”称号,请填写下面列联表:
并依据小概率值α= 0.05的独立性检验,能否认为学生性别与获得“运动达人”称号有关联.
如果结论是有关联,请解释它们之间如何相互影响.
附:参考数据:P(μ-σ≤X≤μ+σ)=0.682 7;
P(μ-2σ≤X≤μ+2σ)=0.954 5;
P(μ-3σ≤X≤μ+3σ)=0.997 3,
χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d))(n=a+b+c+d)
二、创新拓展练
13.(多选)(2023·嘉兴二模)已知一组样本数据x1,x2,…,xn(x1
C.极差变小 D.方差变小
14.(多选)(2023·武汉市调研)某市2022年经过招商引资后,经济收入较前一年增加了一倍,实现翻番,为更好地了解该市的经济收入的变化情况,统计了该市招商引资前后的年经济收入构成比例,得到如下扇形图:
则下列结论中正确的是( )
A.招商引资后,工资净收入较前一年增加
B.招商引资后,转移净收入是前一年的1.25倍
C.招商引资后,转移净收入与财产净收入的总和超过了该年经济收入的eq \f(2,5)
D.招商引资后,经营净收入较前一年增加了一倍
15.(多选)(2023·重庆二模)用分层随机抽样从某校高一年级学生的数学期末成绩(满分为100分,成绩都是整数)中抽取一个样本量为100的样本,其中男生成绩数据40个,女生成绩数据60个,再将40个男生成绩样本数据分为6组:[40,50),[50,60),[60,70),[70,80),[80,90),[90,100],绘制得到如图所示的频率分布直方图(同一组的数据用该组的中间值代表).则下列说法中正确的是( )
A.男生成绩样本数据的平均数为71
B.估计有90%的男生数学成绩在84分以内
C.在[50,60)和[90,100]内的两组男生成绩中,随机抽取两个进行调查,则调查对象来自不同分组的概率为eq \f(3,7)
D.若男生成绩样本数据的方差为187.75,女生成绩样本数据的平均数和方差分别为73.5和119,则总样本的方差为146
16.(多选)(2023·长沙一中模拟)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间内没有发生大规模群体感染的标志为:“连续10日,每天新增疑似病例不超过7人”.过去10日,甲、乙、丙、丁四地新增疑似病例数据信息如下:
甲地:中位数为2,众数为3;
乙地:平均数为2,方差为3;
丙地:平均数为3,极差为5;
丁地:平均数为5,众数为6.
则一定没有发生大规模群体感染的是( )
A.甲地 B.乙地 C.丙地 D.丁地
17.(2023·江门模拟)某高科技公司对其产品研发投资额x(单位:百万元)与其年销售量y(单位:千件)的数据进行统计,整理后得到如下统计表和散点图.
(1)该公司科研团队通过分析散点图的特征后,计划分别用①eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))和
②eq \(y,\s\up6(^))=eeq \(d,\s\up6(^))x+eq \(c,\s\up6(^))两种方案作为年销售量y关于年投资额x的回归分析模型,请根据统计表的数据,确定方案①和②的经验回归方程;(注:系数b,a,d,c按四舍五入保留一位小数)
(2)根据下表中数据,用决定系数R2(不必计算,只比较大小)比较两种模型的拟合效果哪个更好,并选择拟合精度更高、更可靠的模型,预测当研发年投资额为8百万元时,产品的年销售量是多少?
参考公式及数据:
eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2)=eq \f(\(∑,\s\up6(n),\s\d4(i=1))xiyi-n\(x,\s\up6(-)) \(y,\s\up6(-)),\(∑,\s\up6(n),\s\d4(i=1))xeq \\al(2,i)-n\(x,\s\up6(-))2),
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)),R2=1-eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)
=1-eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(^))i)2,\(∑,\s\up6(n),\s\d4(i=1))yeq \\al(2,i)-n\(y,\s\up6(-))2),
eq \(∑,\s\up6(6),\s\d4(i=1))xizi=-1×0.7+2×0+3×0.4+4×1.1+5×1.8+6×2.5=28.9,e3.4=30.
选物理
不选物理
数学成绩优异
20
7
数学成绩一般
10
13
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
使用年限x(单位:年)
2
3
4
5
6
维修费用y(单位:万元)
1.5
4.5
5.5
6.5
7.0
α
0.05
0.025
0.010
0.001
xα
3.841
5.024
6.635
10.828
试验序号i
1
2
3
4
5
6
7
8
9
10
伸缩率xi
545
533
551
522
575
544
541
568
596
548
伸缩率yi
536
527
543
530
560
533
522
550
576
536
天数
[0,5]
(5,10]
(10,15]
(15,20]
(20,25]
(25,30]
人数
4
15
33
31
11
6
性别
活动天数
合计
[0,15]
(15,30]
男生
女生
合计
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
x
1
2
3
4
5
6
y
0.5
1
1.5
3
6
12
z=ln y
-0.7
0
0.4
1.1
1.8
2.5
经验回归方程残差平方和
eq \(y,\s\up6(^))=eq \(b,\s\up6(^))x+eq \(a,\s\up6(^))
eq \(y,\s\up6(^))=eeq \(d,\s\up6(^))x+eq \(c,\s\up6(^))
eq \(∑,\s\up6(5),\s\d4(i=1)) (yi-eq \(y,\s\up6(^))i)2
18.29
0.65
微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题: 这是一份微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题,共34页。试卷主要包含了5%,所以A错误;,9,10)=0,635,,5万元的农户比率估计为6%,2,,484>6,9-7等内容,欢迎下载使用。
微专题18 统计与成对数据的统计分析: 这是一份微专题18 统计与成对数据的统计分析,共12页。
新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析): 这是一份新高考数学一轮复习课时过关练习第09章 统计与成对数据的统计分析第3节 成对数据的统计分析 (含解析),共23页。试卷主要包含了了解样本相关系数的统计含义,样本相关系数,一元线性回归模型,列联表与独立性检验,1% B,069>6,616,8,1等内容,欢迎下载使用。