


所属成套资源:全套高三数学一轮复习课时教学课件+学案
高三数学一轮复习第十章统计与成对数据的统计分析第三课时成对数据的统计分析学案
展开
这是一份高三数学一轮复习第十章统计与成对数据的统计分析第三课时成对数据的统计分析学案,共27页。
1.变量的相关关系
两个变量有关系,但又没有确切到可由其中的一个去精确地决定另一个的程度,这种关系称为相关关系.
2.相关关系的分类
(1)按变量间的增减性分为正相关和负相关.
①正相关:当一个变量的值增加时,另一个变量的相应值也呈现增加的趋势;
②负相关:当一个变量的值增加时,另一个变量的相应值呈现减少的趋势.
(2)按变量间是否有线性特征分为线性相关和非线性相关或曲线相关.
①线性相关:如果两个变量的取值呈现正相关或负相关,而且散点落在一条直线附近,我们称这两个变量线性相关;
②非线性相关或曲线相关:如果两个变量具有相关性,但不是线性相关,我们称这两个变量非线性相关或曲线相关.
3.相关关系的刻画
(1)散点图:成对样本数据用直角坐标系中的点表示出来,由这些点组成的统计图,叫做散点图.
(2)样本相关系数r的计算式
(3)样本相关系数r的性质
①样本相关系数r的取值范围为[-1,1];
②若r>0时,成对样本数据正相关;
③若r0;④2023年7月该新能源汽车厂的销量一定是3.12万辆.
A.1 B.2 C.3 D.4
(2)(多选)某运动制衣品牌为了成衣尺寸更精准,现选择15名志愿者对其身高和臂展进行测量(单位:厘米),图1为选取的15名志愿者身高与臂展的折线图,图2为身高与臂展所对应的散点图,并求得其经验回归方程为y=1.16x-30.75,以下结论正确的是( )
A.15名志愿者身高的极差小于臂展的极差
B.15名志愿者的身高和臂展具有正相关关系
C.可估计身高为190厘米的人臂展大约为189.65厘米
D.身高相差10厘米的两人臂展都相差11.6厘米
(1)B (2)ABC [(1)由x=1+2+3+4+55=3,y=1.5+1.6+2+2.4+2.55=2,因为经验回归直线过样本中心点(x,y),所以2=3b+1.16,b=0.28,②错误;可知y随着x变大而变大,所以变量x与y正相关,①③正确;由经验回归方程可知,2023年7月该新能源汽车厂的销量的估计值是y=0.28×7+1.16=3.12万辆,④错误.故选B.
(2)对于A,身高极差大约为21,臂展极差大约为26,故结论正确;对于B,很明显根据散点图以及经验回归直线得到,身高矮一些,臂展就会短一些,身高高一些,臂展就长些,故结论正确;对于C,身高为190 cm,代入经验回归方程可得到臂展估计值等于189.65 cm,但不是准确值,故结论正确;对于D,身高相差10 cm的两人臂展的估计值相差11.6 cm,但并不是准确值,经验回归直线上的点并不都是准确的样本点,故结论不正确,故选ABC.]
判定两个变量正、负相关的方法
(1)画散点图:点的分布从左下角到右上角,两个变量正相关;点的分布从左上角到右下角,两个变量负相关.
(2)相关系数:r>0时,正相关;r<0时,负相关.
(3)线性经验回归方程中:b>0时,正相关;b3.841,
依据小概率值α=0.05的独立性检验,推断H0不成立,即认为“是否全部答对与性别有关”.
(2)由题意可得,X可能取值为0,1,2,
P(X=0)=1-45×1-34=120,
P(X=1)=45×1-34+1-45×34=720,
P(X=2)=45×34=35,
则X的分布列为
所以E(X )=0×120+1×720+2×35=3120.
独立性检验的一般步骤
(1)根据样本数据完成2×2列联表;
(2)根据公式χ2=nad-bc2a+ba+cb+dc+d计算;
(3)比较χ2与临界值的大小关系,作统计推断.
跟进训练3 第31届世界大学生夏季运动会于2023年7月28日至8月8日在中国四川省成都市举行.某体育博主为调查大学生对成都大运会的了解情况,在某大学随机抽取了200名大学生(其中男生和女生各100名)提问他们有关大运会的问题,完全答对的认为了解大运会,否则认为不了解大运会,得到如下2×2列联表:
(1)根据2×2列联表,依据小概率值α=0.01的独立性检验,能否认为大学生是否了解大运会与性别有关?
(2)将频率视为概率,用样本估计总体,若从该校大学生中随机抽取3人调查他们对大运会的了解情况,记抽取的3人中了解大运会的人数为X,求X的分布列和数学期望.
附: χ2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.
[解] (1)零假设H0:大学生是否了解大运会与性别无关.
由题意,χ2=200×70×50-50×302120×80×100×100≈8.333>6.635.
依据小概率值α=0.01的独立性检验,推断H0不成立,即认为大学生是否了解大运会与性别有关.
(2)从该校大学生中随机抽取1人,其了解大运会的概率为120200=35,所以X~B3,35,
由题意知,X的可能取值为0,1,2,3,P(X=0)=C30×1-353=8125,P(X=1)=C31×35×1-352=36125,
P(X=2)=C32×352×1-35=54125,
P(X=3)=C33×353=27125,
所以X的分布列为
所以E(X )=0×8125+1×36125+2×54125+3×27125=95或EX=3×35=95.
课后习题(五十八) 成对数据的统计分析
1.(人教A版选择性必修第三册P103习题8.1T1改编)下列四个散点图中,变量x与y之间具有负的线性相关关系的是( )
A B
C D
D [观察散点图可知,只有D选项的散点图表示的是变量x与y之间具有负的线性相关关系.]
2.(人教B版选择性必修第二册P115练习B T2改编)某冷饮店日盈利y(单位:百元)与当天气温x(单位:℃)之间有如下数据:
已知y与x之间具有线性相关关系,则y与x的经验回归方程是( )
A.y=0.2x-2 B.y=0.2x-2.2
C.y=0.2x+2 D.y=0.2x+2.2
B [经验回归直线必过样本中心点,由题意得x=15+20+25+30+355=25,
y=1+2+2+4+55=2.8,结合选项可知,2.8=0.2×25-2.2,即y与x的经验回归方程是y=0.2x-2.2.故选B.]
3.(苏教版选择性必修第二册P187本章测试T6改编)动力电池作为新能源汽车的核心部件,在新能源整车成本中占比较高,而碳酸锂又是动力电池的核心原料.从2020年底开始,碳酸锂的价格一路水涨船高.如下表所示是2023年某企业前5个月碳酸锂的价格与月份的统计数据:
根据表中数据,得出y关于x的经验回归方程为y=0.28x+a,根据数据计算出在样本点(5,1.5)处的残差为-0.06,则m=________.
1.4 [由题意,样本点(5,1.5)处的残差为-0.06,则1.5-(0.28×5+a)=-0.06,解得a=0.16.
由题表数据可得,x=15×(1+2+3+4+5)=3,
y=15×(0.5+0.6+1+m+1.5)=3.6+m5,
则3.6+m5=0.28×3+0.16,解得m=1.4.]
4.(人教A版选择性必修第三册P133 例4改编)为了调查患肺癌是否与吸烟有关,调查了100名50岁以下的人,调查结果如下表:
根据列联表数据,求得χ2=________(保留3位有效数字),那么,在犯错误的概率不超过________的前提下,认为患肺癌与吸烟有关.
附:
χ2=nad-bc2a+bc+da+cb+d.
22.2 0.001 [由20+m=40,得m=20.
由20+n=25,得n=5.
故χ2=100×20×55-20×5240×60×25×75≈22.2>10.828=x0.001.
所以在犯错误的概率不超过0.001的前提下,认为患肺癌与吸烟有关.]
5.(多选)(2023·安徽黄山三模)下列命题中,正确的是( )
A.在回归分析中,可用决定系数R2的值判断模型的拟合效果,R2越大,模型的拟合效果越好
B.对分类变量x与y的统计量χ2来说,χ2值越小,判断“x与y有关系”的把握程度越大
C.在回归模型中,残差是观测值y与预测值y的差,残差点所在的带状区域宽度越窄,说明模型拟合精度越高
D.一组数据88,90,90,91,92,93,95,96,98的第75百分位数为95
ACD [对于A,由决定系数的定义知:R2越大,模型的拟合效果越好,A正确;
对于B,由独立性检验的思想知:χ2值越大,“x与y有关系”的把握程度越大,B错误;
对于C,残差点所在的带状区域宽度越窄,则残差平方和越小,模型拟合精度越高,C正确;
对于D,∵9×0.75=6.75,∴第75百分位数为第7个数据95, D正确.故选ACD.]
6.(多选)如图,5个数据(x,y),去掉点D(3,10)后,下列说法正确的是( )
A.样本相关系数r变大
B.残差平方和变大
C.变量x与变量y呈正相关
D.变量x与变量y的相关性变强
ACD [由散点图可知,去掉D(3,10)后,y与x的相关性变强,且为正相关,即样本相关系数r变大,故A、C、D正确;样本相关系数r变大,则误差变小,故B错误.]
7.(2024·四川成都模拟预测)某老师为了了解数学学习成绩得分y(单位:分)与每天数学学习时间x(单位:分钟)是否存在线性关系,搜集了100组数据(xi=5 600,yi=11 200),并据此求得y关于x的经验回归方程为y=bx+56.若一位同学每天数学学习时间约80分钟,则可估计这位同学数学成绩为( )
A.106 B.122 C.136 D.140
C [由题设可得x=5 600100=56,y=11 200100=112,故112=b×56+56,故b=1,故y=x+56,
故当x=80时,y=80+56=136,故选C.]
8.(2024·青岛模拟)通过随机询问某中学110名中学生是否爱好跳绳,得到如下列联表:
已知χ2=nad-bc2a+bc+da+cb+d,P(χ2≥10.828)=0.001,根据小概率值α=0.001的χ2独立性检验,以下结论正确的为( )
A.爱好跳绳与性别有关
B.爱好跳绳与性别有关,这个结论犯错误的概率不超过0.001
C.爱好跳绳与性别无关
D.爱好跳绳与性别无关,这个结论犯错误的概率不超过0.001
C [χ2=nad-bc2a+bc+da+cb+d=110×800260×50×60×50≈7.82213.394 7,
因为x∈N*且x0.75,则线性相关程度很高)
(2)从这5个地点中任抽2个地点,求抽到的这2个地点,甲型无人运输机指标数均高于乙型无人运输机指标数的概率.
附:相关公式及数据:
r=,0.9≈0.95.
[解] (1)x=2+4+5+6+85=5,
y=3+4+4+4+55=4,
所以(xi-x)(yi-y)=-3×(-1)+(-1)×0+0×0+1×0+3×1=6,
(xi-x)2=9+1+0+1+9=20,
(yi-y)2=1+0+0+0+1=2,
样本相关系数r==625×2=910≈0.95,
因为r>0.75,所以y与x具有较强的线性相关关系.
(2)将地点1,2,3,4,5分别记为A,B,C,D,E,任抽2个地点的可能情况有(A,B),(A,C),(A,D),(A,E),(B,C),(B,D),(B,E),(C,D),(C,E),(D,E),共10种情况,其中在地点3,4,5,甲型无人运输机指标数均高于乙型无人运输机指标数,即(C,D),(C,E),(D,E),共3种情况,故所求概率为310.
12.(2023·浙江统考一模)某大学生创客实践基地,甲、乙两个团队生产同种创新产品,现对其生产的产品进行质量检验.
(1)为测试其生产水准,从甲、乙生产的产品中各抽检15个样本,评估结果如图:现将“一、二、三等”视为产品质量合格,其余为产品质量不合格,请完善2×2列联表,依据小概率值α=0.05的独立性检验,能否认为“产品质量”与“生产团队”有关.
(2)将甲、乙生产的产品各自进行包装,每5个产品包装为一袋,现从中抽取一袋检测假定抽取的这袋产品来自甲生产的概率为35,来自乙生产的概率为25,检测结果显示这袋产品中恰有4件合格品,求该袋产品由甲团队生产的概率(以(1)中各自产品的合格频率代替各自产品的合格概率).
附:χ2=nad-bc2a+bc+da+cb+d,n=a+b+c+d.
[解] (1)完善列联表如下:
零假设H0:“产品质量”与“生产团队”无关.
χ2=30×108-18218×12×15×15=5>3.841,
依据小概率值α=0.05的独立性检验,认为“产品质量”与“生产团队”有关.
(2)记事件A代表“一袋中有4个合格品”,事件B代表“所抽取的这袋来自甲生产”,事件C代表“所抽取的这袋来自乙生产”,故P(B)=35,P(C)=25.
由P(A)=P(A|B)·P(B)+P(A|C)·P(C)=5×454×15 ×35+5×254×35 ×25=8643 125,
故P(B|A)=PABPA=PAB·PBPA=5×454×15 ×358643 125=89.
所以该袋产品由甲团队生产的概率为89.月份x
1
2
3
4
5
销量y/万辆
1.5
1.6
2
2.4
2.5
年份
2017
2018
2019
2020
2021
2022
2023
广告费支
出x/万元
1
2
4
6
11
13
19
销售量
y/万台
1.9
3.2
4.0
4.4
5.2
5.3
5.4
记忆力x
2
5
6
8
9
判断力y
7
8
10
12
18
X
Y
合计
Y=0
Y=1
X=0
a
b
a+b
X=1
c
d
c+d
合计
a+c
b+d
n=a+b+c+d
α
0.1
0.05
0.01
0.005
0.001
xα
2.706
3.841
6.635
7.879
10.828
性别
兴趣
合计
有兴趣
没兴趣
男
60
女
合计
α
0.10
0.05
0.025
0.010
xα
2.706
3.841
5.024
6.635
性别
兴趣
合计
有兴趣
没兴趣
男
55
5
60
女
30
10
40
合计
85
15
100
X
0
1
2
P
15
35
15
性别
对错
合计
完全答对
部分答对
男
女
合计
α
0.100
0.050
0.010
0.005
xα
2.706
3.841
6.635
7.879
性别
对错
合计
完全答对
部分答对
男
45
45
90
女
42
18
60
合计
87
63
150
X
0
1
2
P
120
720
35
情况
性别
合计
男生
女生
了解大运会
70
50
120
不了解大运会
30
50
80
合计
100
100
200
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
X
0
1
2
3
P
8125
36125
54125
27125
x/℃
15
20
25
30
35
y/百元
1
2
2
4
5
月份代码x
1
2
3
4
5
碳酸锂价格y(万元/kg)
0.5
0.6
1
m
1.5
吸烟
肺癌
合计
肺癌患者
非肺癌患者
吸烟者
20
m
40
不吸烟者
n
55
60
合计
25
75
100
α
0.050
0.010
0.001
xα
3.841
6.635
10.828
跳绳
性别
合计
男
女
爱好
40
20
60
不爱好
20
30
50
合计
60
50
110
x
4
6
8
10
z
2
c
5
6
性别
满意程度
对工作满意
对工作不满意
男
5x
5x
女
4x
6x
α
0.10
0.05
0.025
0.010
0.005
0.001
xα
2.706
3.841
5.024
6.635
7.879
10.828
地点1
地点2
地点3
地点4
地点5
甲型无人运输
机指标数x
2
4
5
6
8
乙型无人运输
机指标数y
3
4
4
4
5
质量
团队
合计
甲
乙
合格
不合格
合计
15
15
30
α
0.15
0.10
0.05
0.025
0.01
0.001
xα
2.072
2.706
3.841
5.024
6.635
10.828
质量
团队
合计
甲
乙
合格
12
6
18
不合格
3
9
12
合计
15
15
30
相关学案
这是一份高三数学一轮复习第十章统计与成对数据的统计分析第二课时用样本估计总体学案,共19页。
这是一份2025版高考数学全程一轮复习学案第九章统计与成对数据的统计分析第三节成对数据的统计分析,共6页。学案主要包含了常用结论等内容,欢迎下载使用。
这是一份高考数学复习第十章 第三节 成对数据的统计分析(导学案),共23页。