微专题18 统计与成对数据的统计分析
展开【真题体验】
1.(多选)(2023·新高考Ⅰ卷)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
2.(2022·全国乙卷)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:m2)和材积量(单位:m3),得到如下数据:
并计算得eq \(∑,\s\up14(10),\s\d10(i=1))xeq \\al(2,i)=0.038,eq \(∑,\s\up6(10),\s\d4(i=1))yeq \\al(2,i)=1.615 8,
eq \(∑,\s\up14(10),\s\d10(i=1))xiyi=0.247 4.
(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;
(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);
(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为186 m2.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.
附:相关系数r=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)),eq \r(1.896)≈1.377.
3.(2023·全国甲卷)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).
(1)设X表示指定的两只小白鼠中分配到对照组的只数,求X的分布列和数学期望;
(2)试验结果如下:
对照组的小白鼠体重的增加量从小到大排序为
15.2 18.8 20.2 21.3 22.5 23.2 25.8
26.5 27.5 30.1 32.6 34.3 34.8 35.6
35.6 35.8 36.2 37.3 40.5 43.2
试验组的小白鼠体重的增加量从小到大排序为
7.8 9.2 11.4 12.4 13.2 15.5 16.5
18.0 18.8 19.2 19.8 20.2 21.6 22.8
23.6 23.9 25.1 28.2 32.3 36.5
①求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表:
②根据①中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?
附:χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
【热点突破】
热点一 用样本估计总体
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示eq \f(频率,组距),频率=组距×eq \f(频率,组距).
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
考向1 统计图表与数字特征的应用
例1 (1)(多选)2020年7月,国家统计局发布了我国上半年国内经济数据,图1为国内三大产业比重,图2为第三产业中各行业比重.
以下关于我国2020年上半年经济数据的说法正确的是( )
A.第一产业的生产总值不超过第三产业中“房地产业”的生产总值
B.第一产业的生产总值与第三产业中“租赁和商务服务业”的生产总值基本
持平
C.若“住宿和餐饮业”的生产总值为7 500亿元,则“金融业”的生产总值为
32 500亿元
D.若“金融业”的生产总值为45 600亿元,则第二产业的生产总值为185 000
亿元
(2)(2023·福州质检)中国营养学会把走路称为“最简单、最优良的锻炼方式”,它不仅可以帮助减肥,还可以增强心肺功能、血管弹性、肌肉力量等.下图为甲、乙两人在同一星期内日步数的折线统计图:
则下列结论中不正确的是( )
A.这一星期内甲的日步数的中位数为11 600
B.乙星期四的日步数比星期三增加了一倍以上
C.这一星期内甲的日步数的平均值大于乙
D.这一星期内甲的日步数的方差大于乙
考向2 用样本的频率分布估计总体分布
例2 为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
规律方法 1.平均数与方差都是重要的数字特征,是对数据的一种简明描述,它们所反映的情况有着重要的实际意义.
2.在例2中,抓住频率分布直方图各小长方形的面积之和为1,这是求解的关键;本题易混淆频率分布条形图和频率分布直方图,误把频率分布直方图纵轴的几何意义当成频率,导致样本数据的频率求错.
训练1 (1)(多选)(2023·济宁调研)某市为了更好地支持小微企业的发展,对全市小微企业的年税收进行适当的减免,为了解该地小微企业年收入的变化情况,对该地小微企业减免前和减免后的年收入进行了抽样调查,将调查数据整理,得到如下所示的频率分布直方图,则下列结论正确的是( )
A.推行减免政策后,该市小微企业的年收入都有了明显的提高
B.推行减免政策后,该市小微企业的平均年收入有了明显的提高
C.推行减免政策后,该市小微企业的年收入更加均衡
D.推行减免政策后,该市小微企业的年收入没有变化
(2)某工厂A,B两条生产线生产同款产品,若产品按照一、二、三等级分类,则每件可分别获利10元、8元、6元,现从A,B生产线生产的产品中各随机抽取100件进行检测,结果统计如图:
①分别计算两条生产线抽样产品获利的方差,以此作为判断依据,说明哪条生产线的获利更稳定;
②估计该厂产品产量为2 000件时的利润以及一等级产品的利润.
热点二 回归分析
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出eq \(x,\s\up6(-)),eq \(y,\s\up6(-)),eq \(∑,\s\up14(n),\s\d10(i=1))xeq \\al(2,i),eq \(∑,\s\up14(n),\s\d10(i=1))xiyi的值.
(3)计算eq \(a,\s\up6(^)),eq \(b,\s\up6(^)).
(4)写出经验回归方程.
例3 (2023·沈阳模拟)2022年12月份以来,全国多个地区纷纷采取不同的形式发放多轮消费券,助力消费复苏,记发放的消费券额度为x(百万元),带动的消费为y(百万元).某省随机抽查的一些城市的数据如下表所示.
(1)根据表中的数据,请用相关系数说明y与x有很强的线性相关关系,并求出y关于x的经验回归方程.
(2)①若该省A城市在2023年2月份准备发放一轮额度为10百万元的消费券,利用(1)中求得的经验回归方程,预计可以带动多少消费?
②当实际值与估计值的差的绝对值与估计值的比值不超过10%时,认为发放的该轮消费券助力消费复苏是理想的,若该省A城市2月份发放额度为10百万元的消费券后,经过一个月的统计,发现实际带动的消费为30百万元,请问发放的该轮消费券助力消费复苏是否理想?若不理想,请分析可能存在的原因.
参考公式:r=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\r(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2\(∑,\s\up6(n),\s\d4(i=1)) (yi-\(y,\s\up6(-)))2)),
eq \(b,\s\up6(^))=eq \f(\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))(yi-\(y,\s\up6(-))),\(∑,\s\up6(n),\s\d4(i=1)) (xi-\(x,\s\up6(-)))2),eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)).
当|r|>0.75时,两个变量之间具有很强的线性相关关系.
参考数据:eq \r(35)≈5.9.
易错提醒 1.样本点不一定在经验回归直线上,但点(eq \(x,\s\up6(-)),eq \(y,\s\up6(-)))一定在经验回归直线上.
2.求eq \(b,\s\up6(^))时,灵活选择公式,注意公式的推导和记忆.
3.利用样本相关系数判断相关性强弱,看|r|的大小,而不是r的大小.
4.通过经验回归方程求的都是估计值,而不是真实值.
训练2 (2023·淄博模拟)某电商平台统计了近七年小家电的年度广告费支出xi(万元)与年度销售量yi(万台)的数据,如表所示 :
其中eq \(∑,\s\up14 (7),\s\d10(i=1))xiyi=279.4,eq \(∑,\s\up14(7),\s\d10(i=1))xeq \\al(2,i)=708.
(1)若用回归模型拟合y与x的关系,求出y关于x的经验回归方程;
(2)若用y=c+deq \r(x)模型拟合得到的回归方程为eq \(y,\s\up6(^))=1.63+0.99eq \r(x),经计算回归模型及该模型的R2分别为0.75和0.88,请根据R2的数值选择更好的回归模型拟合y与x的关系,进而计算出年度广告费x为何值时,利润eq \(z,\s\up6(^))=200y-x的预报值最大?
参考公式:
eq \(b,\s\up6(^))=eq \f(\(∑,\s\up14(n),\s\d10(i=1))xiyi-n\(x,\s\up14(-)) \(y,\s\up10(-)),\(∑,\s\up14(n),\s\d10(i=1))xeq \\al(2,i)-n\(x,\s\up14(-))2)=eq \f(\(∑,\s\up14(n),\s\d10(i=1)) (xi-\(x,\s\up14(-)))(yi-\(y,\s\up10(-))),\(∑,\s\up14(n),\s\d10(i=1)) (xi-\(x,\s\up1(-)))2),
eq \(a,\s\up6(^))=eq \(y,\s\up6(-))-eq \(b,\s\up6(^))eq \(x,\s\up6(-)).
热点三 独立性检验
独立性检验的一般步骤
(1)根据样本数据列2×2列联表;
(2)根据公式
χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),计算χ2的值;
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
例4 某市工信部门为了解本市5G手机用户对5G网络的满意情况,随机抽取了本市200名5G手机用户进行了调查,所得情况统计如下:
(1)完成上述列联表,并估计本市5G手机用户对5G网络满意的概率;
(2)依据小概率值α=0.05的独立性检验,分析本市5G手机用户对5G网络满意与年龄在50岁以下是否有关.
附:
χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),其中n=a+b+c+d.
易错提醒 1.χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.
2.在犯错误的概率不超过0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
训练3 (2023·镇江调研)某芯片制造企业使用新技术对某款芯片进行生产.生产该款芯片有三道工序,这三道工序互不影响.已知批次甲的三道工序次品率分别为eq \f(1,50),eq \f(1,49),eq \f(1,48).
(1)求批次甲芯片的次品率;
(2)该企业改进生产工艺后,生产了批次乙的芯片.某手机厂商获得批次甲与批次乙的芯片,并在某款手机上使用.现对使用这款手机的100名用户回访,对开机速度进行调查.据统计,使用安装批次甲芯片手机的用户有40名.其中对开机速度满意的有30名;使用安装批次乙芯片手机的用户有60名,其中对开机速度满意的有55名.试整理出2×2列联表(单位:名),并依据小概率值α=0.05的独立性检验,分析芯片批次是否与用户对开机速度满意有关.
附: χ2=eq \f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)),
n=a+b+c+d.
样本号i
1
2
3
4
5
6
7
8
9
10
总和
根部横截面积xi
0.04
0.06
0.04
0.08
0.08
0.05
0.05
0.07
0.07
0.06
0.6
材积量yi
0.25
0.40
0.22
0.54
0.51
0.34
0.36
0.46
0.42
0.40
3.9
对照组
试验组
α
0.100
0.050
0.010
xα
2.706
3.841
6.635
x
3
3
4
5
5
6
6
8
y
10
12
13
18
19
21
24
27
年份
2016
2017
2018
2019
2020
2021
2022
广告费支出x
1
2
4
6
11
13
19
销售量y
1.9
3.2
4.0
4.4
5.2
5.3
5.4
满意情况
年龄
合计
50岁以下
50岁或50岁以上
满意
95
不满意
25
合计
120
200
α
0.10
0.05
0.025
0.010
0.001
xα
2.706
3.841
5.024
6.635
10.828
批次
是否满意
合计
满意
不满意
甲
乙
合计
α
0.05
0.01
0.005
0.001
xα
3.841
6.635
7.879
10.828
微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题: 这是一份微专题44 统计与成对数据的统计分析-2024高考数学二轮复习微专题,共34页。试卷主要包含了5%,所以A错误;,9,10)=0,635,,5万元的农户比率估计为6%,2,,484>6,9-7等内容,欢迎下载使用。
微专题18 统计与成对数据的统计分析: 这是一份微专题18 统计与成对数据的统计分析,共10页。试卷主要包含了基本技能练,创新拓展练等内容,欢迎下载使用。
专题18 成对数据的统计分析(公式、定理、结论图表)-备战2024年新高考数学必背知识手册: 这是一份专题18 成对数据的统计分析(公式、定理、结论图表)-备战2024年新高考数学必背知识手册,共7页。试卷主要包含了成对数据的统计相关性,一元线性回归模型及其应用,列联表与独立性检验等内容,欢迎下载使用。