所属成套资源:2024年高考数学复习二轮讲义(考前回顾+思想方法+六专题)
专题五 第3讲 统计与成对数据的分析--2024年高考数学复习二轮讲义
展开
这是一份专题五 第3讲 统计与成对数据的分析--2024年高考数学复习二轮讲义,共7页。
考点一 统计图表、数字特征
核心提炼
1.频率分布直方图中相邻两横坐标之差表示组距,纵坐标表示eq \f(频率,组距),频率=组距×eq \f(频率,组距).
2.在频率分布直方图中各小长方形的面积之和为1.
3.利用频率分布直方图求众数、中位数与平均数.
(1)最高的小长方形底边中点的横坐标即众数.
(2)中位数左边和右边的小长方形的面积和相等.
(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.
例1 (1)(多选)(2023·海南模拟)为了向社会输送优秀毕业生,中等职业学校越来越重视学生的实际操作(简称实操)能力的培养.中职生小王在对口工厂完成实操产品100件,质检人员测量其质量(单位:克),将所得数据分成5组:[95,97),[97,99),[99,101),[101,103),[103,105].根据所得数据制成如图所示的频率分布直方图,其中质量在[99,101)内的为优等品.对于这100件产品,下列说法正确的是( )
A.质量的平均数为99.7克(同一区间的平均数用区间中点值代替)
B.优等品有45件
C.质量的众数在区间[98,100)内
D.质量的中位数在区间[99,101)内
(2)(多选)(2023·新高考全国Ⅰ)有一组样本数据x1,x2,…,x6,其中x1是最小值,x6是最大值,则( )
A.x2,x3,x4,x5的平均数等于x1,x2,…,x6的平均数
B.x2,x3,x4,x5的中位数等于x1,x2,…,x6的中位数
C.x2,x3,x4,x5的标准差不小于x1,x2,…,x6的标准差
D.x2,x3,x4,x5的极差不大于x1,x2,…,x6的极差
易错提醒 (1)对于给出的统计图表,一定要结合问题背景理解图表意义.
(2)频率分布直方图中纵坐标不要误以为是频率.
跟踪演练1 (1)(多选)(2023·盐城模拟)随机抽取6位影迷对某电影的评分,得到一组样本数据如下:92,93,95,95,97,98,则下列关于该样本的说法中正确的有( )
A.平均数为95 B.极差为6
C.方差为26 D.第80百分位数为97
(2)(2023·葫芦岛模拟)游戏对青少年的影响巨大.某市青少年健康管理委员会对该市下学年度青少年上网打游戏的情况进行统计,作出如图所示的人数变化走势图.
根据该走势图,下列结论正确的是( )
A.这半年中,青少年上网打游戏的人数呈周期性变化
B.这半年中,青少年上网打游戏的人数不断减少
C.从青少年上网打游戏的人数来看,10月份的方差小于11月份的方差
D.从青少年上网打游戏的人数来看,12月份的平均数大于1月份的平均数
考点二 回归分析
核心提炼
求经验回归方程的步骤
(1)依据成对样本数据画出散点图,确定两个变量具有线性相关关系(有时可省略).
(2)计算出eq \x\t(x),eq \x\t(y),eq \(a,\s\up6(^)),eq \(b,\s\up6(^)).
(3)写出经验回归方程.
例2 (2023·唐山模拟)据统计,某城市居民年收入(所有居民在一年内收入的总和,单位:亿元)与某类商品销售额(单位:亿元)的10年数据如下表所示:
依据表格数据,得到下面一些统计量的值.
(1)根据表中数据,得到样本相关系数r≈0.95.以此推断,y与x的线性相关程度是否很强?
(2)根据统计量的值与样本相关系数r≈0.95,建立y关于x的经验回归方程(系数精确到0.01);
(3)根据(2)的经验回归方程,计算第1个样本点(32.2,25.0)对应的残差(精确到0.01);并判断若剔除这个样本点再进行回归分析,eq \(b,\s\up6(^))的值将变大还是变小?(不必说明理由,直接判断即可).
附:样本相关系数r=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,n, )xi-\x\t(x)2)\r(\i\su(i=1,n, )yi-\x\t(y)2)),eq \r(2.304)≈1.518,
eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x).
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
易错提醒 (1)样本点不一定在经验回归直线上,但点(eq \x\t(x),eq \x\t(y))一定在经验回归直线上.
(2)求eq \(b,\s\up6(^))时,灵活选择公式,注意公式的推导和记忆.
(3)利用样本相关系数判断相关性强弱时,看|r|的大小,而不是r的大小.
(4)区分样本相关系数r与决定系数R2.
(5)通过经验回归方程求的都是估计值,而不是真实值.
跟踪演练2 (2023·雅安模拟)2023年5月17日,318·川藏线零公里自驾游大本营旅游推介暨“5·17我要骑”雅安站活动在雨城区拉开帷幕,318·川藏线零公里自驾游大本营再次成为关注焦点.318·川藏线零公里自驾游大本营项目以“此生必驾318,首站打卡在雅安”,“世界第三极,雅安零公里”的交旅IP为文化指引,利用雅安交通区位和品牌资源优势,创新打造吸引力体验项目,提高雅安川藏游的话语权和影响力.近段时间某骑行爱好者在专业人士指导下对骑行情况进行了统计,各次骑行期间的身体综合指标评分x与对应用时y(单位:小时)如表:
(1)由上表数据看出,可用线性回归模型拟合y与x的关系,请用样本相关系数加以说明;
(2)建立y关于x的经验回归方程.
参考数据和参考公式:样本相关系数r=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\r(\i\su(i=1,n, )xi-\x\t(x)2\i\su(i=1,n, )yi-\x\t(y)2)),eq \(b,\s\up6(^))=eq \f(\i\su(i=1,n, )xi-\x\t(x)yi-\x\t(y),\i\su(i=1,n, )xi-\x\t(x)2),
eq \(a,\s\up6(^))=eq \x\t(y)-eq \(b,\s\up6(^))eq \x\t(x),eq \r(7 060)≈84.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
考点三 独立性检验
核心提炼
独立性检验的一般步骤
(1)根据样本数据列2×2列联表.
(2)根据公式χ2=eq \f(nad-bc2,a+bc+da+cb+d),计算χ2的值.
(3)查表比较χ2与临界值的大小关系,作统计判断.χ2越大,对应假设事件H0成立(两类变量相互独立)的概率越小,H0不成立的概率越大.
例3 我国综合性太阳探测专用卫星“夸父一号”是中国科学院空间科学二期先导专项研制的一颗空间科学卫星,卫星以“一磁两暴”为科学目标,即同时观测太阳磁场和太阳.上两类最剧烈的爆发现象——耀斑和日冕物质抛射.某学校为了解该校某兴趣小组对“夸父一号”探测卫星相关知识是否感兴趣,对该兴趣小组的100位学生进行了问卷调查,已知被调查学生中男生占调查人数的55%,其中感兴趣的有45人,余下的不感兴趣,在被调查的女生中,感兴趣的有20人,其余人不感兴趣.
(1)请补充完整2×2列联表,并依据小概率值α=0.005的独立性检验,能否认为对“夸父一号”探测卫星相关知识感兴趣与学生的性别有关联?
(2)从兴趣小组100人中任选1人,A表示事件“选到的人是男生”,B表示事件“选到的人对‘夸父一号’探测卫星相关知识不感兴趣”,求P(B|A);
(3)按随机抽样的方法从感兴趣的学生中抽取4名男生和3名女生,组成一个容量为7的样本,再从抽取的7人中随机抽取3人,随机变量X表示3人中女生的人数,求X的分布列和均值.
附:参考公式:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
临界值表:
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
易错提醒 (1)χ2越大两分类变量无关的可能性越小,推断犯错误的概率越小,通过表格查得无关的可能性.
(2)在犯错误的概率不大于0.01的前提下认为两个变量有关,并不是指两个变量无关的可能性为0.01.
跟踪演练3 (2023·湖南四大名校联考)某学校有A,B两家餐厅,王同学第1天午餐时随机选择一家餐厅用餐.如果第1天去A餐厅,那么第2天去A餐厅的概率为0.6;如果第1天去B餐厅,那么第2天去A餐厅的概率为0.8.
(1)①求王同学第2天去A餐厅用餐的概率;
②如果王同学第2天去A餐厅用餐,求他第1天在A餐厅用餐的概率;
(2)A餐厅对就餐环境、菜品种类与品质等方面进行了改造与提升,改造提升后,A餐厅对就餐满意程度进行了调查,统计了100名学生的数据,如表(单位:人).
依据小概率值α=0.005的独立性检验,能否认为学生对于A餐厅的满意程度与餐厅的改造提升有关联?
附:χ2=eq \f(nad-bc2,a+bc+da+cb+d),其中n=a+b+c+d.
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________
________________________________________________________________________第n年
1
2
3
4
5
6
7
8
9
10
居民年收入x
32.2
31.1
32.9
35.7
37.1
38.0
39.0
43.0
44.6
46.0
商品销售额y
25.0
30.0
34.0
37.0
39.0
41.0
42.0
44.0
48.0
51.0
eq \i\su(i=1,10,x)i
eq \i\su(i=1,10,y)i
eq \i\su(i=1,10, )(xi-eq \x\t(x))2
eq \i\su(i=1,10, )(yi-eq \x\t(y))2
eq \i\su(i=1,10, )(xi-eq \x\t(x))·
(yi-eq \x\t(y))379.6
391
246.904
568.9
m
身体综合指标评分(x)
1
2
3
4
5
用时(y/小时)
9.5
8.6
7.8
7
6.1
感兴趣
不感兴趣
合计
男生
女生
合计
α
0.15
0.10
0.05
0.01
0.005
xα
2.072
2.706
3.841
6.635
7.879
就餐满意程度
A餐厅改造提升情况
合计
改造提升前
改造提升后
满意
28
57
85
不满意
12
3
15
合计
40
60
100
α
0.1
0.05
0.01
0.005
xα
2.706
3.841
6.635
7.879
相关试卷
这是一份新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点3经验回归方程教师用书,共3页。试卷主要包含了相关系数,经验回归方程等内容,欢迎下载使用。
这是一份新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点4独立性检验教师用书,共3页。
这是一份新教材适用2024版高考数学二轮总复习第1篇专题6概率与统计第3讲统计与成对数据的分析核心考点2用样本估计总体教师用书,共7页。试卷主要包含了频率分布直方图的相关结论,中位数、众数、平均数、百分位数,样本的数字特征,465,故选D等内容,欢迎下载使用。