新高考数学一轮复习 第10章 统计与成对数据的统计分析(综合检测)(2份打包,原卷版+含解析)
展开
这是一份新高考数学一轮复习 第10章 统计与成对数据的统计分析(综合检测)(2份打包,原卷版+含解析),文件包含新高考数学一轮复习第10章统计与成对数据的统计分析综合检测原卷版doc、新高考数学一轮复习第10章统计与成对数据的统计分析综合检测含解析doc等2份试卷配套教学资源,其中试卷共32页, 欢迎下载使用。
注意事项:
1.答卷前,考生务必将自己的姓名、准考证号等填写在答题卡和试卷指定位置上。
2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。如
需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上。写
在本试卷上无效。
3.考试结束后,将本试卷和答题卡一并交回。
第Ⅰ卷
一、单项选择题:本题共8小题,每小题5分,共40分.在每小题给出的四个选项中,只有一项是符合题目要求.
1.某班共有45名学生,其中女生25名,为了解学生的身体状况,现采用分层抽样的方法进行调查,若样本中有5名女生.则样本中男生人数为( )
A.4B.5C.6D.9
【答案】A
【详解】设样本中男生人数为x,由题意可得 SKIPIF 1 < 0 ,解得 SKIPIF 1 < 0 故选:A
2.2020年,面对新冠肺炎疫情的严重冲击,在以习近平同志为核心的党中央坚强领导下,我国能源领域深入贯彻“四个革命、一个合作”能源安全新战略,全面落实中央“六保”工作部署,战疫情促生产、增供应保安全,能源生产稳中有增,进口较快增长,能源供应能力和水平不断巩固提升,为统筹推进疫情防控和经济社会发展提供了有力保障.下图是2020年1~12月分品种能源生产当月同比增长率情况变化图.下列说法错误的是( )
A.4~7月,原煤及天然气当月同比增长率呈下降趋势
B.9~12月,原煤及天然气当月同比增长率总体呈上升趋势
C.7月份品种能源生产当月同比增长率最高的是原油加工量同比增长率
D.2020年分品种能源生产当月同比增长率波动最小的是发电量同比增长率
【答案】D
【分析】观察题中所给的图,对选项逐个分析,得到结果.
【详解】观察题中所给的折线图,可知:
4~7月,原煤及天然气当月同比增长率是下降的,呈下降趋势,所以A项正确;
9~12月,虽然天然气11月比10月偏低,但总体趋势仍为上升的,所以原煤及天然气当月同比增长率总体呈上升趋势,所以B正确;
图中7月份,只有原煤加工上升,其他品种能源均比6月份低,所以C项正确;
由图易知,相比发电量,原油的曲线波动幅度更小,所以D项错误;
故选:D.
【点睛】关键点点睛:该题考查的是有关根据折线图,对相应量进行分析的问题,在解题的过程中,注意正确理解折线图的意义是解题的关键.
3.按从小到大顺序排列的两组数据:甲组:27,31,37,m,42,49;乙组:24,n,33,44,48,52,若这两组数据的第30百分位数、第50百分位数都分别对应相等,则 SKIPIF 1 < 0 ( )
A.60B.65C.70D.71
【答案】D
【分析】利用百分位数的定义即可得解.
【详解】因为甲组:27,31,37,m,42,49;乙组:24,n,33,44,48,52,
由 SKIPIF 1 < 0 ,得第30百分位数是第2个数据,故 SKIPIF 1 < 0 ,
由 SKIPIF 1 < 0 ,得第50百分位数是第3与4个数据平均值 SKIPIF 1 < 0 ,解得 SKIPIF 1 < 0 .
所以 SKIPIF 1 < 0 .
故选:D.
4.相关变量的样本数据如下表,
经回归分析可得y与x线性相关,并由最小二乘法求得回归直线方程为 SKIPIF 1 < 0 ,下列说法正确的是( )
A.x增加1时,y一定增加2.3B.变量x与y负相关
C.当y为6.3时,x一定是8D.a=5.2
【答案】D
【分析】根据回归直线方程的几何意义判断A、B错误;令 SKIPIF 1 < 0 求解判断C,计算 SKIPIF 1 < 0 并代入回归直线方程中,求得a的值,判断D正确.
【详解】根据回归直线方程 SKIPIF 1 < 0 知,x增加1时,估计y增加 SKIPIF 1 < 0 ,故A错误;
由 SKIPIF 1 < 0 知, SKIPIF 1 < 0 ,故变量x与y正相关,故B错误;
SKIPIF 1 < 0 时, SKIPIF 1 < 0 ,解得 SKIPIF 1 < 0 ,估计 SKIPIF 1 < 0 的值应为8,故C错误;
又 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,
代入回归直线方程中,则 SKIPIF 1 < 0 ,解得 SKIPIF 1 < 0 ,故D正确.
故选:D
5.已知甲乙两名同学本学期5次数学测试成绩如下表,
则根据表中数据下列说法正确的是( )
A.甲比乙平均成绩高B.甲成绩的极差比乙成绩的极差大
C.甲比乙成绩的中位数大D.甲比乙成绩更稳定
【答案】B
【分析】由表格数据计算平均数、极差、中位数、方差,比较大小即可得答案.
【详解】甲平均成绩 SKIPIF 1 < 0 ,乙平均成绩 SKIPIF 1 < 0 ,故A错误;
甲的极差为 SKIPIF 1 < 0 ,乙的极差为 SKIPIF 1 < 0 ,B正确;
甲的中位数为 SKIPIF 1 < 0 ,乙的中位数为 SKIPIF 1 < 0 ,C错误;
甲的方差为 SKIPIF 1 < 0 ,乙的方差为 SKIPIF 1 < 0 ,故乙成绩比甲稳定,D错误.
故选:B
6.杂交水稻之父袁隆平,推进粮食安全,消除贫困,造福民生做出杰出贡献,他在杂交水稻育种的某试验中,第1个周期到第5个周期育种频数如下
由表格可得 SKIPIF 1 < 0 关于 SKIPIF 1 < 0 的二次回归方程为 SKIPIF 1 < 0 ,则此回归模型第2周期的残差(实际值与预报值之差)为( )
A.0B.1C.4D.5
【答案】B
【分析】令 SKIPIF 1 < 0 则回归方程为 SKIPIF 1 < 0 ,符合线性回归,计算中心点代入方程求得 SKIPIF 1 < 0 ,继而得到回归方程,算出预估值,即可求出残差.
【详解】令 SKIPIF 1 < 0 则回归方程为 SKIPIF 1 < 0 ,符合线性回归,
周期数的平均数 SKIPIF 1 < 0 ,
频数的平均数 SKIPIF 1 < 0 ,
则中心点为 SKIPIF 1 < 0 ,代入 SKIPIF 1 < 0 ,
可得 SKIPIF 1 < 0 ,则 SKIPIF 1 < 0 ,
所以 SKIPIF 1 < 0 ,
当 SKIPIF 1 < 0 时 SKIPIF 1 < 0 的预估值为 SKIPIF 1 < 0 ,
则第2周期的残差为 SKIPIF 1 < 0 ,
故选:B.
7.为了加深师生对党史的了解,激发广大师生知史爱党、知史爱国的热情,某校举办了“学党史、育文化”暨“喜迎党的二十大”党史知识竞赛,并将1000名师生的竞赛成绩(满分100分,成绩取整数)整理成如图所示的频率分布直方图,则下列说法错误的为( )
A.a的值为0.005
B.估计这组数据的众数为75
C.估计这组数据的第85百分位数为86
D.估计成绩低于60分的有25人
【答案】D
【分析】对A:根据频率之和为1,结合图表数据,计算即可;
对B:找出面积最大的小长方形对应的区间,求得众数即可;
对C:根据百分位数定义,结合数据求解即可;
对D:求得成绩低于60分的频率,结合总人数计算即可.
【详解】对A: SKIPIF 1 < 0 ,
即 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,故A正确;
对B:由面积最大的小长方形可知,估计这组数据的众数为75,故B正确;
对C:前4组频率之和为 SKIPIF 1 < 0 ,
前5组频率之和为 SKIPIF 1 < 0 ,
设这组数据的第85百分位数为 SKIPIF 1 < 0 ,
则 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,故C正确;
对D:成绩低于60分的频率为 SKIPIF 1 < 0 ,
故估计成绩低于60分的有 SKIPIF 1 < 0 人,D错误.
故选:D
8.为了学习、宣传和践行党的二十大精神,某班组织全班学生开展了以“学党史、知国情、圆梦想”为主题的党史暨时政知识竞赛活动.已知该班男生 SKIPIF 1 < 0 人,女生 SKIPIF 1 < 0 人,根据统计分析,男生组成绩和女生组成绩的方差分别为 SKIPIF 1 < 0 .记该班成绩的方差为 SKIPIF 1 < 0 ,则下列判断正确的是( )
A. SKIPIF 1 < 0 B. SKIPIF 1 < 0 C. SKIPIF 1 < 0 D. SKIPIF 1 < 0
【答案】D
【分析】由方差公式推出 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,可得 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,再用推导公式求班级的方差即可.
【详解】记男生组成绩和女生组成绩的平均分分别为 SKIPIF 1 < 0 ,则
SKIPIF 1 < 0 ,
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0 ,
同理 SKIPIF 1 < 0 ,
SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 ,
SKIPIF 1 < 0
SKIPIF 1 < 0 ,
故选:D.
二、多项选择题:本题共4小题,每小题5分,共20分.在每小题给出的选项中,有多项符合题目要求.全部选对的得5分,部分选对的得2分,有选错的得0分.
9.某商店的某款商品近5个月的月销售量 SKIPIF 1 < 0 (单位:千瓶)如下表:
若变量 SKIPIF 1 < 0 和 SKIPIF 1 < 0 之间具有线性相关关系,用最小二乘法建立的经验回归方程为 SKIPIF 1 < 0 ,则下列说法正确的是( )
A.点 SKIPIF 1 < 0 一定在经验回归直线 SKIPIF 1 < 0 上
B. SKIPIF 1 < 0
C.相关系数 SKIPIF 1 < 0
D.预计该款商品第6个月的销售量为7800瓶
【答案】AB
【分析】对于A,根据表中的数据可求出样本中心点进行判断,对于B,将样本中心点代入回归方程可求出 SKIPIF 1 < 0 判断,对于C,由 SKIPIF 1 < 0 进行判断,对于D,将 SKIPIF 1 < 0 代入回归方程求解判断.
【详解】对于A, SKIPIF 1 < 0 ,
所以样本点中心 SKIPIF 1 < 0 一定在经验回归直线 SKIPIF 1 < 0 上,所以A正确,
对于B,因为样本点中心 SKIPIF 1 < 0 一定在经验回归直线 SKIPIF 1 < 0 上,所以 SKIPIF 1 < 0 ,解得 SKIPIF 1 < 0 ,所以B正确,
对于C,因为 SKIPIF 1 < 0 ,所以变量 SKIPIF 1 < 0 与 SKIPIF 1 < 0 成正相关,所以相关系数 SKIPIF 1 < 0 ,所以C错误,
对于D,当 SKIPIF 1 < 0 时, SKIPIF 1 < 0 ,预计该款商品第6个月的销售量为6280瓶,所以D错误,
故选:AB
10.一组数据 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,…, SKIPIF 1 < 0 的平均数为6,方差为1,则关于新数据 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,…, SKIPIF 1 < 0 ,下列说法正确的是( )
A.这组新数据的平均数为6B.这组新数据的平均数为9
C.这组新数据的方差为1D.这组新数据的方差为4
【答案】BD
【分析】用平均数和方差求解公式进行求解.
【详解】由题意得: SKIPIF 1 < 0 , SKIPIF 1 < 0 ,则 SKIPIF 1 < 0 , SKIPIF 1 < 0 所以这组新数据的平均数为9,方差为4.
故选:BD
11.某保险公司为客户定制了5个险种:甲,一年期短险;乙,两全保险;丙,理财类保险;丁,定期寿险:戊,重大疾病保险,各种保险按相关约定进行参保与理赔.该保险公司对5个险种参保客户进行抽样调查,得出如下的统计图例:
用该样本估计总体,以下四个选项正确的是( )
A.54周岁以上参保人数最少
B.18~29周岁人群参保总费用最少
C.丁险种更受参保人青睐
D.30周岁以上的人群约占参保人群20%
【答案】AC
【分析】A选项,根据扇形统计图可得A正确;B选项,从扇形统计图和折线统计图计算出54周岁以上人群参保总费用比18~29周岁人群参保总费用低,B错误;C选项,从条形统计图可得C正确;D选项,从扇形统计图可得到D错误.
【详解】设抽查的5个险种参保客户的总人数为 SKIPIF 1 < 0 ,
A选项,从扇形图可得到54周岁以上参保人数占比为 SKIPIF 1 < 0 ,人数最少,A正确;
B选项,18~29周岁人群人均参保费用高于3500元,故参保总费用高于 SKIPIF 1 < 0 ,
54周岁以上人群人均参保费用为6000元,故参保总费用为 SKIPIF 1 < 0 ,
由于 SKIPIF 1 < 0 ,故18~29周岁人群参保总费用不是最少的,B错误;
C选项,从条形统计图可看出丁险种所占比例为 SKIPIF 1 < 0 ,比其他险种均高,故更受参保人青睐,C正确;
D选项,30周岁以上的人群约占参保人群为 SKIPIF 1 < 0 ,D错误.
故选:AC
12.已知互不相同的20个样本数据,若去掉其中最大和最小的数据,设剩下的18个样本数据的方差为 SKIPIF 1 < 0 ,平均数 SKIPIF 1 < 0 :去掉的两个数据的方差为 SKIPIF 1 < 0 ,平均数 SKIPIF 1 < 0 ;原样本数据的方差为 SKIPIF 1 < 0 ,平均数 SKIPIF 1 < 0 ,若 SKIPIF 1 < 0 ,则( )
A.剩下的18个样本数据与原样本数据的中位数不变
B. SKIPIF 1 < 0
C.剩下18个数据的 SKIPIF 1 < 0 分位数大于原样本数据的 SKIPIF 1 < 0 分位数
D. SKIPIF 1 < 0
【答案】ABD
【分析】设20个样本数据从小到大排列分别为 SKIPIF 1 < 0 ,再根据中位数、平均数、第22百分位数与方差的定义与公式推导即可.
【详解】设20个样本数据从小到大排列分别为 SKIPIF 1 < 0 ,则剩下的18个样本数据为 SKIPIF 1 < 0 ,
对于A:原样本数据的中位数为 SKIPIF 1 < 0 ,剩下的18个样本数据的中位数为 SKIPIF 1 < 0 ,A正确;
对于B,依题意, SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 ,
由 SKIPIF 1 < 0 ,得 SKIPIF 1 < 0 ,即 SKIPIF 1 < 0 ,
于是 SKIPIF 1 < 0 ,因此 SKIPIF 1 < 0 ,即 SKIPIF 1 < 0 ,B正确;
对于C,因为 SKIPIF 1 < 0 ,则剩下18个数据的 SKIPIF 1 < 0 分位数为 SKIPIF 1 < 0 ,
又 SKIPIF 1 < 0 ,则原样本数据的 SKIPIF 1 < 0 分位数为 SKIPIF 1 < 0 ,C错误;
对于D,因为 SKIPIF 1 < 0 ,则 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 ,
于是 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,
因此 SKIPIF 1 < 0 ,即 SKIPIF 1 < 0 ,D正确.
故选:ABD
第Ⅱ卷
三、填空题:本题共4小题,每小题5分,共20分
13.已知x与y之间的一组数据:
已知关于y与x的线性回归方程为 SKIPIF 1 < 0 ,则m的值为 .
【答案】 SKIPIF 1 < 0
【解析】求出 SKIPIF 1 < 0 ,代入回归方程解出 SKIPIF 1 < 0 ,进而解出 SKIPIF 1 < 0 的值.
【详解】由表格中的数据可得 SKIPIF 1 < 0
由于回归直线过样本的中心点 SKIPIF 1 < 0 ,所以 SKIPIF 1 < 0
所以 SKIPIF 1 < 0 ,解得 SKIPIF 1 < 0
故答案为: SKIPIF 1 < 0
14.某学习小组共有20人,在一次数学测试中,得100分的有2人,得95分的有4人,得90分的有5人,得85分的有3人,得80分的有5人,得75分的有1人,则这个学习小组成员该次数学测试成绩的第70百分位数是 .
【答案】 SKIPIF 1 < 0
【分析】将数据从小到大排列,结合百分位数的计算方法,即可求解.
【详解】根据题意,将20个数据从小到大排列:其中75分1个,80分5个,85分3个,90分5个,95分4个,100分2个,
由 SKIPIF 1 < 0 ,所以 SKIPIF 1 < 0 百分位数是第14和15个数据的平均数,
所以 SKIPIF 1 < 0 百分位数为 SKIPIF 1 < 0 .
故答案为: SKIPIF 1 < 0 .
15.某企业三月中旬生产A、B、C三种产品共3000件,根据分层抽样的结果,企业统计员作了如下统计表格.
由于不小心,表格中A、C产品的有关数据已被污染看不清楚,统计员记得A产品的样本容量比C产品的样本容量多10,根据以上信息,可得C产品的数量是 .
【答案】800
【详解】设C产品的数量为x件,则A产品的数量为1700-x件,由 SKIPIF 1 < 0 ,各得C产品的数量为800件.
16.已知6个正整数,它们的平均数是5,中位数是4,唯一的众数是3,则这6个数的方差的最大值为 .
【答案】 SKIPIF 1 < 0
【分析】设这6个数为 SKIPIF 1 < 0 ,根据题意,分析可得 SKIPIF 1 < 0 ,代入方差公式,计算即可得答案.
【详解】因为6个正整数,它们的平均数是5,中位数是4,唯一的众数是3,
要使这个6个数方差最大,则数据波动强,即极差最大,
所以最小值 SKIPIF 1 < 0 ,
若6个数中有3个3,则设数据为 SKIPIF 1 < 0 ,不满足中位数是4,
则数据中只有2个3,所以设这6个数为 SKIPIF 1 < 0 ,且 SKIPIF 1 < 0 ,
又仅有一个众数3,所以 SKIPIF 1 < 0 ,且 SKIPIF 1 < 0 ,
所以 SKIPIF 1 < 0 时,c最大,方差最大,此时 SKIPIF 1 < 0 ,
所以方差为 SKIPIF 1 < 0 .
故答案为: SKIPIF 1 < 0
四、解答题:本小题共6小题,共70分,其中第17题10分,18~22题12分。解答应写出文字说明、证明过程或演算步骤.
17.某大型科学竞技真人秀节目挑选选手的方式为:不但要对选手的空间感知、照相式记忆能力进行考核,而且要让选手经过名校最权威的脑力测试,125分以上才有机会入围.某重点高校准备调查脑力测试成绩是否与性别有关,在该高校随机抽取男、女学生各100名,然后对这200名学生进行脑力测试.规定:分数不小于125分为“入围学生”,分数小于125分为“未入围学生”.已知男生未入围76人,女生入围20人.
(Ⅰ)根据题意,填写下面的 SKIPIF 1 < 0 列联表,并根据列联表判断是否有95%以上的把握认为脑力测试后是否为“入围学生”与性别有关;
(Ⅱ)用分层抽样的方法从“入围学生”中随机抽取11名学生,求这11名学生中男、女生人数;若抽取的女生的脑力测试分数各不相同(每个人的分数都是整数),分别求这11名学生中女生测试分数平均分的最小值.
附: SKIPIF 1 < 0 ,其中 SKIPIF 1 < 0 .
【答案】(Ⅰ)列联表见解析,没有(Ⅱ)男生人数6人,女生人数5人,女生测试分数平均分的最小值为127分
【分析】(Ⅰ)根据题意可得 SKIPIF 1 < 0 列联表,计算出 SKIPIF 1 < 0 ,根据临界值表可得答案;
(Ⅱ)根据抽样比计算可得男女生人数;根据抽取的女生的脑力测试分数各不相同(每个人的分数都是整数),可知这5名学生的成绩分别为125,126,127,128,129时,女生测试分数平均分取最小值.
【详解】(Ⅰ)根据题意, SKIPIF 1 < 0 列联表如下:
SKIPIF 1 < 0 SKIPIF 1 < 0 SKIPIF 1 < 0 SKIPIF 1 < 0 SKIPIF 1 < 0 ,
所以没有95%以上的把握认为脑力测试后是否为“入围学生”与性别有关.
(Ⅱ)这11名学生中,被抽到的男生的人数为 SKIPIF 1 < 0 人,女生的人数为 SKIPIF 1 < 0 人,
因为抽取的女生的脑力测试分数各不相同(每个人的分数都是整数),
所以这5名学生的成绩分别为125,126,127,128,129时,女生测试分数平均分取最小值,
最小值为 SKIPIF 1 < 0 SKIPIF 1 < 0 分.
【点睛】本题考查了完善列联表,考查了独立性检验,考查了分层抽样,属于基础题.
18.某地教育部门对某学校学生的阅读素养进行检测,在该校随机抽取了 SKIPIF 1 < 0 名学生进行检测,实行百分制,现将所得的成绩按照 SKIPIF 1 < 0 SKIPIF 1 < 0 分成6组,并根据所得数据作出了如下所示的频数与频率的统计表和频率分布直方图.
(1)求出表中 SKIPIF 1 < 0 及图中 SKIPIF 1 < 0 的值;
(2)(2)估计该校学生阅读素养的成绩中位数以及平均数.
【答案】(1) SKIPIF 1 < 0 ;
(2)中位数是 SKIPIF 1 < 0 ,平均数是68.5.
【分析】(1)根据样本总体和频数,频率的定义结合频率和为1计算得到答案.
(2)根据平均数和中位数的定义计算得到答案.
【详解】(1) SKIPIF 1 < 0 ; SKIPIF 1 < 0 ;
SKIPIF 1 < 0 ,解得 SKIPIF 1 < 0 .
(2)设中位数为 SKIPIF 1 < 0 ,则 SKIPIF 1 < 0 ,解得 SKIPIF 1 < 0 ;
平均数为:
SKIPIF 1 < 0 .
19.市场监管部门对某线下某实体店2023年前两季度的月利润情况进行调查统计,得到的数据如下:
(1)是否可以用线性回归模型拟合y与x的关系?请用相关系数r加以说明;(参考:若 SKIPIF 1 < 0 时,则线性相关程度较高, SKIPIF 1 < 0 ,则线性相关程度一般,计算 SKIPIF 1 < 0 时精确度为0.01)
(2)利用最小二乘法求出y关于x的回归方程;用样本估计总体,请预估第9月份的利润.
附:对于一组数据 SKIPIF 1 < 0 SKIPIF 1 < 0 ,其回归直线 SKIPIF 1 < 0 的斜率
SKIPIF 1 < 0 , SKIPIF 1 < 0 .相关系数 SKIPIF 1 < 0 .
参考数据: SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 .
【答案】(1)可以,理由见解析
(2) SKIPIF 1 < 0 ,3.32万元
【分析】(1)计算出相关数据,利用相关系数公式计算即可;
(2)根据线性回归方程公式计算即可.
【详解】(1)由条件则 SKIPIF 1 < 0 ,
SKIPIF 1 < 0 , SKIPIF 1 < 0
SKIPIF 1 < 0 .
根据相关系数公式则
SKIPIF 1 < 0
SKIPIF 1 < 0 .
因此可以用线性回归模型拟合x与y的关系.
(2)根据(1)则变量x,y线性相关,设所求的线性回归方程为 SKIPIF 1 < 0 .
根据回归方程的回归系数公式则
SKIPIF 1 < 0 .
又因为 SKIPIF 1 < 0 .
从而可得变量x,y线性回归方程为 SKIPIF 1 < 0
当 SKIPIF 1 < 0 时, SKIPIF 1 < 0
因此预测9月份的利润为3.32万元.
20.某互联网公司为了确定下季度的前期广告投人计划,收集了近6个月广告投入量 SKIPIF 1 < 0 (单位:万元)和收益 SKIPIF 1 < 0 (单位:万元)的数据如表:
他们用两种模型① SKIPIF 1 < 0 ,② SKIPIF 1 < 0 分别进行拟合,得到相应的回归方程并进行残差分析,得到如图所示的残差图及一些统计量的值.
(1)根据残差图,比较模型①,②的拟合效果,应选择哪个模型拟合?并说明理由;
(2)残差绝对值大于2的数据被认为是异常数据,需要剔除.
(i)剔除异常数据后求出(1)中所选模型的回归方程;
(ii)若广告投入量 SKIPIF 1 < 0 时,(1)中所选模型收益的预报值是多少?
附:对于一组数据 SKIPIF 1 < 0 ,其回归直线 SKIPIF 1 < 0 的斜率和截距的最小二乘估计分别为: SKIPIF 1 < 0
【答案】(1)选择模型①,理由见解析
(2)(i) SKIPIF 1 < 0 ;(ii)62.04万元
【分析】(1)根据残差图的分布比较可得结论;
(2)(i)求出剔除异常数据后的平均数,即可求得 SKIPIF 1 < 0 和 SKIPIF 1 < 0 ,即得回归方程;(ii)将 SKIPIF 1 < 0 代入回归直线方程,即可得答案.
【详解】(1)选择模型①,因为模型①的残差点比较均匀地落在水平的带状区域中,
且模型①的带状区域比模型②的带状区域窄,
所以模型①的拟合精度高,回归方程的预报精度高.
(2)(i)剔除异常数据,即组号为3的数据,剩下数据的平均数为 SKIPIF 1 < 0 ;
SKIPIF 1 < 0 ,
SKIPIF 1 < 0 .
SKIPIF 1 < 0 .
∴所选模型的回归方程为 SKIPIF 1 < 0 ;
(ⅱ)若广告投入量 SKIPIF 1 < 0 时,该模型收益的预报值是 SKIPIF 1 < 0 万元.
21.我国是世界上严重缺水的国家,某市为了制定合理的节水方案,对居民用水情况进行了调查.通过抽样,获得了某年100位居民每人的月均用水量(单位:吨),将数据按照 SKIPIF 1 < 0 分成9组,制成了如图的频率分布直方图.
(1)求直方图中 SKIPIF 1 < 0 的值;
(2)该市决定设置议价收费标准 SKIPIF 1 < 0 ,用水量低于 SKIPIF 1 < 0 的居民按照“民用价”收费,高于 SKIPIF 1 < 0 的按照“商业价”收费,为保障有90%居民能享受“民用价”,请设置该标准 SKIPIF 1 < 0 .
(3)以每组数据中点值作为该组数据代表,分别是 SKIPIF 1 < 0 .规定“最佳稳定值” SKIPIF 1 < 0 是这样一个量: SKIPIF 1 < 0 与各组代表值的差的平方和最小.依此规定,请求出 SKIPIF 1 < 0 .
【答案】(1)0.30
(2) SKIPIF 1 < 0
(3)2.25
【分析】(1)根据所有矩形面积和等于1,列方程可求出结果;
(2)根据百分位数的计算方法求解即可;
(3)设x与各数据的差的平方和为y,由题意可得 SKIPIF 1 < 0 ,进而结合二次函数的性质求解即可.
【详解】(1)由频率分布直方图知,月均用水量在 SKIPIF 1 < 0 中的频率为0.08×0.5=0.04,
同理,在 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 中的频率分别为
0.08, SKIPIF 1 < 0 ,0.20,0.26, SKIPIF 1 < 0 ,0.06,0.04,0.02.
由 SKIPIF 1 < 0 ,
解得 SKIPIF 1 < 0 .
(2)由(1)知,前六组的总频率为 SKIPIF 1 < 0 ,
前七组的总频率为 SKIPIF 1 < 0 ,
所以 SKIPIF 1 < 0 ,
所以根据百分位数的计算方法有: SKIPIF 1 < 0 ,
解得 SKIPIF 1 < 0 .
(3)设x与各数据的差的平方和为y,
则 SKIPIF 1 < 0
SKIPIF 1 < 0 ,
由二次函数的性质知,当 SKIPIF 1 < 0 时, SKIPIF 1 < 0 取得最小值,
故 SKIPIF 1 < 0 .
22.为传承和发扬淄博陶瓷,某陶瓷公司计划加大研发力度.为确定下一年度投资计划,需了解年研发资金 SKIPIF 1 < 0 (亿元)与年销售额 SKIPIF 1 < 0 (亿元)的关系.该公司对历史数据进行对比分析,建立了两个函数模型:① SKIPIF 1 < 0 ,② SKIPIF 1 < 0 ,其中 SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 , SKIPIF 1 < 0 均为常数, SKIPIF 1 < 0 为自然对数的底数.
现该公司收集了近12年的年研发资金 SKIPIF 1 < 0 和年销售额 SKIPIF 1 < 0 的数据, SKIPIF 1 < 0 ,2, SKIPIF 1 < 0 ,12,并对这些数据作了初步处理,得到了散点图及一些统计量的值.令 SKIPIF 1 < 0 , SKIPIF 1 < 0 ,经计算得如下数据:
(1)设 SKIPIF 1 < 0 和 SKIPIF 1 < 0 的相关系数为 SKIPIF 1 < 0 , SKIPIF 1 < 0 和 SKIPIF 1 < 0 的相关系数为 SKIPIF 1 < 0 ,请从相关系数的角度,选择一个拟合程度更好的模型;
(2)根据(1)的选择及表中数据,建立 SKIPIF 1 < 0 关于 SKIPIF 1 < 0 的回归方程(计算过程中保留到0.001,最后结果精确到0.01);
(3)为进一步了解人们对新款式瓷器喜爱程度(分为“比较喜欢”和“不太喜欢”)是否跟年龄(分为“小于30岁”和“不小于30岁”)有关,公司从该地区随机抽取600人进行调查,调查数据如下表:
根据小概率 SKIPIF 1 < 0 的独立性检验,分析该地区对新款式瓷器喜爱程度是否与年龄有关.
附:①相关系数 SKIPIF 1 < 0 ,回归直线 SKIPIF 1 < 0 中斜率和截距的最小二乘估计公式分别为: SKIPIF 1 < 0 , SKIPIF 1 < 0 ;
② SKIPIF 1 < 0 , SKIPIF 1 < 0 ;
③参考数据: SKIPIF 1 < 0 .
【答案】(1)模型 SKIPIF 1 < 0 的拟合程度更好
(2) SKIPIF 1 < 0
(3)该地区对新款式瓷器喜爱程度与年龄有关
【分析】(1)由相关系数求出两个系数,比较大小可得;
(2)先建立 SKIPIF 1 < 0 关于 SKIPIF 1 < 0 的线性回归方程,从而得出 SKIPIF 1 < 0 关于 SKIPIF 1 < 0 的回归方程;
(3)计算出 SKIPIF 1 < 0 的值即可得到判断.
【详解】(1) SKIPIF 1 < 0 SKIPIF 1 < 0 ,
SKIPIF 1 < 0 SKIPIF 1 < 0 ,
则 SKIPIF 1 < 0 ,因此从相关系数的角度,模型 SKIPIF 1 < 0 的拟合程度更好
(2)先建立 SKIPIF 1 < 0 关于 SKIPIF 1 < 0 的线性回归方程.
由 SKIPIF 1 < 0 ,得 SKIPIF 1 < 0 ,即 SKIPIF 1 < 0 .
由于 SKIPIF 1 < 0 ,
SKIPIF 1 < 0
所以 SKIPIF 1 < 0 关于 SKIPIF 1 < 0 的线性回归方程为 SKIPIF 1 < 0 ,
所以 SKIPIF 1 < 0 ,则 SKIPIF 1 < 0
(3)零假设为 SKIPIF 1 < 0 :对新款式瓷器喜爱程度与年龄无关
SKIPIF 1 < 0 ,
根据小概率 SKIPIF 1 < 0 独立性检验,可推断 SKIPIF 1 < 0 不成立,
即该地区对新款式瓷器喜爱程度与年龄有关.
x
1
2
3
4
5
6
7
y
2.9
3.3
3.6
4.4
4.8
a
5.9
甲
76
76
78
87
88
乙
77
79
82
85
87
周期数(x)
1
2
3
4
5
频数(y)
2
17
36
93
142
第 SKIPIF 1 < 0 个月
1
2
3
4
5
月销售量 SKIPIF 1 < 0
2.5
3.2
4
4.8
5.5
x
0
1
2
3
y
m
3
5.5
7
产品类别
A
B
C
产品数量(件)
1300
样本容量(件)
130
性别
入围人数
未入围人数
总计
男生
女生
总计
SKIPIF 1 < 0
0.10
0.05
0.01
0.005
SKIPIF 1 < 0
2.706
3.841
6.635
7.879
性别
入围人数
未入围人数
总计
男生
24
76
100
女生
20
80
100
总计
44
156
200
分组
频数
频率
SKIPIF 1 < 0
SKIPIF 1 < 0
25
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
10
SKIPIF 1 < 0
SKIPIF 1 < 0
合计
SKIPIF 1 < 0
1
月份x
1
2
3
4
5
6
净利润y(万元)
1.0
1.4
1.7
2.0
2.2
2.4
月份
1
2
3
4
5
6
广告投入量
2
4
6
8
10
12
收益
14.21
20.31
31.8
31.18
37.83
44.67
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
7
30
1464.24
364
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
20
66
770
200
460
4.20
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
SKIPIF 1 < 0
3125000
21500
0.308
14
比较喜欢
不太喜欢
合计
年龄小于30岁
200
100
300
年龄不小于30岁
150
150
300
合计
350
250
600
SKIPIF 1 < 0
0.15
0.1
0.05
0.025
0.01
0.001
SKIPIF 1 < 0
2.072
2.706
3.841
5.024
6.635
10.828
相关试卷
这是一份新高考数学一轮复习分层提升练习第49练 成对数据的统计分析(2份打包,原卷版+含解析),文件包含新高考数学一轮复习分层提升练习第49练成对数据的统计分析原卷版doc、新高考数学一轮复习分层提升练习第49练成对数据的统计分析含解析doc等2份试卷配套教学资源,其中试卷共137页, 欢迎下载使用。
这是一份新高考数学一轮复习讲义 第49讲 成对数据的统计分析(2份打包,原卷版+含解析),文件包含新高考数学一轮复习讲义第49讲成对数据的统计分析原卷版doc、新高考数学一轮复习讲义第49讲成对数据的统计分析含解析doc等2份试卷配套教学资源,其中试卷共133页, 欢迎下载使用。
这是一份新高考数学一轮复习知识清单+巩固练习专题18 统计与成对数据的统计分析(2份打包,原卷版+解析版),文件包含新高考数学一轮复习知识清单+巩固练习专题18统计与成对数据的统计分析原卷版doc、新高考数学一轮复习知识清单+巩固练习专题18统计与成对数据的统计分析解析版doc等2份试卷配套教学资源,其中试卷共44页, 欢迎下载使用。