2021届二轮(理科数学) 统计与概率 专题卷(全国通用)
展开2021届二轮(理科数学) 统计与概率 专题卷(全国通用)
一、选择题
1、以下说法正正确的是( )
①两个随机变量的线性相关性越强,则相关系数的绝对值就越接近于1
②回归直线方程必过点
③已知一个回归直线方程为,则变量每增加一个单位时, 平均增加3个单位
A. ③ B. ①③ C. ①② D. ②③
2、
2015年11月11日的“双十一”又掀购物狂潮,淘宝网站对购物情况做了一项调查,收回的有效问卷共500000份,其中购买下列四种商品的人数统计如下:服饰鞋帽198000人;家居用品94000人;化妆品116000人;家用电器92000人.为了解消费者对商品的满意度,淘宝网站用分层抽样的方法从中选出部分问卷进行调查,已知在购买“化妆品”这一类中抽取了116人,则在购买“家居用品”这一类中应抽取的问卷份数为( )
A. 92 B. 94 C. 116 D. 118
3、下列说法正确的是( )
①线性回归方程适用于一切样本和总体;
②线性回归方程一般都有时间性;
③样本的取值范围会影响线性回归方程的适用范围;
④根据线性回归方程得到的预测值是预测变量的精确值.
A. ①③④ B. ②③ C. ①② D. ③④
4、某超市为了了解“微信支付”与“支付宝支付”的情况(“微信支付”与“支付宝支付”统称为“移动支付”),对消费者在该超市在2019年1-6月的支付方式进行统计,得到如图所示的折线图,则下列判断正确的是( )
①这6个月中使用“微信支付”的总次数比使用“支付宝支付”的总次数多
②这6个月中使用“微信支付”的消费总额比使用“支付宝支付”的消费总额大
③这6个月中4月份平均每天使用“移动支付”的次数最多
④2月份平均每天使用“移动支付”比5月份平均每天使用“移动支付”的次数多
A.①③ B.①②③ C.①③④ D.①②③④
5、一次选拔运动员,测得7名选手的身高(单位:)分布茎叶图如图,已知7人的平均身高为,有一名选手的身高记录不清楚,其末位数记为,则的值是( )
A. 8 B. 7 C. 6 D. 5
6、已知与之间的一组数据:
0 | 1 | 2 | 3 | |
1 | 3 | 5 | 7 |
则与的线性回归方程必过( )
A. B. C. D.
7、已知两个变量的样本中心点是(5,50),则两个变量间的回归直线方程可能为
( ).
A.y=7.5x+17.5 B.y=6.5x+17.5
C.y=7.5x+18.5 D.y=6.5x+18.5
8、设有一个回归方程y=3-5x,变量x增加一个单位时
A. y平均增加3个单位 B. y平均减少3个单位
C. y平均增加5个单位 D. y平均减少5个单位
9、对某两名高三学生在连续9次数学测试中的成绩(单位:分)进行统计得到折线图,下面是关于这两位同学的数学成绩分析.
①甲同学的成绩折线图具有较好的对称性,故平均成绩为130分;
②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间内;
③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关;
④乙同学连续九次测验成绩每一次均有明显进步.
其中正确的个数为( )
A. B. C. D.
10、高二某班共有学生56人,座号分别为1,2,3,,56现根据座号,用系统抽样的方法,抽取一个容量为4的样本.已知4号、18号、46号同学在样本中,那么样本中还有一个同学的座号是( )
A.30 B.31 C.32 D.33
11、在2017年3月15日,某物价部门对本市5家商场某商品一天的销售额及其价格进行调查,5家商场的价格与销售额之间的一组数据如表所示:
价格元 (单位:元) | 8 | ||||
销售额 (单位:千元) | 12 | 10 | 8 | 6 | 4 |
由散点图可知,销售额与价格之间有较好的线性相关关系,且回归直线方程是,则 ( )
A. B. C. 40 D.
12、为了让大家更好地了解我市的天气变化情况,我市气象局公布了近年来我市每月的日平均最高气温与日平均最低气温,现绘成雷达图如图所示,下列叙述不正确的是( )
A. 各月的平均最高气温都不高于25度 B. 七月的平均温差比一月的平均温差小
C. 平均最高气温低于20度的月份有5个 D. 六月、七月、八月、九月的平均温差都不高于10度
二、填空题
13、总体由编号为, , , , 的个个体组成.利用下面的随机数表选取样本,选取方法是从随机数表第行的第列数字开始由左到右依次选取两个数字,则选出来的第个个体的编号为__________.
14、在抽查某产品尺寸的过程中,将其尺寸分成若干组,[a,b]是其中一组,抽查出的个数在该组上的频率为m,该组上的直方图的高为h,则|a-b|等于________.
15、某学校高一、高二、高三年级的学生人数分别为1500,1200,900,现用分层抽样的方法从这三个年级中抽取90人,则应从高二年级抽取的学生人数为_________________.
16、如图是一容量为的样本的重量频率分布直方图,则由图可估计样本重量的中位数为 .
三、解答题
17、某地随着经济的发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:
年份 | 2011 | 2012 | 2013 | 2014 | 2015 |
储蓄存款(千亿元) | 5 | 6 | 7 | 8 | 10 |
为了研究计算的方便,工作人员将上表的数据进行了处理,,得到下表2:
时间代号 | 1 | 2 | 3 | 4 | 5 |
0 | 1 | 2 | 3 | 5 |
(1)求关于的线性回归方程;
(2)通过(1)中的方程,求出关于的回归方程;
(3)用所求的回归方程预测到2020年年底,该地储蓄存款可达多少?
(附:对于线性回归方程,其中,)
18、2019年“中秋节”期间,高速公路车辆较多,交警部门通过路面监控装置抽样调查某一山区路段汽车行驶速度,采用的方法是:按到达监控点先后顺序,每隔50辆抽取一辆,总共抽取120辆,分别记下其行车速度,将行车速度()分成七段后得到如图所示的频率分布直方图,据图解答下列问题:
(1)求的值,并说明交警部门采用的是什么抽样方法?
(2)求这120辆车行驶速度的众数和中位数的估计值(精确到0.1);
(3)若该路段的车速达到或超过即视为超速行驶,试根据样本估计该路段车辆超速行驶的概率.
19、某校高二年级学生身体素质考核成绩(单位:分)的频率分布直方图如图所示:
(1)求频率分布直方图中a的值;
(2)根据频率分布直方图估计成绩的众数和平均数.
参考答案
1、答案C
详解:由题意①中,根据变量相关性的相关系数可知,相关系数,且越接近,相关性越强,所以是正确的;
②中,根据回归直线方程的特征,可知所有的回归直线方程都过点,所致是正确的;
③中,由回归直线方程,可知回归系数,所以变量每增加一个单位时,平均减少个单位,所以是不正确的,故选C.
2、答案B
3、答案B
根据线性回归方程研究的是具有相关关系的两个变量,可对前三者进行判断,再者因为线性回归方程得到的预测值是预测变量的估计值,可判断最后一个也是不正确的.
详解
线性回归方程适用于具有相关关系的两个变量,对于具有确定关系的两个变量是不适用的,因此样本和总体中变量只能是具有相关关系才行;因此说法不正确;
线性回归方程一般都有时间性,是正确的,因为回归方程适用于有相关关系的两个变量,两者的变化可能会随时间的推移,互相影响的情况不同,故正确;
③样本的取值范围会影响线性回归方程的适用范围,因为方程就是根据样本得到的;故说法正确;
④根据线性回归方程得到的预测值是预测变量的估计值,不是准确值.故说法不正确.
故答案为:B.
4、答案C
根据折线图,对①②③④逐项分析计算即可.
详解
①由图像知,使用微信支付的总次数比使用支付宝支付的总次数多,故正确;
②图像中纵坐标是消费次数,并不知道消费总额,故错误;
③由图像知,四月份移动支付消费次数更多,所以平均值也最大,故正确;
④二月份平均每天消费次数,五月份平均每天消费次数,,故正确.
故选:C
5、答案A
详解:依题意,,整理得:,解得:,故选A.
6、答案B
先求出x的平均值 ,y的平均值 ,回归直线方程一定过样本的中心点(,),代入可得答案.
详解
解:回归直线方程一定过样本的中心点(,),
,
∴样本中心点是(1.5,4),
则y与x的线性回归方程y=bx+a必过点(1.5,4),
故选B.
7、答案B
样本中心点的坐标为(5,50),代入验证即可.
8、答案D
分析
根据回归方程中变量的系数可得结论.
详解
由题意可得,在回归方程中,当变量增加一个单位时,平均减少5个单位.
故选D.
9、答案C
利用图形,判断折线图平均分以及线性相关性,成绩的比较,说明正误即可.
详解
①甲同学的成绩折线图具有较好的对称性,最高分,平均成绩为低于分,①错误;
②根据甲同学成绩折线图提供的数据进行统计,估计该同学平均成绩在区间内,②正确;
③乙同学的数学成绩与测试次号具有比较明显的线性相关性,且为正相关,③正确;
④乙同学在这连续九次测验中第四次、第七次成绩较上一次成绩有退步,故④不正确.
故选:C.
10、答案C
由题意得,样本间隔为,则另外一个号码为,则选C.
11、答案C
.
将代入,得.
故选C.
12、答案C
由雷达图可知平均最高气温低于20度的月份有一月、二月、十一月、十二月共四个,
选项C的说法是错误的.
故选C.
13、答案
依次选取两个数字为23,75,93,21,15,04,
所以选出来的第个个体的编号为15.
14、答案
15、答案30
直接利用分层抽样的定义得到答案.
详解
因为,,所以应从高二年级抽取30人.
故答案为:
16、答案
根据中位数的定义可由: ,解得: ,所以中位数为: .
17、答案(1);(2);(3)预测到2020年年底,该地储蓄存款额可达15.6千亿元.
试题(1),,,,
,,
∴.
(2),,代入得到:
,即.
(3)∴,
∴预测到2020年年底,该地储蓄存款额可达15.6千亿元.
18、答案(1),系统抽样;(2)众数:,中位数:;(3)
(2)众数是最高矩形底边中点的横坐标,中位数前的小矩形的面积和为0.5,由此求解即可;
(3)由频率分布直方图可得车速在中的频数,进而求解即可.
详解:解:(1)由频率分布直方图知:,
∴,
该抽样方法是系统抽样;
(2)根据众数是最高矩形底边中点的横坐标,即众数的估计值为;
∵前三个小矩形的面积和为,
第四个小矩形的面积为,
∴中位数在第四组,设中位数为,则,解得,
∴数据的中位数为
(3)样本中车速在有(辆),
∴估计该路段车辆超速的概率.
19、答案(1)0.005(2)76.5
(2)利用样本的众数和平均数概念即可求解。
详解
解:(1)
(2)由图可知众数的估计值为
平均数的估计值.