还剩11页未读,
继续阅读
2021届二轮(理科数学) 统计统计案例 专题卷(全国通用)
展开
专题十八 统计、统计案例
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分,考试时间120分钟.
第Ⅰ卷 (选择题,共60分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(2019·昆明市高三质检)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高,如图是2018年9月到2019年2月这半年来,某个关键词的搜索指数变化的统计图.根据该统计图判断,下列结论正确的是( )
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化
B.这半年来,网民对该关键词相关的信息关注度不断减弱
C.从该关键词的搜索指数来看,2018年10月的方差小于11月的方差
D.从该关键词的搜索指数来看,2018年12月的平均值大于2019年1月的平均值
答案 D
解析 这半年来,网民对该关键词相关的信息关注度没有规律,故A错误;这半年来,网民对该关键词相关的信息关注度呈现一定的波动性,没有不断减弱,故B错误;2018年10月份数据比较离散,而11月份数据比较稳定,故10月份的方差大于11月份的方差,故C错误;从该关键词的搜索指数来看,2018年12月的平均值大于2019年1月的平均值,故D正确,故选D.
2.(2019·四川省乐山市高中第一次调研)胡萝卜中含有大量的β胡萝卜素,摄入人体消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的β胡萝卜素(单位:mg)得到茎叶图如图所示,则下列说法不正确的是( )
A.a C.b品种的众数为3.31 D.a品种的中位数为3.27
答案 C
解析 由茎叶图得:b品种所含β胡萝卜素普遍高于a品种,∴a 3.(2019·安徽省江淮十校第一次联考)近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图所示,其中年龄在区间[30,40)内的有2500人,在区间[20,30)内的有1200人,则m的值为( )
A.0.013 B.0.13
C.0.012 D.0.12
答案 C
解析 由题意,得年龄在区间[30,40)内的频率为0.025×10=0.25,则赞成高校招生改革的市民有=10000(人),因为年龄在区间[20,30)内的有1200人,所以m==0.012.故选C.
4.(2019·驻马店市高三期末)在一组样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,x3,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+2上,则这组样本数据的相关系数为( )
A.- B. C.1 D.-1
答案 D
解析 由所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则有|r|=1,根据回归直线方程是y=-x+2,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,∴相关系数r=-1.故选D.
5.(2019·柳州市模拟)如图记录了一种叫万年松的树生长时间t(年)与树高y(m)之间的散点图.请你据此判断,拟合这种树生长的年数与树高的关系式,选择的函数模型最好的是( )
A.y=2t B.y=log2t
C.y=t3 D.y=2t2
答案 B
解析 分析可知,对于A,C,D选项,函数值y随t的增大递增速度很快,与所给函数图象不符合,故错误;对于B选项,可知该函数图象类似于对数函数图象,故正确.故选B.
6.(2019·山东省高三第一次大联考)下图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程:y=b2x+a2,相关系数为r2.则( )
A.0
C.-1
答案 D
解析 由图可知变量x,y呈负相关,所以r1,r2<0,因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r2|更接近1,所以-1
7.(2019·合肥市高三第一次教学质检)某调查机构对全国互联网行业进行调查统计,得到整个互联网行业从业者年龄分布饼状图、90后从事互联网行业岗位分布条形图,则下列结论中不一定正确的是( )
注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.
A.互联网行业从业人员中90后占一半以上
B.互联网行业中从事技术岗位的人数超过总人数的20%
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业中从事技术岗位的人数90后比80后多
答案 D
解析 由整个互联网行业从业者年龄分布的饼状图可知,互联网行业从业者中90后占了56%,故A正确;由两个统计图知,互联网行业从事技术岗位的90后人数占总人数的56%×39.6%=22.176%,已经超过了20%,所以整个互联网行业从事技术岗位的人数肯定会超过总人数的20%,故B正确;由两个统计图知,互联网行业从事运营岗位的人数90后占总人数的56%×17%=9.52%,超过了80前互联网行业从业者人数,故C正确;由两个统计图知互联网行业80后的人数占41%,但没有80后的岗位分布图,因此无法判断互联网行业中从事技术岗位的人数90后与80后谁多谁少,故D不一定正确,故选D.
8.(2019·汕尾市教学质量监测)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论正确的是( )
A.这15天日平均温度的极差为15 ℃
B.连续三天日平均温度的方差最大的是7日,8日,9日三天
C.由折线图能预测16日温度要低于19 ℃
D.由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数
答案 B
解析 由某地某月1日至15日的日平均温度变化的折线图得,这15天日平均温度的极差为:38 ℃-19 ℃=19 ℃,A错误;连续三天日平均温度的方差最大的是7日,8日,9日三天,B正确;由折线图无法预测16日温度是否低于19 ℃,C错误;由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,D错误.故选B.
9.(2019·安徽重点中学模拟)某中学有高中生3000人,初中生2000人,男、女生所占的比例如图所示.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是( )
A.12 B.15
C.20 D.21
答案 A
解析 由扇形图得,中学有高中生3000人,其中男生:3000×30%=900人,女生:3000×70%=2100人,初中生2000人,其中男生:2000×60%=1200人,女生:2000×40%=800人,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则=,解得n=50,∴从初中生中抽取的男生人数是50×=12.故选A.
10.(2019·东北三省四市二模)利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得K2≈7.245,参照下表:
P(K2≥k0)
0.01
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
答案 B
解析 由K2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B.
11.(2019·全国卷Ⅰ)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
答案 C
解析 根据题意,系统抽样是等距抽样,所以抽样间隔为=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.
12.(2019·河北邯郸二模)观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( )
答案 D
解析 在频率等高条形图中,与相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图)中,若x1,x2所占比例相差越大,则分类变量x,y的相关性越强.故选D.
第Ⅱ卷 (非选择题,共90分)
二、填空题(本大题共4小题,每小题5分,共20分)
13.(2019·宿迁二调)某单位普通职工和行政人员共280人.为了解他们在“学习强国”APP平台上的学习情况,现用分层抽样的方法从所有职员中抽取容量为56的样本.已知从普通职工中抽取的人数为49,则该单位行政人员的人数为________.
答案 35
解析 由题意可得,抽取的行政人员数为56-49=7,
抽样的比列为=,故该学校的行政人员人数是7÷=35.
14.(2019·抚州模拟)已知一组数据分别是x,10,2,5,2,4,2,若这组数据的平均数、中位数、众数成等差数列,则数据x的所有可能取值为________.
答案 -11,3,17
解析 由题意得,这组数据的平均数为=,众数为2.若x≤2,则中位数为2,所以2×2=+2,解得x=-11;若2
15.(2019·孝义市名校二模)某高速公路移动雷达测速检测车在某时段对某段路过往的400辆汽车的车速进行检测,根据检测的结果绘制出如图所示的频率分布直方图,根据直方图的数据估计400辆汽车中时速在区间[90,110)的约有________辆.
答案 280
解析 由图可知,时速在区间[80,90),[110,120)的频率为(0.01+0.02)×10=0.3,所以时速在区间[90,110)的频率为1-0.3=0.7,所以时速在区间[90,110)的车辆约为400×0.7=280辆.
16.(2019·贵州黔东南州模拟)已知x,y取值如下表:
x
0
1
3
5
6
y
1
m
3m
5.6
7.4
画散点图分析可知y与x线性相关,且求得回归方程为=x+1,则m的值为________.
答案 1.5
解析 由题意,得==3,
==,则
=3+1,解得m=1.5.
三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
企业数
[-0.20,0)
2
[0,0.20)
24
[0.20,0.40)
53
[0.40,0.60)
14
[0.60,0.80)
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=i(yi-)2=×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,s==0.02×≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
18.(本小题满分12分)(2019·上饶一模)在2019年高考数学的全国Ⅰ卷中,文科和理科的选做题题目完全相同,第22题考查坐标系和参数方程,第23题考查不等式选讲,某校高三质量检测的命题采用了全国Ⅰ卷的模式,在测试结束后,该校数学组教师对该校全体高三学生的选做题得分情况进行了统计,得到两题得分的统计表如下(已知每名学生只做了一道题):
第22题的得分统计表
得分
0
3
5
8
10
理科人数
50
70
80
100
500
文科人数
5
20
10
5
70
第23题的得分统计表
得分
0
3
5
8
10
理科人数
10
10
15
25
40
文科人数
5
5
25
0
5
(1)完成如下2×2列联表,并判断能否有99.9%的把握认为“选做题的选择”与“文、理科的科类”有关;
选做22题
选做23题
合计
文科人数
理科人数
合计
(2)判断该校全体高三学生第22题和第23题中哪道题的得分率更高(得分率=题目平均得分/题目满分×100%,结果精确到0.01%);
(3)在按分层抽样的方法在第23题得分为0的学生中随机抽取6名进行单独辅导,并在辅导后随机抽取2名学生进行测试,求被抽中进行测试的2名学生均为理科生的概率.
附:K2=,其中n=a+b+c+d.
P(K2)≥k0
0.050
0.010
0.001
k0
3.841
6.635
10.828
解 (1)根据题意填写2×2列联表如下:
选做22题
选做23题
合计
文科人数
110
40
150
理科人数
800
100
900
总计
910
140
1050
由表中数据,计算K2=≈26.923>10.828,
对照临界值得,有99.9%的把握认为“选做题的选择”与“文、理科的科类”有关.
(2)第22题的平均分为=(分),
得分率为×100%≈79.78%;
第23题的平均分为=(分),
得分率为×100%≈63.93%;
所以第22题的得分率更高.
(3)由分层抽样的方法可知在被选取的6名学生中理科生有4名,文科生有2名,记4名理科生为a,b,c,d,2名文科生为E,F,从这6名学生中随机抽取2名,基本事件是:ab,ac,ad,aE,aF,bc,bd,bE,bF,cd,cE,cF,dE,dF,EF共15种,被抽中的2名学生均为理科生的基本事件为ab,ac,ad,bc,bd,cd共6种,故所求的概率为P==.
19.(本小题满分12分)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解 (1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
20.(本小题满分12分)(2019·湖北八校联考)某公司准备加大对一项产品的科技改造,经过充分的市场调研与模拟,得到x,y之间的一组数,其中x(单位:百万元)是科技改造的总投入,y(单位:百万元)是改造后的额外收益.
x
2
3
5
7
8
y
5
8
12
14
16
其中=5,=11,G(x,y)=2x+y是对当地GDP的增长贡献值.
(1)若从五组数据中任取两组,求至少有一组满足G(x,y)≥25的概率;
(2)对于表中数据,甲、乙两个同学给出的拟合直线方程为:
l1:y=2x+1,
l2:y=x-.
试用最小二乘法判断哪条直线的拟合程度更好.
解 (1)记五组数据分别为A,B,C,D,E,则由题意知后两组数据D,E满足条件.
从五组数据中任意取出两组有10种情况,即从ABCDE中取出两组有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共有10种情况,
至少有一组满足条件的有AD,BD,CD,AE,BE,CE,DE,共有7种情况.
故至少有一组满足G(x,y)≥25的概率为.
(2)如表格:
x
2
3
5
7
8
y
5
8
12
14
16
y=2x+1
5
7
11
15
17
x
2
3
5
7
8
y
5
8
12
14
16
y=x-
3.5
6
11
16
18.5
Q1=02+12+12+12+12=4,
Q2=1.52+22+12+22+2.52=17.5,
Q1
∴直线l1拟合程度更好.
21.(本小题满分12分)(2019·开封二模)如图是某台大型设备使用时间x(单位:年)与维护费用y(单位:千元)的散点图.
(1)根据散点图,求y关于x的回归方程=x+;
(2)如果维护费用超过120千元,就需要更换设备,那么根据(1)中模型的预测,估计该设备最多可以使用多少年?
附:①参考数据:=75, (xi-)(yi-)=63;②一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程=x+的斜率和截距的最小二乘估计公式分别为:=,=-.
解 (1)由题意得,
==3.5,=75,
(xi-)2=(1-3.5)2+(2-3.5)2+(3-3.5)2+(4-3.5)2+(5-3.5)2+(6-3.5)2=17.5.
(xi-)(yi-)=63,
所以===3.6,
∴=-=75-3.6×3.5=62.4.
即y关于x的回归方程=3.6x+62.4.
(2)由题得3.6x+62.4≤120,解得x≤16.
所以估计该设备最多可以使用16年.
22.(本小题满分12分)(2019·山东六市二诊)为了弘扬传统文化,某市举办了“高中生诗词大赛”,现从全市参加比赛的学生中随机抽取1000人的成绩进行统计,得到如图所示的频率分布直方图,其中成绩的分组区间为[60,70),[70,80),[80,90),[90,100].
(1)求频率分布直方图中m的值;
(2)在所抽取的1000名学生中,用分层抽样的方法在成绩为[80,100]的学生中抽取了一个容量为5的样本,再从该样本中任意抽取2人,求2人的成绩均在区间[90,100]内的概率;
(3)若该市有10000名高中生参赛,根据此次统计结果,试估算成绩在区间[90,100]内的人数.
解 (1)依题意可知组距为10,
由(0.025+0.05+m+0.01)×10=1,解得m=0.015.
(2)抽取的这个容量为5的样本成绩在区间[80,90)的人数为5×=3人,记这3人为a,b,c.
成绩在区间[90,100]的人数为5×=2人,记这2人为d,e.
任意抽取2人的基本事件为ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10个.
其中这2人的成绩均在区间[90,100]内的基本事件为de,共1个.
所以2人的成绩均在区间[90,100]内的概率为.
(3)因为10000×0.01×10=1000人,
所以估计成绩在区间[90,100]的人数为1000人.
本试卷分第Ⅰ卷(选择题)和第Ⅱ卷(非选择题)两部分.满分150分,考试时间120分钟.
第Ⅰ卷 (选择题,共60分)
一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)
1.(2019·昆明市高三质检)“搜索指数”是网民通过搜索引擎,以每天搜索关键词的次数为基础所得到的统计指标.搜索指数越大,表示网民搜索该关键词的次数越多,对该关键词相关的信息关注度也越高,如图是2018年9月到2019年2月这半年来,某个关键词的搜索指数变化的统计图.根据该统计图判断,下列结论正确的是( )
A.这半年来,网民对该关键词相关的信息关注度呈周期性变化
B.这半年来,网民对该关键词相关的信息关注度不断减弱
C.从该关键词的搜索指数来看,2018年10月的方差小于11月的方差
D.从该关键词的搜索指数来看,2018年12月的平均值大于2019年1月的平均值
答案 D
解析 这半年来,网民对该关键词相关的信息关注度没有规律,故A错误;这半年来,网民对该关键词相关的信息关注度呈现一定的波动性,没有不断减弱,故B错误;2018年10月份数据比较离散,而11月份数据比较稳定,故10月份的方差大于11月份的方差,故C错误;从该关键词的搜索指数来看,2018年12月的平均值大于2019年1月的平均值,故D正确,故选D.
2.(2019·四川省乐山市高中第一次调研)胡萝卜中含有大量的β胡萝卜素,摄入人体消化器官后,可以转化为维生素A,现从a,b两个品种的胡萝卜所含的β胡萝卜素(单位:mg)得到茎叶图如图所示,则下列说法不正确的是( )
A.a C.b品种的众数为3.31 D.a品种的中位数为3.27
答案 C
解析 由茎叶图得:b品种所含β胡萝卜素普遍高于a品种,∴a 3.(2019·安徽省江淮十校第一次联考)近年呼吁高校招生改革的呼声越来越高,在赞成高校招生改革的市民中按年龄分组,得到样本频率分布直方图如图所示,其中年龄在区间[30,40)内的有2500人,在区间[20,30)内的有1200人,则m的值为( )
A.0.013 B.0.13
C.0.012 D.0.12
答案 C
解析 由题意,得年龄在区间[30,40)内的频率为0.025×10=0.25,则赞成高校招生改革的市民有=10000(人),因为年龄在区间[20,30)内的有1200人,所以m==0.012.故选C.
4.(2019·驻马店市高三期末)在一组样本数据为(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,x3,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=-x+2上,则这组样本数据的相关系数为( )
A.- B. C.1 D.-1
答案 D
解析 由所有样本点(xi,yi)(i=1,2,…,n)都在直线上,则有|r|=1,根据回归直线方程是y=-x+2,可得这两个变量是负相关,故这组样本数据的样本相关系数为负值,∴相关系数r=-1.故选D.
5.(2019·柳州市模拟)如图记录了一种叫万年松的树生长时间t(年)与树高y(m)之间的散点图.请你据此判断,拟合这种树生长的年数与树高的关系式,选择的函数模型最好的是( )
A.y=2t B.y=log2t
C.y=t3 D.y=2t2
答案 B
解析 分析可知,对于A,C,D选项,函数值y随t的增大递增速度很快,与所给函数图象不符合,故错误;对于B选项,可知该函数图象类似于对数函数图象,故正确.故选B.
6.(2019·山东省高三第一次大联考)下图是相关变量x,y的散点图,现对这两个变量进行线性相关分析,方案一:根据图中所有数据,得到线性回归方程y=b1x+a1,相关系数为r1;方案二:剔除点(10,21),根据剩下数据得到线性回归直线方程:y=b2x+a2,相关系数为r2.则( )
A.0
解析 由图可知变量x,y呈负相关,所以r1,r2<0,因为剔除点(10,21)后,剩下点数据更具有线性相关性,|r2|更接近1,所以-1
注:90后指1990年及以后出生,80后指1980~1989年之间出生,80前指1979年及以前出生.
A.互联网行业从业人员中90后占一半以上
B.互联网行业中从事技术岗位的人数超过总人数的20%
C.互联网行业中从事运营岗位的人数90后比80前多
D.互联网行业中从事技术岗位的人数90后比80后多
答案 D
解析 由整个互联网行业从业者年龄分布的饼状图可知,互联网行业从业者中90后占了56%,故A正确;由两个统计图知,互联网行业从事技术岗位的90后人数占总人数的56%×39.6%=22.176%,已经超过了20%,所以整个互联网行业从事技术岗位的人数肯定会超过总人数的20%,故B正确;由两个统计图知,互联网行业从事运营岗位的人数90后占总人数的56%×17%=9.52%,超过了80前互联网行业从业者人数,故C正确;由两个统计图知互联网行业80后的人数占41%,但没有80后的岗位分布图,因此无法判断互联网行业中从事技术岗位的人数90后与80后谁多谁少,故D不一定正确,故选D.
8.(2019·汕尾市教学质量监测)如图是某地某月1日至15日的日平均温度变化的折线图,根据该折线图,下列结论正确的是( )
A.这15天日平均温度的极差为15 ℃
B.连续三天日平均温度的方差最大的是7日,8日,9日三天
C.由折线图能预测16日温度要低于19 ℃
D.由折线图能预测本月温度小于25 ℃的天数少于温度大于25 ℃的天数
答案 B
解析 由某地某月1日至15日的日平均温度变化的折线图得,这15天日平均温度的极差为:38 ℃-19 ℃=19 ℃,A错误;连续三天日平均温度的方差最大的是7日,8日,9日三天,B正确;由折线图无法预测16日温度是否低于19 ℃,C错误;由折线图无法预测本月温度小于25 ℃的天数是否少于温度大于25 ℃的天数,D错误.故选B.
9.(2019·安徽重点中学模拟)某中学有高中生3000人,初中生2000人,男、女生所占的比例如图所示.为了解学生的学习情况,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则从初中生中抽取的男生人数是( )
A.12 B.15
C.20 D.21
答案 A
解析 由扇形图得,中学有高中生3000人,其中男生:3000×30%=900人,女生:3000×70%=2100人,初中生2000人,其中男生:2000×60%=1200人,女生:2000×40%=800人,用分层抽样的方法从该校学生中抽取一个容量为n的样本,已知从高中生中抽取女生21人,则=,解得n=50,∴从初中生中抽取的男生人数是50×=12.故选A.
10.(2019·东北三省四市二模)利用独立性检验的方法调查高中生性别与爱好某项运动是否有关,通过随机调查200名高中生是否爱好某项运动,利用2×2列联表,由计算可得K2≈7.245,参照下表:
P(K2≥k0)
0.01
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
得到的正确结论是( )
A.有99%以上的把握认为“爱好该项运动与性别无关”
B.有99%以上的把握认为“爱好该项运动与性别有关”
C.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别有关”
D.在犯错误的概率不超过0.5%的前提下,认为“爱好该项运动与性别无关”
答案 B
解析 由K2≈7.245>6.635,可得有99%以上的把握认为“爱好该项运动与性别有关”.故选B.
11.(2019·全国卷Ⅰ)某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
答案 C
解析 根据题意,系统抽样是等距抽样,所以抽样间隔为=10.因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.
12.(2019·河北邯郸二模)观察下面频率等高条形图,其中两个分类变量x,y之间关系最强的是( )
答案 D
解析 在频率等高条形图中,与相差很大时,我们认为两个分类变量有关系,在四个选项中(等高的条形图)中,若x1,x2所占比例相差越大,则分类变量x,y的相关性越强.故选D.
第Ⅱ卷 (非选择题,共90分)
二、填空题(本大题共4小题,每小题5分,共20分)
13.(2019·宿迁二调)某单位普通职工和行政人员共280人.为了解他们在“学习强国”APP平台上的学习情况,现用分层抽样的方法从所有职员中抽取容量为56的样本.已知从普通职工中抽取的人数为49,则该单位行政人员的人数为________.
答案 35
解析 由题意可得,抽取的行政人员数为56-49=7,
抽样的比列为=,故该学校的行政人员人数是7÷=35.
14.(2019·抚州模拟)已知一组数据分别是x,10,2,5,2,4,2,若这组数据的平均数、中位数、众数成等差数列,则数据x的所有可能取值为________.
答案 -11,3,17
解析 由题意得,这组数据的平均数为=,众数为2.若x≤2,则中位数为2,所以2×2=+2,解得x=-11;若2
答案 280
解析 由图可知,时速在区间[80,90),[110,120)的频率为(0.01+0.02)×10=0.3,所以时速在区间[90,110)的频率为1-0.3=0.7,所以时速在区间[90,110)的车辆约为400×0.7=280辆.
16.(2019·贵州黔东南州模拟)已知x,y取值如下表:
x
0
1
3
5
6
y
1
m
3m
5.6
7.4
画散点图分析可知y与x线性相关,且求得回归方程为=x+1,则m的值为________.
答案 1.5
解析 由题意,得==3,
==,则
=3+1,解得m=1.5.
三、解答题(本大题共6小题,共70分.解答应写出文字说明、证明过程或演算步骤)
17.(本小题满分10分)(2019·全国卷Ⅱ)某行业主管部门为了解本行业中小企业的生产情况,随机调查了100个企业,得到这些企业第一季度相对于前一年第一季度产值增长率y的频数分布表.
y的分组
企业数
[-0.20,0)
2
[0,0.20)
24
[0.20,0.40)
53
[0.40,0.60)
14
[0.60,0.80)
7
(1)分别估计这类企业中产值增长率不低于40%的企业比例、产值负增长的企业比例;
(2)求这类企业产值增长率的平均数与标准差的估计值(同一组中的数据用该组区间的中点值为代表).(精确到0.01)
附:≈8.602.
解 (1)根据产值增长率频数分布表得,所调查的100个企业中产值增长率不低于40%的企业频率为=0.21.
产值负增长的企业频率为=0.02.
用样本频率分布估计总体分布得这类企业中产值增长率不低于40%的企业比例为21%,产值负增长的企业比例为2%.
(2)=×(-0.10×2+0.10×24+0.30×53+0.50×14+0.70×7)=0.30,s2=i(yi-)2=×[(-0.40)2×2+(-0.20)2×24+02×53+0.202×14+0.402×7]=0.0296,s==0.02×≈0.17.所以,这类企业产值增长率的平均数与标准差的估计值分别为0.30,0.17.
18.(本小题满分12分)(2019·上饶一模)在2019年高考数学的全国Ⅰ卷中,文科和理科的选做题题目完全相同,第22题考查坐标系和参数方程,第23题考查不等式选讲,某校高三质量检测的命题采用了全国Ⅰ卷的模式,在测试结束后,该校数学组教师对该校全体高三学生的选做题得分情况进行了统计,得到两题得分的统计表如下(已知每名学生只做了一道题):
第22题的得分统计表
得分
0
3
5
8
10
理科人数
50
70
80
100
500
文科人数
5
20
10
5
70
第23题的得分统计表
得分
0
3
5
8
10
理科人数
10
10
15
25
40
文科人数
5
5
25
0
5
(1)完成如下2×2列联表,并判断能否有99.9%的把握认为“选做题的选择”与“文、理科的科类”有关;
选做22题
选做23题
合计
文科人数
理科人数
合计
(2)判断该校全体高三学生第22题和第23题中哪道题的得分率更高(得分率=题目平均得分/题目满分×100%,结果精确到0.01%);
(3)在按分层抽样的方法在第23题得分为0的学生中随机抽取6名进行单独辅导,并在辅导后随机抽取2名学生进行测试,求被抽中进行测试的2名学生均为理科生的概率.
附:K2=,其中n=a+b+c+d.
P(K2)≥k0
0.050
0.010
0.001
k0
3.841
6.635
10.828
解 (1)根据题意填写2×2列联表如下:
选做22题
选做23题
合计
文科人数
110
40
150
理科人数
800
100
900
总计
910
140
1050
由表中数据,计算K2=≈26.923>10.828,
对照临界值得,有99.9%的把握认为“选做题的选择”与“文、理科的科类”有关.
(2)第22题的平均分为=(分),
得分率为×100%≈79.78%;
第23题的平均分为=(分),
得分率为×100%≈63.93%;
所以第22题的得分率更高.
(3)由分层抽样的方法可知在被选取的6名学生中理科生有4名,文科生有2名,记4名理科生为a,b,c,d,2名文科生为E,F,从这6名学生中随机抽取2名,基本事件是:ab,ac,ad,aE,aF,bc,bd,bE,bF,cd,cE,cF,dE,dF,EF共15种,被抽中的2名学生均为理科生的基本事件为ab,ac,ad,bc,bd,cd共6种,故所求的概率为P==.
19.(本小题满分12分)(2019·全国卷Ⅲ)为了解甲、乙两种离子在小鼠体内的残留程度,进行如下试验:将200只小鼠随机分成A,B两组,每组100只,其中A组小鼠给服甲离子溶液,B组小鼠给服乙离子溶液.每只小鼠给服的溶液体积相同、摩尔浓度相同.经过一段时间后用某种科学方法测算出残留在小鼠体内离子的百分比.根据试验数据分别得到如下直方图:
记C为事件:“乙离子残留在体内的百分比不低于5.5”,根据直方图得到P(C)的估计值为0.70.
(1)求乙离子残留百分比直方图中a,b的值;
(2)分别估计甲、乙离子残留百分比的平均值(同一组中的数据用该组区间的中点值为代表).
解 (1)由已知得0.70=a+0.20+0.15,故a=0.35.
b=1-0.05-0.15-0.70=0.10.
(2)甲离子残留百分比的平均值的估计值为
2×0.15+3×0.20+4×0.30+5×0.20+6×0.10+7×0.05=4.05,
乙离子残留百分比的平均值的估计值为
3×0.05+4×0.10+5×0.15+6×0.35+7×0.20+8×0.15=6.00.
20.(本小题满分12分)(2019·湖北八校联考)某公司准备加大对一项产品的科技改造,经过充分的市场调研与模拟,得到x,y之间的一组数,其中x(单位:百万元)是科技改造的总投入,y(单位:百万元)是改造后的额外收益.
x
2
3
5
7
8
y
5
8
12
14
16
其中=5,=11,G(x,y)=2x+y是对当地GDP的增长贡献值.
(1)若从五组数据中任取两组,求至少有一组满足G(x,y)≥25的概率;
(2)对于表中数据,甲、乙两个同学给出的拟合直线方程为:
l1:y=2x+1,
l2:y=x-.
试用最小二乘法判断哪条直线的拟合程度更好.
解 (1)记五组数据分别为A,B,C,D,E,则由题意知后两组数据D,E满足条件.
从五组数据中任意取出两组有10种情况,即从ABCDE中取出两组有AB,AC,AD,AE,BC,BD,BE,CD,CE,DE,共有10种情况,
至少有一组满足条件的有AD,BD,CD,AE,BE,CE,DE,共有7种情况.
故至少有一组满足G(x,y)≥25的概率为.
(2)如表格:
x
2
3
5
7
8
y
5
8
12
14
16
y=2x+1
5
7
11
15
17
x
2
3
5
7
8
y
5
8
12
14
16
y=x-
3.5
6
11
16
18.5
Q1=02+12+12+12+12=4,
Q2=1.52+22+12+22+2.52=17.5,
Q1
21.(本小题满分12分)(2019·开封二模)如图是某台大型设备使用时间x(单位:年)与维护费用y(单位:千元)的散点图.
(1)根据散点图,求y关于x的回归方程=x+;
(2)如果维护费用超过120千元,就需要更换设备,那么根据(1)中模型的预测,估计该设备最多可以使用多少年?
附:①参考数据:=75, (xi-)(yi-)=63;②一组数据(x1,y1),(x2,y2),…,(xn,yn),其回归方程=x+的斜率和截距的最小二乘估计公式分别为:=,=-.
解 (1)由题意得,
==3.5,=75,
(xi-)2=(1-3.5)2+(2-3.5)2+(3-3.5)2+(4-3.5)2+(5-3.5)2+(6-3.5)2=17.5.
(xi-)(yi-)=63,
所以===3.6,
∴=-=75-3.6×3.5=62.4.
即y关于x的回归方程=3.6x+62.4.
(2)由题得3.6x+62.4≤120,解得x≤16.
所以估计该设备最多可以使用16年.
22.(本小题满分12分)(2019·山东六市二诊)为了弘扬传统文化,某市举办了“高中生诗词大赛”,现从全市参加比赛的学生中随机抽取1000人的成绩进行统计,得到如图所示的频率分布直方图,其中成绩的分组区间为[60,70),[70,80),[80,90),[90,100].
(1)求频率分布直方图中m的值;
(2)在所抽取的1000名学生中,用分层抽样的方法在成绩为[80,100]的学生中抽取了一个容量为5的样本,再从该样本中任意抽取2人,求2人的成绩均在区间[90,100]内的概率;
(3)若该市有10000名高中生参赛,根据此次统计结果,试估算成绩在区间[90,100]内的人数.
解 (1)依题意可知组距为10,
由(0.025+0.05+m+0.01)×10=1,解得m=0.015.
(2)抽取的这个容量为5的样本成绩在区间[80,90)的人数为5×=3人,记这3人为a,b,c.
成绩在区间[90,100]的人数为5×=2人,记这2人为d,e.
任意抽取2人的基本事件为ab,ac,ad,ae,bc,bd,be,cd,ce,de,共10个.
其中这2人的成绩均在区间[90,100]内的基本事件为de,共1个.
所以2人的成绩均在区间[90,100]内的概率为.
(3)因为10000×0.01×10=1000人,
所以估计成绩在区间[90,100]的人数为1000人.
相关资料
更多