【高考冲刺】2020年高考数学(理数) 概率与统计 大题(含答案解析)
展开【高考复习】2020年高考数学(理数) 概率与统计 大题
1.在中国,不仅是购物,而且从共享单车到医院挂号再到公共缴费,日常生活中几乎全部领域都支持手机下单和支付.出门不带现金的人数正在迅速增加.中国人民大学和法国调查公司益普索(Ipsos)合作,调查了腾讯服务的6 000名用户,从中随机抽取了60名,统计他们出门随身携带的现金(单位:元)如茎叶图所示,
规定:随身携带的现金在100元以下的为“淡定族”,其他为“非淡定族”.
(1)根据上述样本数据,列出2×2列联表,判断是否有75%的把握认为“淡定族”与“性别”有关?
(2)用样本估计总体,若从腾讯服务的用户中随机抽取3人,设这3人中“淡定族”的人数为随机变量ξ,求随机变量ξ的概率分布列及数学期望.
参考公式:K2=,其中n=a+b+c+d.
参考数据:
2.第四届世界互联网大会在浙江乌镇隆重召开,人工智能技术深受全世界人民的关注,不同年龄段的人群关注人工智能技术应用与发展的侧重点有明显的不同,某中等发达城市的市场咨询与投资民调机构在该市对市民关注人工智能技术应用与发展的侧重方向进行调查,随机抽取1 000名市民,将他们的年龄分成6段:[20,30),[30,40),[40,50),[50,60),[60,70),[70,80],并绘制了如图所示的频率分布直方图.
(1)求这1 000名市民年龄的平均数和中位数(同一组中的数据用该组区间的中点值作代表);
(2)调查发现年龄在[20,40)的市民侧重关注人工智能技术在学习与工作方面的应用与发展,其中关注智能办公的共有100人,将样本的频率视为总体的频率,从该市年龄在[20,40)的市民中随机抽取300人,请估计这300人中关注智能办公的人数;
(3)用样本的频率代替概率,现从该市随机抽取20名市民调查关注人工智能技术在养老服务方面的应用与发展的情况,其中有k名市民的年龄在[60,80]的概率为P(X=k),其中k=0,1,2,…,20,当P(X=k)最大时,求k的值.
3.某校高三年级有500名学生,一次考试的英语成绩服从正态分布N(100,17.52),数学成绩的频率分布直方图如下:
(1)如果成绩高于135分的为特别优秀,则本次考试英语、数学成绩特别优秀的学生大约各多少人?
(2)试问本次考试英语和数学的平均成绩哪个较高,并说明理由;
(3)如果英语和数学两科成绩都特别优秀的共有6人,从(1)中的这些学生中随机抽取3人,设3人中两科成绩都特别优秀的有ξ人,求ξ的分布列和数学期望.
参考公式及数据:若X~N(μ,σ2),则P(μ-σ<X≤μ+σ)=0.68,
P(μ-2σ<X≤μ+2σ)=0.96,P(μ-3σ<X≤μ+3σ)=0.99.
4.已知具有相关关系的两个变量x,y的几组数据如下表所示:
(1)请根据上表数据在网格纸中绘制散点图;
(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程=x+,并估计当x=20时y的值;
(3)将表格中的数据看作5个点的坐标,则从这5个点中随机抽取3个点,记落在直线2x-y-4=0右下方的点的个数为ξ,求ξ的分布列以及期望.
参考公式:=,=-.
5.某知名品牌汽车深受消费者喜爱,但价格昂贵.某汽车经销商推出A,B,C三种分期付款方式销售该品牌汽车,并对近期100位采用上述分期付款方式付款的客户进行统计分析,得到柱状图如图所示.已知从A,B,C三种分期付款销售中,该经销商每销售此品牌汽车1辆所获得的利润分别是1万元、2万元、3万元.现甲、乙两人从该汽车经销商处,采用上述分期付款方式各购买此品牌汽车一辆.以这100位客户所采用的分期付款方式的频率估计1位客户采用相应分期付款方式的概率.
(1)求甲、乙两人采用不同分期付款方式的概率;
(2)记X(单位:万元)为该汽车经销商从甲、乙两人购车中所获得的利润,求X的分布列与期望.
6.某电视厂家准备在元旦举行促销活动,现根据近七年的广告费与销售量的数据确定此次广告费支出.广告费支出x(万元)和销售量y(万元)的数据如下:
(1)若用线性回归模型拟合y与x的关系,求出y关于x的线性回归方程;
(2)若用y=c+d模型拟合y与x的关系,可得回归方程=1.63+0.99,经计算线性回归模型和该模型的R2分别约为0.75和0.88,请用R2说明选择哪个回归模型更好;
(3)已知利润z与x,y的关系为z=200y-x.根据(2)的结果回答下列问题:
①广告费x=20时,销售量及利润的预报值是多少?
②广告费x为何值时,利润的预报值最大?(精确到0.01)
参考公式:回归直线=+x的斜率和截距的最小二乘估计分别为
=,=-.参考数据:≈2.24.
7.通过随机询问100名性别不同的大学生是否爱好某项运动,得到如下2×2列联表:
(1)将题中的2×2列联表补充完整;
(2)能否有99%的把握认为是否爱好该项运动与性别有关?请说明理由;
(3)如果按性别进行分层抽样,从以上爱好该项运动的大学生中抽取6人组建“运动达人社”,现从“运动达人社”中选派3人参加某项校际挑战赛,记选出3人中的女大学生人数为X,求X的分布列和数学期望.
附:
K2=.
8.甲、乙两家外卖公司,其送餐员的日工资方案如下:甲公司,底薪80元,每单送餐员抽成4元;乙公司,无底薪,40单以内(含40单)的部分送餐员每单抽成6元,超出40单的部分送餐员每单抽成7元.假设同一公司的送餐员一天的送餐单数相同,现从这两家公司各随机选取一名送餐员,并分别记录其50天的送餐单数,得到如下频数表:
(1)现从记录甲公司的50天送餐单数中随机抽取3天的送餐单数,求这3天送餐单数都不小于40的概率;
(2)若将频率视为概率,回答下列两个问题:
①记乙公司送餐员日工资为X(单位:元),求X的分布列和数学期望E(X);
②小王打算到甲、乙两家公司中的一家应聘送餐员,如果仅从日工资的角度考虑,请利用所学的统计学知识为小王作出选择,并说明理由.
9.近年来“双十一”已成为中国电子商务行业的年度盛事,并且逐渐影响到国际电子商务行业.某商家为了准备2018年“双十一”的广告策略,随机调查了1 000名客户在2017年“双十一”前后10天内网购所花时间T(单位:时),并将调查结果绘制成如图所示的频率分布直方图.
由频率分布直方图可以认为,这10天网购所花的时间T近似服从N(μ,σ2),其中μ用样本平均值代替,σ2=0.24.
(1)计算μ,并利用该正态分布求P(1.51<T<2.49).
(2)利用由样本统计获得的正态分布估计整体,将这10天网购所花时间在(2,2.98)小时内的人定义为目标客户,对目标客户发送广告提醒.现若随机抽取10 000名客户,记X为这10 000人中目标客户的人数.
(ⅰ)求EX;
(ⅱ)问:10 000人中目标客户的人数X为何值的概率最大?
附:若随机变量Z服从正态分布N(μ,σ2),
则P(μ-σ<Z<μ+σ)=0.682 6,P(μ-2σ<Z<μ+2σ)=0.954 4,
P(μ-3σ<Z<μ+3σ)=0.997 4.≈0.49.
10.某学校为了丰富学生的课余生活,以班级为单位组织学生开展古诗词背诵比赛,随机抽取一首,背诵正确加10分,背诵错误减10分,且背诵结果只有“正确”和“错误”两种.其中某班级学生背诵正确的概率p=,记该班级完成n首背诵后的总得分为Sn.
(1)求S6=20且Si≥0(i=1,2,3)的概率;
(2)记ξ=|S5|,求ξ的分布列及数学期望.
答案解析
1.解:
(1)依题意可得2×2列联表如下:
K2=≈1.429>1.323,
故有75%的把握认为“淡定族”与“性别”有关.
(2)用样本估计总体,用户中为“淡定族”的概率为=,
ξ的可能取值为0,1,2,3,由题意,得到ξ~B,
P(ξ=k)=Ck3-k,k=0,1,2,3,
随机变量ξ的分布列为
故随机变量ξ的数学期望E(ξ)=0×+1×+2×+3×==.
2.解:
(1)由频率分布直方图可知,抽取的1 000名市民年龄的平均数
=25×0.05+35×0.1+45×0.2+55×0.3+65×0.25+75×0.1=54(岁).
设1 000名市民年龄的中位数为x,
则0.05+0.1+0.2+0.03×(x-50)=0.5,解得x=55,
所以这1 000名市民年龄的平均数为54,中位数为55.
(2)由频率分布直方图可知,这1 000名市民中年龄在[20,40)的市民共有
(0.05+0.10)×1 000=150人,
所以关注智能办公的频率为=,
则从该市年龄在[20,40)的市民中随机抽取300人,
这300人中关注智能办公的人数为300×=200.
故估计这300人中关注智能办公的人数为200.
(3)设在抽取的20名市民中,年龄在[60,80]的人数为X,X服从二项分布,
由频率分布直方图可知,年龄在[60,80]的频率为(0.025+0.010)×10=0.35,
所以X~B(20,0.35),所以P(X=k)=C0.35k(1-0.35)20-k,k=0,1,2,…,20.
设t===,k=1,2,…,20.
若t>1,则k<7.35,P(X=k-1)<P(X=k);
若t<1,则k>7.35,P(X=k-1)>P(X=k).
所以当k=7时,P(X=k)最大,
即当P(X=k)最大时,k的值为7.
3.解:
(1)因为英语成绩服从正态分布N(100,17.52),
所以英语成绩特别优秀的概率P1=P(X≥135)=(1-0.96)×=0.02,
由频率估计概率,得数学成绩特别优秀的概率P2=0.001 6×20×=0.024,
所以英语成绩特别优秀的学生大约有500×0.02=10(人),
数学成绩特别优秀的学生大约有500×0.024=12(人).
(2)本次考试英语的平均成绩为100分,
数学的平均成绩为60×0.16+80×0.168+100×0.48+120×0.16+140×0.032=94.72(分),
因为94.72<100,所以本次考试英语的平均成绩较高.
(3)英语和数学成绩都特别优秀的有6人,则单科成绩特别优秀的有10人,
ξ可取的值有0,1,2,3,
所以P(ξ=0)==,P(ξ=1)==,P(ξ=2)==,P(ξ=3)==,
故ξ的分布列为
E(ξ)=0×+1×+2×+3×=.
4.解:
(1)散点图如图所示:
(2)依题意,=×(2+4+6+8+10)=6,=×(3+6+7+10+12)=7.6,
=4+16+36+64+100=220,iyi=6+24+42+80+120=272,
====1.1,∴=7.6-1.1×6=1,
∴线性回归方程为=1.1x+1,故当x=20时,y=23.
(3)可以判断,落在直线2x-y-4=0右下方的点满足2x-y-4>0,
故符合条件的点的坐标为(6,7),(8,10),(10,12),故ξ的所有可能取值为1,2,3,
P(ξ=1)==,P(ξ=2)===,P(ξ=3)==,
故ξ的分布列为
故E(ξ)=1×+2×+3×==.
5.解:
(1)设“采用A种分期付款方式购车”为事件A,“采用B种分期付款方式购车”为事件B,
“采用C种分期付款方式购车”为事件C,由柱状图得,
P(A)==0.35,P(B)==0.45,P(C)==0.2,
∴甲、乙两人采用不同分期付款方式的概率
P=1-(P(A)·P(A)+P(B)·P(B)+P(C)·P(C))=0.635.
(2)由题意知,X的所有可能取值为2,3,4,5,6,
P(X=2)=P(A)P(A)=0.35×0.35=0.122 5,
P(X=3)=P(A)P(B)+P(B)P(A)=0.35×0.45+0.45×0.35=0.315,
P(X=4)=P(A)P(C)+P(B)P(B)+P(C)P(A)=0.35×0.2+0.45×0.45+0.2×0.35=0.342 5,
P(X=5)=P(B)P(C)+P(C)P(B)=0.45×0.2+0.2×0.45=0.18,
P(X=6)=P(C)P(C)=0.2×0.2=0.04.
∴X的分布列为
E(X)=0.122 5×2+0.315×3+0.342 5×4+0.18×5+0.04×6=3.7.
6.解:
(1)∵=8,=4.2,iyi=279.4,=708,
∴===0.17,=-=4.2-0.17×8=2.84,
∴y关于x的线性回归方程为=0.17x+2.84.
(2)∵0.75<0.88且R2越大,反映残差平方和越小,模型的拟合效果越好,
∴选用=1.63+0.99更好.
(3)由(2)知,
①当x=20时,销售量的预报值=1.63+0.99≈6.07(万台),
利润的预报值z=200×6.07-20≈1 194(万元).
②z=200(1.63+0.99)-x=-x+198+326=-()2+198+326=-(-99)2+10 127,
∴当=99,即x=9 801时,利润的预报值最大,
故广告费为9 801万元时,利润的预报值最大.
7.解:(1)题中的2×2列联表补充如下:
(2)K2=≈8.25>6.635,
所以有99%的把握认为是否爱好该项运动与性别有关.
(3)由题意,抽取6人中包括男生4名,女生2名,X的取值为0,1,2,
则P(X=0)==,P(X=1)==,P(X=2)==,
故X的分布列为
E(X)=0×+1×+2×=1.
8.解:
(1)记抽取的3天送餐单数都不小于40为事件M,
则P(M)==.
(2)①设乙公司送餐员的送餐单数为a,
当a=38时,X=38×6=228,
当a=39时,X=39×6=234,
当a=40时,X=40×6=240,
当a=41时,X=40×6+1×7=247,
当a=42时,X=40×6+2×7=254.
所以X的所有可能取值为228,234,240,247,254.
故X的分布列为
所以E(X)=228×+234×+240×+247×+254×=241.8.
②依题意,甲公司送餐员的日平均送餐单数为38×0.2+39×0.3+40×0.2+41×0.2+42×0.1=39.7,
所以甲公司送餐员的日平均工资为80+4×39.7=238.8元.
由①得乙公司送餐员的日平均工资为241.8元.
因为238.8<241.8,所以推荐小王去乙公司应聘.
9.解:
(1)μ=0.4×(0.050×0.8+0.225×1.2+0.550×1.6+0.825×2.0+0.600×2.4+0.200×2.8+0.050×3.2)=2,从而T服从N(2,0.24),
又σ=≈0.49,从而P(1.51<T<2.49)=P(μ-σ<T<μ+σ)=0.682 6.
(2)(ⅰ)任意抽取1名客户,
该客户是目标客户的概率为P(2<T<2.98)=P(μ<T<μ+2σ)
=P(μ-2σ<T<μ+2σ)=×0.954 4=0.477 2.
由题意知X服从B(10 000,0.477 2),所以EX=10 000×0.477 2=4 772.
(ⅱ)X服从B(10 000,0.477 2),
P(X=k)=C0.477 2k(1-0.477 2)10 000-k=C0.477 2k·0.522 810 000-k(k=0,1,2,…,10 000).
设当X=k(k≥1,k∈N)时概率最大,
则有得
解得k=4 772.
故10 000人中目标客户的人数为4 772的概率最大.
10.解:
(1)当S6=20时,即背诵6首后,正确的有4首,错误的有2首.
由Si≥0(i=1,2,3)可知,若第一首和第二首背诵正确,则其余4首可任意背诵正确2首;
若第一首背诵正确,第二首背诵错误,第三首背诵正确,则其余3首可任意背诵正确2首.
则所求的概率P=2×C2×2+×××C2×=.
(2)由题意知ξ=|S5|的所有可能的取值为10,30,50,又p=,
∴P(ξ=10)=C3×2+C2×3=,P(ξ=30)=C4×1+C1×4=,
P(ξ=50)=C5×0+C0×5=,
∴ξ的分布列为
∴E(ξ)=10×+30×+50×=.