还剩12页未读,
继续阅读
所属成套资源:2021江苏高考数学苏教版一轮复习讲义
成套系列资料,整套一键下载
2021版江苏高考数学一轮复习讲义:第10章第8节 概率与统计的综合问题
展开
第八节 概率与统计的综合问题
[最新考纲] 能从研究对象中获取数据,会用数学方法对数据进行整理、分析和推断,构建模型等.
考点1 离散型随机变量的均值与方差
离散型随机变量的均值和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如两点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的均值和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率的对应.
(2019·广州一模)某商场以分期付款方式销售某商品,根据以往资料统计,顾客购买该商品选择分期付款的期数ξ的分布列为
ξ
2
3
4
P
0.4
a
b
其中0<a<1,0<b<1.
(1)求购买该商品的3位顾客中,恰有2位选择分2期付款的概率;
(2)商场销售一件该商品,若顾客选择分2期付款,则商场获得的利润为200元;若顾客选择分3期付款,则商场获得的利润为250元;若顾客选择分4期付款,则商场获得的利润为300元.商场销售两件该商品所获得的利润记为X(单位:元).
①求X的分布列;
②若P(X≤500)≥0.8,求X的数学期望EX的最大值.
[解](1)设购买该商品的3位顾客中,选择分2期付款的人数为η,依题意得η~B(3,0.4),
则P(η=2)=C(0.4)2×(1-0.4)=0.288,
∴购买该商品的3位顾客中,恰有2位选择分2期付款的概率为0.288.
(2)①依题意X的取值分别为400,450,500,550,600,
P(X=400)=0.4×0.4=0.16,
P(X=450)=2×0.4a=0.8a,
P(X=500)=2×0.4b+a2=0.8b+a2,
P(X=550)=2ab,
P(X=600)=b2.
∴X的分布列为:
X
400
450
500
550
600
P
0.16
0.8a
0.8b+a2
2ab
b2
②P(X≤500)=P(X+400)+P(X=450)+P(X=500)
=0.16+0.8(a+b)+a2,
根据0.4+a+b=1,得a+b=0.6,∴b=0.6-a,
∵P(X≤500)≥0.8,∴0.16+0.48+a2≥0.8,
解得a≥0.4或a≤-0.4,
∵a>0,∴a≥0.4,
∵b>0,∴0.6-a>0,解得a<0.6,
∴a∈[0.4,0.6),
E(X)=400×0.16+450×0.8a+500(0.8b+a2)+1 100ab+600b2=520-100a,
当a=0.4时,E(X)的最大值为480,
∴X的数学期望E(X)的最大值为480.
本例融概率、分布列、函数于一体,体现了高考命题的最新动向,求解时可先借助分布列的性质及题设条件“P(X≤500)≥0.8”探求得到参数a的范围,然后借助数学期望公式建立关于参数a的函数关系式,并通过二次函数求得数学期望EX的最大值.
(2019·九江二模)某企业打算处理一批产品,这些产品每箱100件,以箱为单位销售.已知这批产品中每箱出现的废品率只有两种可能10%或者20%,两种可能对应的概率均为0.5.假设该产品正品每件市场价格为100元,废品不值钱.现处理价格为每箱8 400元,遇到废品不予更换.以一箱产品中正品的价格期望值作为决策依据.
(1)在不开箱检验的情况下,判断是否可以购买;
(2)现允许开箱,有放回地随机从一箱中抽取2件产品进行检验.
①若此箱出现的废品率为20%,记抽到的废品数为X,求X的分布列和数学期望;
②若已发现在抽取检验的2件产品中,其中恰有一件是废品,判断是否可以购买.
[解](1)在不开箱检验的情况下,一箱产品中正品的价格期望值为:
Eξ=100×(1-0.2)×100×0.5+100×(1-0.1)×100×0.5=8500>8400,
∴在不开箱检验的情况下,可以购买.
(2)①X的可能取值为0,1,2,
P(X=0)=C×0·20×0·82=0.64,
P(X=1)=C×0·21×0·81=0.32,
P(X=2)=C×0·82×0·20=0.04,
∴X的分布列为:
X
0
1
2
P
0.64
0.32
0.04
E(X)=0×0.64+1×0.32+2×0.04=0.4.
②设事件A:发现在抽取检验的2件产品中,其中恰有一件是废品,则
P(A)=C×0.2×0.8×0.5+C×0.1×0.9×0.5=0.25,
一箱产品中,设正品的价格的期望值为η,则η=8 000,9 000,
事件B1:抽取的废品率为20%的一箱,则,
P(η=8000)=P(B1|A)===0.64,
事件B2:抽取的废品率为10%的一箱,则
P(η=9000)=P(B2|A)===0.36,
∴E(η)=8000×0.64+9000×0.36=8360<8400,
∴已发现在抽取检验的2件产品中,其中恰有一件是废品,不可以购买.
考点2 概率与统计的综合应用
概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.
从某技术公司开发的某种产品中随机抽取200件,测量这些产品的一项质量指标值(记为Z),由测量结果得如下频率分布直方图:
(1)公司规定:当Z≥95时,产品为正品;当Z<95时,产品为次品.公司每生产一件这种产品,若是正品,则盈利90元;若是次品,则亏损30元.记ξ为生产一件这种产品的利润,求随机变量ξ的分布列和数学期望;
(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2(同一组中的数据用该区间的中点值作代表).
①利用该正态分布,求P(87.8
②某客户从该公司购买了500件这种产品,记X表示这500件产品中该项质量指标值位于区间(87.8,112.2)内的产品件数,利用①的结果,求E(X).
附:≈12.2.
若Z~N(μ,σ2),则P(μ-σ
[解](1)由频率估计概率,产品为正品的概率为(0.033+0.024+0.008+0.002)×10=0.67,
所以随机变量ξ的分布列为
ξ
90
-30
P
0.67
0.33
所以E(ξ)=90×0.67+(-30)×0.33=50.4.
(2)由频率分布直方图知,抽取产品的该项质量指标值的样本平均数和样本方差s2分别为
=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150.
①因为Z~N(100,150),
从而P(87.8
②由①知,一件产品中该项质量指标值位于区间(87.8,112.2)内的概率为0.6827,依题意知X~B(500,0.682 7),所以E(X)=500×0.682 7=341.35.
本题以统计图表为载体,将正态分布、二项分布、频率分布直方图巧妙的融合在一起,体现了知识的整合性与交汇融合性,搞清这些统计图表的含义,掌握好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算是解决问题的关键.
经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获得利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.
(1)将T表示为X的函数;
(2)根据直方图估计利润T不少于57 000元的概率;
(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的均值.
[解](1)当X∈[100,130)时,
T=500X-300(130-X)=800X-39 000.
当X∈[130,150]时,T=500×130=65 000.
所以T=
(2)由(1)知利润T不少于57 000元当且仅当120≤X≤150.
由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57 000元的概率的估计值为0.7.
(3)依题意可得T的分布列为
T
45 000
53 000
61 000
65 000
P
0.1
0.2
0.3
0.4
所以E(T)=45 000×0.1+53 000×0.2+61 000×0.3+65 000×0.4=59 400.
考点3 概率与统计案例的综合应用
概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特征、独立性检验等基础知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.
(2019·武汉二模)某市房管局为了了解该市市民2018年1月至2019年1月期间购买二手房情况,首先随机抽样其中200名购房者,并对其购房面积m(单位:平方米,60≤m≤130)进行了一次调查统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年1月至2019年1月期间当月在售二手房均价y(单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年1月至2019年1月)
图1
图2
(1)试估计该市市民的平均购房面积;
(2)从该市2018年1月至2019年1月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X,求X的分布列与数学期望;
(3)根据散点图选择=+和=+ln x两个模型进行拟合,经过数据处理得到两个回归方程,分别为=0.9369+0.0285和=0.9554+0.0306ln x,并得到一些统计量的值,如表所示:
请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年6月份的二手房购房均价(精确到0.001).
参考数据:ln 2≈0.69,ln 3≈1.10,ln 7≈2.83,ln 19≈2.94,≈1.41,≈1.73,≈4.12,≈4.36.
参考公式:R2=1-.
[解](1)=65×0.05+75×0.1+85×0.2+95×0.25+105×0.2+115×0.15+125×0.05=96.
(2)每一位市民购房面积不低于100平方米的概率为0.20+0.15+0.05=0.4,
∴X~B(3,0.4),
∴P(X=k)=C×0·4k×0·63-k,(k=0,1,2,3),
P(X=0)=0.63=0.216,
P(X=1)=C×0.4×0·62=0.432,
P(X=2)=C×0·42×0.6=0.288,
P(X=3)=0.43=0.064,
∴X的分布列为:
X
0
1
2
3
P
0.216
0.432
0.288
0.064
∴E(X)=3×0.4=1.2.
(3)设模型=0.936 9+0.028 5和=0.955 4+0.030 6ln x的相关指数分别为R,R,
则R = 1-,R = 1-,
∴R < R,
∴模型=0.955 4+0.030 6ln x的拟合效果更好,
2019年6月份对应的x=18,
∴=0.955 4+0.030 6ln18=0.955 4+0.030 6(ln 2+2ln 3)≈1.044万元/平方米.
在两个变量的回归分析中要注意以下2点
(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算.
(2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系.
(2019·铁东区校级三模)一家大型超市委托某机构调查该超市的顾客使用移动支付的情况.调查人员从年龄在20至60的顾客中,随机抽取了200人,调查结果如图:
(1)为推广移动支付,超市准备对使用移动支付的每位顾客赠送1个环保购物袋.若某日该超市预计有10000人购物,试根据上述数据估计,该超市当天应准备多少个环保购物袋?
(2)填写下面列联表,并根据列联表判断是否有99.9%的把握认为使用移动支付与年龄有关?
年龄<40
年龄≥40
小计
使用移动支付
不使用移动支付
小计
200
(3)现从该超市这200位顾客年龄在[55,60]的人中,随机抽取2人,记这两人中使用移动支付的顾客为X人,求X的分布列.
附:k2=
P(K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
[解](1)根据图中数据,由频率估计概率,根据已知可预计该超市顾客使用移动支付的概率为:
=,
所以超市当天应准备的环保购物袋个数为:10 000×=6 250.
(2)由(1)知列联表为:
年龄<40
年龄≥40
小计
使用移动支付
85
40
125
不使用移动支付
10
65
75
小计
95
105
200
假设移动支付与年龄无关,则
K2=≈56.17,
∵56.17>10.828,所以有99.9%的把握认为使用移动支付与年龄有关.
(3)X可能取值为0,1,2,
P(X=0)==,
P(X=1)==,
P(X=2)==,
所以X的分布列为:
X
0
1
2
P
课外素养提升⑨ 数据分析——数据统计与建模求解
数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据,整理数据,提取信息,构建模型对信息进行分析、推断,获得结论.在数据分析核心素养的形成过程中,学生能够提升数据处理的能力,增强基于数据表达现实问题的意识,养成通过数据思考问题的习惯,积极依托数据探索事物本质、关联和规律的活动经验.
概率与频率分布的综合应用
【例1】 (2019·济宁一模)某学校为了了解全校学生的体重情况,从全校学生中随机抽取了100人的体重数据,结果这100人的体重全部介于45公斤到75公斤之间,现将结果按如下方式分为6组:第一组[45,50),第二组[50,55),…,第六组[70,75),得到如图所示的频率分布直方图,并发现这100人中,其体重低于55公斤的有15人,这15人体重在(40,50)公斤的有2人,[50,55)公斤的有13人,以样本的频率作为总体的概率.
(1)求频率分布直方图中a,b,c的值;
(2)从全校学生中随机抽取3名学生,记X为体重在[55,65)的人数,求X的概率分布列和数学期望;
(3)由频率分布直方图可以认为,该校学生的体重ξ近似服从正态分布N(μ,σ2),其中μ=60,σ2=25.若P(μ-2σ≤ξ<μ+2σ)>0.9545,则认为该校学生的体重是正常的.试判断该校学生的体重是否正常?并说明理由.
[解](1)由题知,100名样本中体重低于50公斤的有2人,
用样本的频率估计总体的概率,可得体重低于50公斤的概率为=0.02,则a==0.004,
在[50,55)上有13人,该组的频率为0.13,则b==0.026,
所以2c==0.14,即c=0.07.
(2)用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在[55,65)的概率为0.07×10=0.7,随机抽取3人,相当于三次独立重复试验,随机变量X服从二项分布B(3,0.7),
则P(X=0)=C0.700.33=0.027,
P(X=1)=C0.710.32=0.189,
P(X=2)=C0.720.31=0.441,
P(X=3)=C0.730.30=0.343,
所以,X的概率分布列为:
X
0
1
2
3
P
0.027
0.189
0.441
0.343
E(X)=3×0.7=2.1.
(3)由N(60,25)得σ=5
由图(1)知P(μ-2σ≤ξ<μ+2σ)=P(50≤ξ<70)=0.96>0.954 5.所以可以认为该校学生的体重是正常的.
[评析] 本题以学生体重情况为背景,设计概率与统计、正态分布的综合应用.体现了数学建模(用频率估计概率、正态分布)、数学运算(求平均数、方差、求概率)、数据分析、逻辑推理(以直方图中求平均数方差,由正态分布求概率及期望)的学科素养;培养了统计意识,经历“收集数据—整理数据—分析数据—作出推断”的全过程.
概率与统计案例的综合
【例2】 为了解当代中学生喜欢文科、理科的情况,某中学一课外活动小组在学校高一年级文、理分科时进行了问卷调查,问卷共100道题,每题1分,总分100分,该课外活动小组随机抽取了200名学生的问卷成绩(单位:分)进行统计,将数据按照[0,20),[20,40),[40,60),[60,80),[80,100]分成5组,绘制的频率分布直方图如图所示,若将不低于60分的称为“文科意向”学生,低于60分的称为“理科意向”学生.
(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为是否为“文科意向”与性别有关?
理科意向
文科意向
总计
男
110
女
50
总计
(2)将频率视为概率,现在从该校高一学生中用随机抽样的方法每次抽取1人,共抽取3次,记被抽取的3人中“文科意向”的人数为ξ,若每次抽取的结果是相互独立的,求ξ的分布列、期望E(ξ)和方差D(ξ).
参考公式:K2=,其中n=a+b+c+d.
参考临界值:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
[解](1)由频率分布直方图可得分数在[60,80)之间的学生人数为0.012 5×20×200=50,在[80,100]之间的学生人数为0.007 5×20×200=30,所以低于60分的学生人数为120.因此列联表为
理科意向
文科意向
总计
男
80
30
110
女
40
50
90
总计
120
80
200
又K2=≈16.498>6.635,
所以有99%的把握认为是否为“文科意向”与性别有关.
(2)易知从该校高一学生中随机抽取1人,则该人为“文科意向”的概率为P==.
依题意知ξ~B,
所以P(ξ=i)=C (i=0,1,2,3),
所以ξ的分布列为
ξ
0
1
2
3
P
所以期望E(ξ)=np=,方差D(ξ)=np(1-p)=.
[评析] 此类题目虽然涉及的知识点较多,但每个知识点考查程度相对较浅,考查深度有限,所以解决此类问题,最主要的是正确掌握概率与统计案例的基本知识,并能对这些知识点进行有效的融合,把统计图表中的量转化为概率及分布列求解中的有用的量是解决此类问题的关键所在.
[最新考纲] 能从研究对象中获取数据,会用数学方法对数据进行整理、分析和推断,构建模型等.
考点1 离散型随机变量的均值与方差
离散型随机变量的均值和方差的求解,一般分两步:一是定型,即先判断随机变量的分布是特殊类型,还是一般类型,如两点分布、二项分布、超几何分布等属于特殊类型;二是定性,对于特殊类型的均值和方差可以直接代入相应公式求解,而对于一般类型的随机变量,应先求其分布列然后代入相应公式计算,注意离散型随机变量的取值与概率的对应.
(2019·广州一模)某商场以分期付款方式销售某商品,根据以往资料统计,顾客购买该商品选择分期付款的期数ξ的分布列为
ξ
2
3
4
P
0.4
a
b
其中0<a<1,0<b<1.
(1)求购买该商品的3位顾客中,恰有2位选择分2期付款的概率;
(2)商场销售一件该商品,若顾客选择分2期付款,则商场获得的利润为200元;若顾客选择分3期付款,则商场获得的利润为250元;若顾客选择分4期付款,则商场获得的利润为300元.商场销售两件该商品所获得的利润记为X(单位:元).
①求X的分布列;
②若P(X≤500)≥0.8,求X的数学期望EX的最大值.
[解](1)设购买该商品的3位顾客中,选择分2期付款的人数为η,依题意得η~B(3,0.4),
则P(η=2)=C(0.4)2×(1-0.4)=0.288,
∴购买该商品的3位顾客中,恰有2位选择分2期付款的概率为0.288.
(2)①依题意X的取值分别为400,450,500,550,600,
P(X=400)=0.4×0.4=0.16,
P(X=450)=2×0.4a=0.8a,
P(X=500)=2×0.4b+a2=0.8b+a2,
P(X=550)=2ab,
P(X=600)=b2.
∴X的分布列为:
X
400
450
500
550
600
P
0.16
0.8a
0.8b+a2
2ab
b2
②P(X≤500)=P(X+400)+P(X=450)+P(X=500)
=0.16+0.8(a+b)+a2,
根据0.4+a+b=1,得a+b=0.6,∴b=0.6-a,
∵P(X≤500)≥0.8,∴0.16+0.48+a2≥0.8,
解得a≥0.4或a≤-0.4,
∵a>0,∴a≥0.4,
∵b>0,∴0.6-a>0,解得a<0.6,
∴a∈[0.4,0.6),
E(X)=400×0.16+450×0.8a+500(0.8b+a2)+1 100ab+600b2=520-100a,
当a=0.4时,E(X)的最大值为480,
∴X的数学期望E(X)的最大值为480.
本例融概率、分布列、函数于一体,体现了高考命题的最新动向,求解时可先借助分布列的性质及题设条件“P(X≤500)≥0.8”探求得到参数a的范围,然后借助数学期望公式建立关于参数a的函数关系式,并通过二次函数求得数学期望EX的最大值.
(2019·九江二模)某企业打算处理一批产品,这些产品每箱100件,以箱为单位销售.已知这批产品中每箱出现的废品率只有两种可能10%或者20%,两种可能对应的概率均为0.5.假设该产品正品每件市场价格为100元,废品不值钱.现处理价格为每箱8 400元,遇到废品不予更换.以一箱产品中正品的价格期望值作为决策依据.
(1)在不开箱检验的情况下,判断是否可以购买;
(2)现允许开箱,有放回地随机从一箱中抽取2件产品进行检验.
①若此箱出现的废品率为20%,记抽到的废品数为X,求X的分布列和数学期望;
②若已发现在抽取检验的2件产品中,其中恰有一件是废品,判断是否可以购买.
[解](1)在不开箱检验的情况下,一箱产品中正品的价格期望值为:
Eξ=100×(1-0.2)×100×0.5+100×(1-0.1)×100×0.5=8500>8400,
∴在不开箱检验的情况下,可以购买.
(2)①X的可能取值为0,1,2,
P(X=0)=C×0·20×0·82=0.64,
P(X=1)=C×0·21×0·81=0.32,
P(X=2)=C×0·82×0·20=0.04,
∴X的分布列为:
X
0
1
2
P
0.64
0.32
0.04
E(X)=0×0.64+1×0.32+2×0.04=0.4.
②设事件A:发现在抽取检验的2件产品中,其中恰有一件是废品,则
P(A)=C×0.2×0.8×0.5+C×0.1×0.9×0.5=0.25,
一箱产品中,设正品的价格的期望值为η,则η=8 000,9 000,
事件B1:抽取的废品率为20%的一箱,则,
P(η=8000)=P(B1|A)===0.64,
事件B2:抽取的废品率为10%的一箱,则
P(η=9000)=P(B2|A)===0.36,
∴E(η)=8000×0.64+9000×0.36=8360<8400,
∴已发现在抽取检验的2件产品中,其中恰有一件是废品,不可以购买.
考点2 概率与统计的综合应用
概率与统计作为考查考生应用意识的重要载体,已成为近几年高考的一大亮点和热点.它与其他知识融合、渗透,情境新颖,充分体现了概率与统计的工具性和交汇性.统计以考查抽样方法、样本的频率分布、样本特征数的计算为主,概率以考查概率计算为主,往往和实际问题相结合,要注意理解实际问题的意义,使之和相应的概率计算对应起来,只有这样才能有效地解决问题.
从某技术公司开发的某种产品中随机抽取200件,测量这些产品的一项质量指标值(记为Z),由测量结果得如下频率分布直方图:
(1)公司规定:当Z≥95时,产品为正品;当Z<95时,产品为次品.公司每生产一件这种产品,若是正品,则盈利90元;若是次品,则亏损30元.记ξ为生产一件这种产品的利润,求随机变量ξ的分布列和数学期望;
(2)由频率分布直方图可以认为,Z服从正态分布N(μ,σ2),其中μ近似为样本平均数,σ2近似为样本方差s2(同一组中的数据用该区间的中点值作代表).
①利用该正态分布,求P(87.8
附:≈12.2.
若Z~N(μ,σ2),则P(μ-σ
所以随机变量ξ的分布列为
ξ
90
-30
P
0.67
0.33
所以E(ξ)=90×0.67+(-30)×0.33=50.4.
(2)由频率分布直方图知,抽取产品的该项质量指标值的样本平均数和样本方差s2分别为
=70×0.02+80×0.09+90×0.22+100×0.33+110×0.24+120×0.08+130×0.02=100,
s2=(-30)2×0.02+(-20)2×0.09+(-10)2×0.22+02×0.33+102×0.24+202×0.08+302×0.02=150.
①因为Z~N(100,150),
从而P(87.8
本题以统计图表为载体,将正态分布、二项分布、频率分布直方图巧妙的融合在一起,体现了知识的整合性与交汇融合性,搞清这些统计图表的含义,掌握好样本特征数的计数方法、各类概率的计算方法及均值与方差的运算是解决问题的关键.
经销商经销某种农产品,在一个销售季度内,每售出1 t该产品获得利润500元,未售出的产品,每1 t亏损300元.根据历史资料,得到销售季度内市场需求量的频率分布直方图,如图所示.经销商为下一个销售季度购进了130 t该农产品.以X(单位:t,100≤X≤150)表示下一个销售季度内的市场需求量,T(单位:元)表示下一个销售季度内经销该农产品的利润.
(1)将T表示为X的函数;
(2)根据直方图估计利润T不少于57 000元的概率;
(3)在直方图的需求量分组中,以各组的区间中点值代表该组的各个值,需求量落入该区间的频率作为需求量取该区间中点值的概率(例如:若需求量X∈[100,110),则取X=105,且X=105的概率等于需求量落入[100,110)的频率),求T的均值.
[解](1)当X∈[100,130)时,
T=500X-300(130-X)=800X-39 000.
当X∈[130,150]时,T=500×130=65 000.
所以T=
(2)由(1)知利润T不少于57 000元当且仅当120≤X≤150.
由直方图知需求量X∈[120,150]的频率为0.7,所以下一个销售季度内的利润T不少于57 000元的概率的估计值为0.7.
(3)依题意可得T的分布列为
T
45 000
53 000
61 000
65 000
P
0.1
0.2
0.3
0.4
所以E(T)=45 000×0.1+53 000×0.2+61 000×0.3+65 000×0.4=59 400.
考点3 概率与统计案例的综合应用
概率与统计案例的综合应用常涉及相互独立事件同时发生的概率、频率分布直方图的识别与应用、数字特征、独立性检验等基础知识,考查学生的阅读理解能力、数据处理能力、运算求解能力及应用意识.
(2019·武汉二模)某市房管局为了了解该市市民2018年1月至2019年1月期间购买二手房情况,首先随机抽样其中200名购房者,并对其购房面积m(单位:平方米,60≤m≤130)进行了一次调查统计,制成了如图1所示的频率分布直方图,接着调查了该市2018年1月至2019年1月期间当月在售二手房均价y(单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1-13分别对应2018年1月至2019年1月)
图1
图2
(1)试估计该市市民的平均购房面积;
(2)从该市2018年1月至2019年1月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X,求X的分布列与数学期望;
(3)根据散点图选择=+和=+ln x两个模型进行拟合,经过数据处理得到两个回归方程,分别为=0.9369+0.0285和=0.9554+0.0306ln x,并得到一些统计量的值,如表所示:
请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2019年6月份的二手房购房均价(精确到0.001).
参考数据:ln 2≈0.69,ln 3≈1.10,ln 7≈2.83,ln 19≈2.94,≈1.41,≈1.73,≈4.12,≈4.36.
参考公式:R2=1-.
[解](1)=65×0.05+75×0.1+85×0.2+95×0.25+105×0.2+115×0.15+125×0.05=96.
(2)每一位市民购房面积不低于100平方米的概率为0.20+0.15+0.05=0.4,
∴X~B(3,0.4),
∴P(X=k)=C×0·4k×0·63-k,(k=0,1,2,3),
P(X=0)=0.63=0.216,
P(X=1)=C×0.4×0·62=0.432,
P(X=2)=C×0·42×0.6=0.288,
P(X=3)=0.43=0.064,
∴X的分布列为:
X
0
1
2
3
P
0.216
0.432
0.288
0.064
∴E(X)=3×0.4=1.2.
(3)设模型=0.936 9+0.028 5和=0.955 4+0.030 6ln x的相关指数分别为R,R,
则R = 1-,R = 1-,
∴R < R,
∴模型=0.955 4+0.030 6ln x的拟合效果更好,
2019年6月份对应的x=18,
∴=0.955 4+0.030 6ln18=0.955 4+0.030 6(ln 2+2ln 3)≈1.044万元/平方米.
在两个变量的回归分析中要注意以下2点
(1)求回归直线方程要充分利用已知数据,合理利用公式减少运算.
(2)借助散点图,观察两个变量之间的关系.若不是线性关系,则需要根据相关知识转化为线性关系.
(2019·铁东区校级三模)一家大型超市委托某机构调查该超市的顾客使用移动支付的情况.调查人员从年龄在20至60的顾客中,随机抽取了200人,调查结果如图:
(1)为推广移动支付,超市准备对使用移动支付的每位顾客赠送1个环保购物袋.若某日该超市预计有10000人购物,试根据上述数据估计,该超市当天应准备多少个环保购物袋?
(2)填写下面列联表,并根据列联表判断是否有99.9%的把握认为使用移动支付与年龄有关?
年龄<40
年龄≥40
小计
使用移动支付
不使用移动支付
小计
200
(3)现从该超市这200位顾客年龄在[55,60]的人中,随机抽取2人,记这两人中使用移动支付的顾客为X人,求X的分布列.
附:k2=
P(K2≥k)
0.100
0.050
0.010
0.001
k
2.706
3.841
6.635
10.828
[解](1)根据图中数据,由频率估计概率,根据已知可预计该超市顾客使用移动支付的概率为:
=,
所以超市当天应准备的环保购物袋个数为:10 000×=6 250.
(2)由(1)知列联表为:
年龄<40
年龄≥40
小计
使用移动支付
85
40
125
不使用移动支付
10
65
75
小计
95
105
200
假设移动支付与年龄无关,则
K2=≈56.17,
∵56.17>10.828,所以有99.9%的把握认为使用移动支付与年龄有关.
(3)X可能取值为0,1,2,
P(X=0)==,
P(X=1)==,
P(X=2)==,
所以X的分布列为:
X
0
1
2
P
课外素养提升⑨ 数据分析——数据统计与建模求解
数据分析是指针对研究对象获得相关数据,运用统计方法对数据中的有用信息进行分析和推断,形成知识的过程.主要包括:收集数据,整理数据,提取信息,构建模型对信息进行分析、推断,获得结论.在数据分析核心素养的形成过程中,学生能够提升数据处理的能力,增强基于数据表达现实问题的意识,养成通过数据思考问题的习惯,积极依托数据探索事物本质、关联和规律的活动经验.
概率与频率分布的综合应用
【例1】 (2019·济宁一模)某学校为了了解全校学生的体重情况,从全校学生中随机抽取了100人的体重数据,结果这100人的体重全部介于45公斤到75公斤之间,现将结果按如下方式分为6组:第一组[45,50),第二组[50,55),…,第六组[70,75),得到如图所示的频率分布直方图,并发现这100人中,其体重低于55公斤的有15人,这15人体重在(40,50)公斤的有2人,[50,55)公斤的有13人,以样本的频率作为总体的概率.
(1)求频率分布直方图中a,b,c的值;
(2)从全校学生中随机抽取3名学生,记X为体重在[55,65)的人数,求X的概率分布列和数学期望;
(3)由频率分布直方图可以认为,该校学生的体重ξ近似服从正态分布N(μ,σ2),其中μ=60,σ2=25.若P(μ-2σ≤ξ<μ+2σ)>0.9545,则认为该校学生的体重是正常的.试判断该校学生的体重是否正常?并说明理由.
[解](1)由题知,100名样本中体重低于50公斤的有2人,
用样本的频率估计总体的概率,可得体重低于50公斤的概率为=0.02,则a==0.004,
在[50,55)上有13人,该组的频率为0.13,则b==0.026,
所以2c==0.14,即c=0.07.
(2)用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在[55,65)的概率为0.07×10=0.7,随机抽取3人,相当于三次独立重复试验,随机变量X服从二项分布B(3,0.7),
则P(X=0)=C0.700.33=0.027,
P(X=1)=C0.710.32=0.189,
P(X=2)=C0.720.31=0.441,
P(X=3)=C0.730.30=0.343,
所以,X的概率分布列为:
X
0
1
2
3
P
0.027
0.189
0.441
0.343
E(X)=3×0.7=2.1.
(3)由N(60,25)得σ=5
由图(1)知P(μ-2σ≤ξ<μ+2σ)=P(50≤ξ<70)=0.96>0.954 5.所以可以认为该校学生的体重是正常的.
[评析] 本题以学生体重情况为背景,设计概率与统计、正态分布的综合应用.体现了数学建模(用频率估计概率、正态分布)、数学运算(求平均数、方差、求概率)、数据分析、逻辑推理(以直方图中求平均数方差,由正态分布求概率及期望)的学科素养;培养了统计意识,经历“收集数据—整理数据—分析数据—作出推断”的全过程.
概率与统计案例的综合
【例2】 为了解当代中学生喜欢文科、理科的情况,某中学一课外活动小组在学校高一年级文、理分科时进行了问卷调查,问卷共100道题,每题1分,总分100分,该课外活动小组随机抽取了200名学生的问卷成绩(单位:分)进行统计,将数据按照[0,20),[20,40),[40,60),[60,80),[80,100]分成5组,绘制的频率分布直方图如图所示,若将不低于60分的称为“文科意向”学生,低于60分的称为“理科意向”学生.
(1)根据已知条件完成下面2×2列联表,并据此判断是否有99%的把握认为是否为“文科意向”与性别有关?
理科意向
文科意向
总计
男
110
女
50
总计
(2)将频率视为概率,现在从该校高一学生中用随机抽样的方法每次抽取1人,共抽取3次,记被抽取的3人中“文科意向”的人数为ξ,若每次抽取的结果是相互独立的,求ξ的分布列、期望E(ξ)和方差D(ξ).
参考公式:K2=,其中n=a+b+c+d.
参考临界值:
P(K2≥k0)
0.10
0.05
0.025
0.010
0.005
0.001
k0
2.706
3.841
5.024
6.635
7.879
10.828
[解](1)由频率分布直方图可得分数在[60,80)之间的学生人数为0.012 5×20×200=50,在[80,100]之间的学生人数为0.007 5×20×200=30,所以低于60分的学生人数为120.因此列联表为
理科意向
文科意向
总计
男
80
30
110
女
40
50
90
总计
120
80
200
又K2=≈16.498>6.635,
所以有99%的把握认为是否为“文科意向”与性别有关.
(2)易知从该校高一学生中随机抽取1人,则该人为“文科意向”的概率为P==.
依题意知ξ~B,
所以P(ξ=i)=C (i=0,1,2,3),
所以ξ的分布列为
ξ
0
1
2
3
P
所以期望E(ξ)=np=,方差D(ξ)=np(1-p)=.
[评析] 此类题目虽然涉及的知识点较多,但每个知识点考查程度相对较浅,考查深度有限,所以解决此类问题,最主要的是正确掌握概率与统计案例的基本知识,并能对这些知识点进行有效的融合,把统计图表中的量转化为概率及分布列求解中的有用的量是解决此类问题的关键所在.
相关资料
更多