2021届二轮复习 统计与统计案例理 作业(全国通用) 练习
展开专题限时集训(六) 统计与统计案例
[专题通关练]
(建议用时:20分钟)
1.下列说法中正确的是( )
A.先把高三年级的2 000名学生编号:1到2 000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m,然后抽取编号为m+50,m+100,m+150,…的学生,这样的抽样方法是分层抽样法
B.线性回归直线=x+不一定过样本中心点(,)
C.若两个随机变量的线性相关性越强,则相关系数r的值越接近于1
D.若一组数据1,a,3的平均数是2,则该组数据的方差是
D [对于A,先把高三年级的2 000名学生编号:1到2 000,再从编号为1到50的50名学生中随机抽取1名学生,其编号为m,然后抽取编号为m+50,m+100,m+150,…的学生,这样的抽样方法是系统抽样,故A项错误;对于B,线性回归直线=x+一定过样本中心点(,),故B项错误;对于C,若两个随机变量的线性相关性越强,则相关系数r的绝对值越接近于1,故C项错误;对于D,若一组数据1,a,3的平均数是2,则a=2,则该组数据的方差是×=,故D项正确,故选D.]
2.[重视题](2020·青岛一模)调查机构对某高科技行业进行调查统计,得到该行业从业者学历分布饼状图、从事该行业岗位分布条形图,如图所示.
给出下列三种说法:①该高科技行业从业人员中学历为博士的占一半以上;②该高科技行业中从事技术岗位的人数超过总人数的30%;③该高科技行业中从事运营岗位的人员主要是本科生,其中正确的个数为( )
A.0个 B.1个
C.2个 D.3个
C [在①中,由该行业从业者学历分布饼状图得到:该高科技行业从业人员中学历为博士的占一半以上,故①正确;在②中,由从事该行业岗位分布条形图得到:该高科技行业中从事技术岗位的人数超过总人数的30%,故②正确;在③中,由该行业从业者学历分布饼状图、从事该行业岗位分布条形图,无法得到该高科技行业中从事运营岗位的人员主要是本科生,故③错误.故选C.]
3.(2020·郑州二模)将甲、乙两个篮球队5场比赛的得分数据整理成如图所示的茎叶图,由图可知以下结论正确的是( )
A.甲队平均得分高于乙队的平均得分
B.甲队得分的中位数大于乙队得分的中位数
C.甲队得分的方差大于乙队得分的方差
D.甲乙两队得分的极差相等
C [对于A,甲的平均数为(29+28+26+31+31)=29,乙的平均数为(28+29+30+31+32)=30,故A错误.
对于B,甲队得分的中位数是29,乙队得分的中位数是30,故B错误;
对于C,甲成绩的方差为:s2=×[(26-29)2+(28-29)2+(29-29)2+(31-29)2+(31-29)2]=.
乙成绩的方差为:s2=×[(28-30)2+(29-30)2+(30-30)2+(31-30)2+(32-30)2]=2.
可得甲队得分的方差大于乙队得分的方差,故C正确;
对于D,甲的极差是31-26=5,乙的极差是32-28=4,两者不相等,故D错误.故选C.]
4.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其线性回归方程为=x+.已知xi=225,yi=1 600,=4.该班某学生的脚长为24,据此估计其身高为( )
A.160 B.163
C.166 D.170
C [∵xi=225,∴=xi=22.5.
∵yi=1 600,∴=yi=160.
又=4,∴=-=160-4×22.5=70.
∴线性回归方程为=4x+70.
将x=24代入上式,得=4×24+70=166.故选C.]
5.(2020·济南高三期末)某学校为了解1 000名新生的身体素质,将这些学生编号为1,2,…,1 000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是( )
A.8号学生 B.200号学生
C.616号学生 D.815号学生
C [根据题意,系统抽样是等距抽样,
所以抽样间隔为=10.
因为46除以10余6,所以抽到的号码都是除以10余6的数,结合选项知应为616.故选C.]
6.(2020·聊城市一模)某工厂从生产的一批产品中随机抽出一部分,对这些产品的一项质量指标进行了检测,整理检测结果得到如下频率分布表:
质量指标分组 | [10,30) | [30,50) | [50,70] |
频率 | 0.1 | 0.6 | 0.3 |
据此可估计这批产品的此项质量指标的方差为________.
144 [由题意得这批产品的此项质量指标的平均数为20×0.1+40×0.6+60×0.3=44,
故方差为(20-44)2×0.1+(40-44)2×0.6+(60-44)2×0.3=144.]
[能力提升练]
(建议用时:15分钟)
7.某球迷为了解A,B两支篮球队的攻击能力,从某赛季常规赛中随机调查了20场与这两支篮球队有关的比赛.两队所得分数分别如下.
A篮球队:122 110 105 105 109 101 107 129
115 100 114 118 118 104 93 120
96 102 105 83
B篮球队:114 114 110 108 103 117 93 124
75 106 91 81 107 112 107 101 106
120 107 79
(1)根据两组数据完成两队所得分数的茎叶图,并通过茎叶图比较两支篮球队所得分数的平均值及分散程度(不要求计算出具体值,得出结论即可);
(2)根据篮球队所得分数,将篮球队的攻击能力从低到高分为三个等级,如下表所示.
篮球队所得分数 | 低于100分 | 100分到119分(包含100分和119分) | 不低于120分 |
攻击能力等级 | 较弱 | 较强 | 很强 |
记事件C:“A篮球队的攻击能力等级高于B篮球队的攻击能力等级”.假设两支篮球队的攻击能力相互独立,根据所给数据,视事件发生的频率为相应事件发生的概率,求事件C发生的概率.
[解](1)两队所得分数的茎叶图如图.
通过茎叶图可以看出,A篮球队所得分数的平均值高于B篮球队所得分数的平均值;
A篮球队所得分数比较集中,B篮球队所得分数比较分散.
(2)记CA1表示事件:“A篮球队的攻击能力等级为较强”.
CA2表示事件:“A篮球队的攻击能力等级为很强”.
CB1表示事件:“B篮球队的攻击能力等级为较弱”.
CB2表示事件:“B篮球队的攻击能力等级为较弱或较强”.
则CA1与CB1为相互独立事件,CA2与CB2为相互独立事件,CA1与CA2为互斥事件,C=(CA1CB1)∪(CA2CB2).
P(C)=P(CA1CB1)+P(CA2CB2)=P(CA1)P(CB1)+P(CA2)P(CB2).
由所给数据得CA1,CA2,CB1,CB2发生的频率分别为,,,,
故P(CA1)=,P(CA2)=,P(CB1)=,P(CB2)=,P(C)=×+×=0.31.
8.[重视题]某市房管局为了了解该市市民2020年1月至2020年1月期间购买二手房情况,首先随机抽样其中200名购房者,并对其购房面积m(单位:平方米,60≤m≤130)进行了一次调查统计,制成了如图1所示的频率分布直方图,接着调查了该市2020年1月至2020年1月期间当月在售二手房均价y(单位:万元/平方米),制成了如图2所示的散点图(图中月份代码1至13分别对应2020年1月至2020年1月)
(1)试估计该市市民的平均购房面积;
(2)从该市2020年1月至2020年1月期间所有购买二手房的市民中任取3人,用频率估计概率,记这3人购房面积不低于100平方米的人数为X,求X的分布列与数学期望;
(3)根据散点图选择=+和=+ln x两个模型进行拟合,经过数据处理得到两个回归方程,分别为=0.936 9+0.028 5和=0.955 4+0.030 6ln x,并得到一些统计量的值,如表所示:
| =0.936 9 +0.028 5 | =0.955 4+ 0.030 6ln x |
(yi-i)2 | 0.000 591 | 0.000 164 |
(yi-)2 | 0.006 050 |
请利用相关指数R2判断哪个模型的拟合效果更好,并用拟合效果更好的模型预测2020年6月份的二手房购房均价(精确到0.001).
参考数据:ln 2≈0.69,ln 3≈1.10,ln 10≈2.30,ln 19≈2.94,≈1.41,≈1.73,≈3.16,≈4.36.
参考公式:R2=1-.
[解](1)=65×0.05+75×0.1+85×0.2+95×0.25+105×0.2+115×0.15+125×0.05=96.
(2)每一位市民购房面积不低于100平方米的概率为0.20+0.15+0.05=0.4,
∴X~B(3,0.4),
∴P(X=k)=C×0.4k×0.63-k,(k=0,1,2,3),
P(X=0)=0.63=0.216,
P(X=1)=C×0.4×0.62=0.432,
P(X=2)=C×0.42×0.6=0.288,
P(X=3)=0.43=0.064,
∴X的分布列为:
X | 0 | 1 | 2 | 3 |
P | 0.216 | 0.432 | 0.288 | 0.064 |
∴E(X)=3×0.4=1.2.
(3)设模型=0.936 9+0.028 5和=0.955 4+0.030 6ln x的相关指数分别为R,R,则R=1-,R=1-,
∴R<R,
∴模型=0.955 4+0.030 6ln x的拟合效果更好,
2020年6月份对应的x=30,
∴=0.955 4+0.030 6ln 30=0.955 4+0.030 6(ln 3+ln 10)≈1.059万元/平方米.
内容 | 押题依据 |
独立性检验、离散型随机变量的期望、概率的计算 | 以图表的形式呈现数据,符合北京朝阳期末的命题模式,与期望、概率交汇命题体现了北京朝阳期末命题的特点 |
【押题】 高铁、网购、移动支付和共享单车被誉为中国的“新四大发明”,彰显出中国式创新的强劲活力.某移动支付公司从我市移动支付用户中随机抽取100名进行调查,得到如下数据:
每周移动支付次数 | 1 | 2 | 3 | 4 | 5 | 6及其以上 |
男 | 10 | 8 | 7 | 3 | 2 | 15 |
女 | 5 | 4 | 6 | 4 | 6 | 30 |
合计 | 15 | 12 | 13 | 7 | 8 | 45 |
(1)把每周使用移动支付超过3次的用户称为“移动支付活跃用户”,请完成下列2×2列联表,并判断能否在犯错误的概率不超过0.005的前提下,认为是否为“移动支付活跃用户”与性别有关?
| 非移动支付活跃用户 | 移动支付活跃用户 | 合计 |
男 |
|
|
|
女 |
|
|
|
合计 |
|
|
|
(2)把每周使用移动支付6次及6次以上的用户称为“移动支付达人”,视频率为概率,在我市所有“移动支付达人”中随机抽取4名用户.
①求抽取的4名用户中,既有男“移动支付达人”,又有女“移动支付达人”的概率;
②为了鼓励男性用户使用移动支付,对抽出的男“移动支付达人”每人奖励300元,记奖励总金额为X,求X的分布列及数学期望.
附公式及表如下:K2=.
P(K2≥k) | 0.15 | 0.10 | 0.05 | 0.025 | 0.010 | 0.005 | 0.001 |
k | 2.072 | 2.706 | 3.841 | 5.024 | 6.635 | 7.879 | 10.828 |
[解](1)由表格数据可得2×2列联表如下:
| 非移动支付活跃用户 | 移动支付活跃用户 | 合计 |
男 | 25 | 20 | 45 |
女 | 15 | 40 | 55 |
合计 | 40 | 60 | 100 |
将列联表中的数据代入公式计算得
K2=
==≈8.249>7.879.
所以在犯错误的概率不超过0.005的前提下,能认为是否为“移动支付活跃用户”与性别有关.
(2)视频率为概率,在我市“移动支付达人”中随机抽取1名用户,该用户为男“移动支付达人”的概率为,女“移动支付达人”的概率为.
①抽取的4名用户中,既有男“移动支付达人”,又有女“移动支付达人”的概率为P=1--=.
②记抽出的男“移动支付达人”人数为Y,则X=300Y.由题意得Y~B,P(Y=0)=C=;
P(Y=1)=C=;
P(Y=2)=C=;
P(Y=3)=C=;
P(Y=4)=C=.
所以Y的分布列为
Y | 0 | 1 | 2 | 3 | 4 |
P |
所以X的分布列为
X | 0 | 300 | 600 | 900 | 1 200 |
P |
由E(Y)=4×=,得X的数学期望E(X)=300E(Y)=400.