概率与统计可能考向收集整理[三轮总结]

前言

概率与统计中的常见考查角度

考查概率,

涉及古典概型或几何概型,或条件概率

在集合\(A=\{2,3\}\)中随机取一个元素\(m\),在集合\(B=\{1,2,3\}\)中随机取一个元素\(n\),得到点\(P(m,n)\),则点\(P\)在圆\(x^2+y^2=9\)内部的概率为【】

$A.\cfrac{1}{2}$ $B.\cfrac{1}{3}$ $C.\cfrac{3}{4}$ $D.\cfrac{2}{5}$

分析:古典概型,点\(P(m,n)\)共有$(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)$6种情况,

只有\((2,1),(2,2)\)这2个点在圆\(x^2+y^2=9\)的内部,所求概率为\(\cfrac{2}{6}=\cfrac{1}{3}\)

如图在\(\Delta ABC\)中,\(\angle B=60^{\circ}\)\(\angle C=45^{\circ}\),高\(AD=\sqrt{3}\),在\(\angle BAC\) 内作射线\(AM\)\(BC\)于点\(M\)

\(BM<1\)的概率是(\(\hspace{1cm}\))。

分析:本题是角度型几何概型,

\(P=\cfrac{30^{\circ}}{75^{\circ}}=\cfrac{2}{5}\)

有一批种子的发芽率为\(0.9\),出芽后的幼苗成活率为\(0.8\),在这批种子中,随机抽取一粒,则这粒种子能成长为幼苗的概率为________.

分析:本题目为条件概率[理科题目],
设“种子发芽”为事件\(A\),“种子成长为幼苗”为事件\(AB\)(发芽,又成活为幼苗)

出芽后的幼苗成活率为\(P(B|A)=0.8\)\(P(A)=0.9\)

根据条件概率公式\(P(AB)=P(B|A)\cdot P(A)=0.8×0.9=0.72\)

即这粒种子能成长为幼苗的概率为\(0.72\).

利用互斥事件或者对立事件的概率考查

某商场举行有奖促销活动,每次抽奖都是从装有4个红球、6个白球的甲箱和装有5个红球、5个白球的乙箱中,各随机摸出一个球,在摸出的2个球中,若都是红球,则获得一等奖;若只有一个红球,则获得二等奖;若没有红球,则没有获奖,

(1)求顾客抽奖一次能获奖的概率。

【法1】(相互独立事件+互斥事件):记“抽奖一次能获一等奖”为事件\(A\),“抽奖一次能获二等奖”为事件\(B\)

“顾客抽奖一次能获奖”为事件\(C\),则事件\(A、B\)是互斥事件,且\(C=A+B\),两次抽奖是相互独立事件,

\(P(A)=\cfrac{C_4^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}=\cfrac{20}{100}\)

\(P(B)=\cfrac{C_4^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}+\cfrac{C_6^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}=\cfrac{50}{100}\)

\(P(C)=P(A+B)=\cfrac{70}{100}=\cfrac{7}{10}\)

【法2】(对立事件+相互独立事件):设“没有获奖”为事件\(D\)

\(P(C)=1-P(D)=1-\cfrac{C_6^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}=\cfrac{7}{10}\)

特征数据

考查统计案例,频率分布直方图中的特征数据,如平均数、中位数、众数等

【题文】如右图所示,求该频率分布直方图的众数、中位数、平均数、方差。

解释:以右图题目为例,

求众数:“旧养殖法”的众数为\(47.5\);“新养殖法”的众数为\(52.5\)

求中位数:“旧养殖法”的中位数先判断其大概位置,由于\(25-50\)之间的面积和为\(0.62\),25-45之间的面积和为\(0.42\)

故中位数一定位于\(45-50\)之间,设中位数为\(x\),则\(0.42+(x-45)\times0.04=0.50\),求得\(x=47\),即中位数为\(47\)

求平均数:比如“旧养殖法”的平均数的计算

\(\bar{x}=27.5\times5\times0.012+32.5\times5\times0.014\)

\(+37.5\times5\times0.024+42.5\times5\times0.034\)

\(+47.5\times5\times0.040+52.5\times5\times0.032\)

\(+57.5\times5\times0.020+62.5\times5\times0.012+67.5\times5\times0.012\)

\(=47.1;\)

“新养殖法”的平均数的计算

\(\bar{y}=37.5\times5\times0.004+42.5\times5\times0.020\)

\(+47.5\times5\times0.044+52.5\times5\times0.068\)

\(+57.5\times5\times0.046+62.5\times5\times0.010+67.5\times5\times0.008\)

\(=52.35;\)

求方差:比如“新养殖法”的方差计算

\(S^2=(37.5-52.35)^2\times 0.004\times 5+(42.5-52.35)^2\times 0.020\times 5+(47.5-52.35)^2\times 0.044\times 5\)

\(+(52.5-52.35)^2\times 0.068\times 5+(57.5-52.35)^2\times 0.046\times 5\)

\(+(62.5-52.35)^2\times 0.010\times 5+(67.5-52.35)^2\times 0.008\times 5\)

\(=?\)

感悟反思:

1、深入理解频率分布直方图,掌握众数、中位数、平均数、方差的算法;

2、为什么平均数要这样计算?
比如给定数据\(1,2,3,4,5\)的平均数的算法是\(\bar{x}=\cfrac{1+2+3+4+5}{5}=3\)
那么给定数据\(2,2,4,4,4\)的平均数的算法是
\(\bar{x}=\cfrac{2+2+4+4+4}{5}=\cfrac{2\times 2+4\times 3}{5}\)
\(=2\times \cfrac{2}{5}+4\times \cfrac{3}{5}\)
表达式中的\(\cfrac{2}{5}\)\(\cfrac{3}{5}\)的含义就是\(\cfrac{频数}{样本容量}=频率\)

考察用样本数据特征估计总体的数据特征

【2020届宝鸡质检1文数第18题】某校对2019年入校的\(400\)名新生进行入校考试,根据男女学生的比例,使用分层抽样的方法从中随机抽取了\(100\)名学生,记录他们的分数,将数据分成\(7\)组:\([20,30)\)\([30,40)\)\(\cdots\)\([80,90]\),并整理成如下的频率分布直方图:

(1).从总体的\(400\)名学生中随机抽取一人,估计其分数小于\(70\)的概率;

分析:解答本题目应该注意到两点:①用频率分布直方图计算出来的其实是频率,我们只是用此频率粗略的估计概率;②计算所得的概率是直方图中的\(100\)个样本数据的概率,还需要用此样本数据的概率粗略的估计总体数据\(400\)的概率;据此计算说明如下:

由频率分布直方图可知,样本中分数小于\(70\)的频率:\(1-(0.02+0.04)\times 10=0.4\)

所以从总体的\(400\)名学生中随机抽取一人,其分数小于\(70\)分的概率为\(0.4\)

(2).已知样本中分数小于\(40\)的学生的学生有\(5\)人,试估计总体中分数在\([40,50)\)内的人数;

分析:学生易错的问题,忘记用样本数据来估计总体数据,其本质是没有理解数学的学习本质,是为了服务生产和生活;

由题意可知,样本中分数不小于\(50\)的频率为\((0.01+0.02+0.04+0.02)\times 10=90\)

则分数在\([40,50)\)内的人数为\(100-100\times 0.9-5=5\),即样本中分数在\([40,50)\)内的频率[或概率]为\(\cfrac{5}{100}=0.05\)

则总体中分数在\([40,50)\)内的频率[或概率]为\(\cfrac{5}{100}=0.05\),分数在\([40,50)\)内的人数为\(400\times 0.05=20\)

(3).学生易错的问题,由题可知,样本中分数不小于\(70\)的人数为\((0.02+0.04)\times 10\times 100=60\)

所以样本中分数不小于\(70\)分的男生人数为\(60\times \cfrac{1}{2}=30\)

则样本中男生人数为\(30\times 2=60\),故样本中女生人数为\(100-60=40\)

所以样本中男生和女生人数的比例为\(60:40=3:2\),由分层抽样原理可知,

估计总体中的男生和女生人数的比例为\(3:2\).

统计部分

考查统计案例,线性回归方程的相关问题

【对统计大数据的预处理】【2019高三理科数学第二次月考第18题】某地随着经济发展,居民收入逐年增长,下表是该地一建设银行连续五年的储蓄存款(年底余额),如下表1:

月份\(x\) 2011 2012 2013 2014 2015
储蓄存款\(y\)(千亿元) 5 6 7 8 10

为便于计算,将上表做一处理,令\(t=x-2010\)\(z=y-5\),得到下表2:

时间代号\(t\) 1 2 3 4 5
\(z\) 0 1 2 3 5

附可能用到的公式:线性回归直线为\(\widehat{y}=\widehat{b}x+\widehat{a}\)

\(\widehat{b}=\cfrac{\sum\limits_{i=1}^n{(x_i-\bar{x})(y_i-\bar{y})}}{\sum\limits_{i=1}^n{(x_i-\bar{x})^2}}=\cfrac{\sum\limits_{i=1}^n{x_iy_i-n\cdot\bar{x}\cdot\bar{y}}}{\sum\limits_{i=1}^n{x_i^2-n\cdot\bar{x}^2}}\)

\(\widehat{a}=\bar{y}-\widehat{b}\cdot\bar{x}\).

(1)求\(z\)关于\(t\)的线性回归方程。

分析:需要先注意\(z\rightarrow y\;\;\)\(t\rightarrow x\;\;\),然后将所给的公式翻译为关于\(z\)\(t\)的公式,这涉及到数学素养,公式的正向迁移。

由表格可知,\(\bar{t}=3\)\(\bar{z}=2.2\)\(\sum\limits_{i=1}^5{t_iz_i}=45\)\(\sum\limits_{i=1}^5{t_i^2}=55\)

\(\widehat{b}=\cfrac{\sum\limits_{i=1}^n{t_iz_i-n\cdot\bar{t}\cdot\bar{z}}}{\sum\limits_{i=1}^n{t_i^2-n\cdot\bar{t}^2}}\)

\(=\cfrac{45-5\times 3\times 2.2}{55-5\times 9}=1.2\)

\(\widehat{a}=\bar{z}-\widehat{b}\cdot\bar{t}=2.2-3\times 1.2=-1.4\)

\(\hat{z}=1.2t-1.4\)

(2)通过(1)中的方程,求出\(y\)关于\(x\)的线性回归方程。

分析:将\(t=x-2010\)\(z=y-5\)代入\(\hat{z}=1.2t-1.4\)

得到\(y-5=1.2\times (x-2010)-1.4\)

\(\hat{y}=1.2x-2408.4\)

(3)用所求的线性回归方程预测,到\(2020\)年底,该地的储蓄存款余额可达到多少?

分析:当\(x=2020\)时,代入\(\hat{y}=1.2x-2408.4\)

得到\(\hat{y}=1.2\times 2020-2408.4=15.6(千亿元)\)

相关链接:数据预处理的不同思路,数据预处理

统计案例

独立性检验的相关问题

【2019届高三理科数学信息题】现在微信支付已成为人们日常流行的一种付款方式,某大型超市为了鼓励顾客使用微信支付,特举办微信支付活动一个月,规定:凡是在这个月内使用微信付款次数达到60次即由精美奖品,否则无奖品。现从该超市数据信息中随机选取已使用微信付款的40名顾客,且男女比例相同,将他们的数据整理如下表:

次数 <40 40~49 50~59 60~69 $\ge $70
\(2\) \(3\) \(2\) \(7\) \(6\)
\(1\) \(3\) \(8\) \(6\) \(2\)

(1)根据题意完成下面的\(2\times 2\)列联表,并据此判断能否有90%的把握认为“是否获奖”与“性别”有关?

有奖 无奖 总计
\(13\) \(7\) \(20\)
\(8\) \(12\) \(20\)
总计 \(21\) \(19\) \(40\)

\(\chi^2=\cfrac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}=\cfrac{40(13\times12-7\times 8)^2}{20\times20\times21\times19}\approx 2.5<2.706\)

所以没有90%的把握认为“是否获奖”与“性别”有关。

(2)在这40名顾客中,从支付次数达到70的人中随机抽取3人,设抽取的女性有\(X\)人,求\(X\)的分布列及数学期望\(E(X)\)
附:参考公式\(\chi^2=\cfrac{n(ad-bc)^2}{(a+b)(c+d)(a+c)(b+d)}\)

参考数据:

解析:支付次数达到70的顾客共有8人,其中6名男性,2名女性,从中随机抽取3人,抽取的女性人数服从超几何分布,\(X\)的所有可能取值为\(0,1,2\)

\(P(X=0)=\cfrac{C_6^3}{C_8^3}=\cfrac{20}{56}\)\(P(X=1)=\cfrac{C_2^1C_6^2}{C_8^3}=\cfrac{30}{56}\)

\(P(X=2)=\cfrac{C_2^2C_6^1}{C_8^3}=\cfrac{6}{56}\)

所以分布列如下,略。

数学期望为\(E(X)=0\times \cfrac{20}{56}+1\times \cfrac{30}{56}+2\times \cfrac{6}{56}=\cfrac{3}{4}\)

离散型随机变量

离散型随机变量的概率,离散型随机变量的分布列、期望、方差,及性质

【2018陕西省第三次质量检测数学理科第19题】2018年春节期间,为了解市民对西安地铁运营状况的满意度,分别从不同地铁站点随机抽取若干市民对其评分(满分为100分,评分均为整数),绘制频率分布直方图,并将分数从低到高分为四个等级:

(1)若市民的满意度评分相互独立,以满意度样本估计全市市民满意度。现从全市市民中随机抽取了4人,估计这4人中至少有2人非常满意的概率;

(2)在等级为不满意市民中,老年人占比\(\cfrac{1}{3}\),现从该等级市民中按年龄分层抽取了15人了解不满意的原因,并从中选取3人担任整改督导员,记\(X\)为老年督导员的人数,求\(X\)的分布列和数学期望\(E(X)\).
(3)相关部门对西安地铁运营状况进行评估,评估的硬指标是:市民对西安地铁运营状况的满意指数不低于0.8,否则需要整改,根据你所学的统计知识,判断地铁运营状况能否通过评估,并说明理由。(说明:满意指数=\(\cfrac{满意程度的平均分}{100}\))

【分析】:(1)首先由频率分布直方图计算得到\(a=0.025\),市民非常满意的概率为\(0.025\times 10=0.25=\cfrac{1}{4}\)

注解:由题目可知市民的满意度评分相互独立,随机抽取4人做调查,到此我们就可以理解相当于做了4次独立重复试验,

每次试验满意概率为\(\cfrac{1}{4}\),不满意概率为\(\cfrac{3}{4}\),这样就只能考虑二项分布而不是超几何分布了。

令满意人数为\(X\),则\(X\sim B(4,\cfrac{1}{4})\),且\(P(X=k)=C_4^k\cdot (\cfrac{1}{4})^k\cdot (\cfrac{3}{4})^{4-k}\)\(k=0,1,2,3,4\)

故所求的概率即\(P=P(X=2)+P(X=3)+P(X=4)=\cfrac{67}{256}\)

\(P=1-P(X=0)-P(X=1)=1-C_4^0\cdot (\cfrac{1}{4})^0\cdot (\cfrac{3}{4})^{4}-C_4^1\cdot (\cfrac{1}{4})^1\cdot (\cfrac{3}{4})^{3}=\cfrac{67}{256}\).

(2)抽取的15中,老年人占\(15\times \cfrac{1}{3}=5\),其他人占10人,从中抽取3人担任督导员,是无放回抽取,故容易理解是超几何分布。

\(X\sim H\left(15,5,3\right)\)\(P(X=k)=\cfrac{C_3^kC_{10}^{3-k}}{C_{15}^3},k=0,1,2,3\)

\(P(X=0)=\cfrac{C_3^0C_{10}^{3}}{C_{15}^3}=\cfrac{24}{91}\)\(P(X=1)=\cfrac{C_3^1C_{10}^{2}}{C_{15}^3}=\cfrac{45}{91}\)

\(P(X=2)=\cfrac{C_3^2C_{10}^{1}}{C_{15}^3}=\cfrac{20}{91}\)\(P(X=3)=\cfrac{C_3^3C_{10}^{0}}{C_{15}^3}=\cfrac{2}{91}\)

分布列从略。

\(EX=0\times \cfrac{24}{91}+1\times\cfrac{45}{91}+2\times\cfrac{20}{91}+3\times\cfrac{2}{91}=1\)

(3)由频率分布直方图求平均数,得到,

\((45\times 0.002+55\times 0.004+65\times 0.014+75\times 0.02+85\times 0.035+95\times 0.025)\times 10=80.7\)

即市民满意度的平均分为\(80.7\),满意度指数为\(\cfrac{80.7}{100}=0.807>0.8\)

即地铁运营状况能够通过验收。

【概率,贝努里概型】某商场举行有奖促销活动,每次抽奖都是从装有4个红球、6个白球的甲箱和装有5个红球、5个白球的乙箱中,各随机摸出一个球,在摸出的2个球中,若都是红球,则获得一等奖;若只有一个红球,则获得二等奖;若没有红球,则没有获奖,

(1)求顾客抽奖一次能获奖的概率。

【法1】(相互独立事件+互斥事件):记“抽奖一次能获一等奖”为事件\(A\),“抽奖一次能获二等奖”为事件\(B\)

“顾客抽奖一次能获奖”为事件\(C\),则事件\(A、B\)是互斥事件,且\(C=A+B\),两次抽奖是相互独立事件,

\(P(A)=\cfrac{C_4^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}=\cfrac{20}{100}\)

\(P(B)=\cfrac{C_4^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}+\cfrac{C_6^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}=\cfrac{50}{100}\)

\(P(C)=P(A+B)=\cfrac{70}{100}=\cfrac{7}{10}\)

【法2】(对立事件+相互独立事件):设“没有获奖”为事件\(D\)

\(P(C)=1-P(D)=1-\cfrac{C_6^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}=\cfrac{7}{10}\)

(2)若某顾客有3次抽奖机会,记该顾客在3次抽奖中获得一等奖的次数为\(X\),求\(X\)的分布列、数学期望和方差。

由于顾客在每次抽奖过程中,中一等奖的概率都为\(\cfrac{C_4^1}{C_{10}^1}\cdot \cfrac{C_5^1}{C_{10}^1}=\cfrac{1}{5}\)

那么此人抽奖3次,相当于做了3次独立重复实验,故\(X\sim B(3,\cfrac{1}{5})\)\(X=0,1,2,3\)

\(P(X=k)=C_3^k\cdot (\cfrac{1}{5})^k(1-\cfrac{1}{5})^{3-k}\)\(k=0,1,2,3\)

\(P(X=0)=C_3^0\cdot (\cfrac{1}{5})^0(1-\cfrac{1}{5})^{3-0}=\cfrac{64}{125}\)

\(P(X=1)=C_3^1\cdot (\cfrac{1}{5})^1(1-\cfrac{1}{5})^{3-1}=\cfrac{48}{125}\)

\(P(X=2)=C_3^2\cdot (\cfrac{1}{5})^2(1-\cfrac{1}{5})^{3-2}=\cfrac{12}{125}\)

\(P(X=3)=C_3^3\cdot (\cfrac{1}{5})^3(1-\cfrac{1}{5})^{3-3}=\cfrac{1}{125}\)

分布列略,数学期望为\(EX=3\times \cfrac{1}{5}=\cfrac{3}{5}\)

方差为\(DX=3\times \cfrac{1}{5}\times (1-\cfrac{1}{5})=\cfrac{12}{25}\)

解后反思:

1、求复杂事件的概率,需要将复杂事件分化为几个简单的事件,且必须弄清楚个事件之间的关系,这会决定后续的计算是用加法还是乘法。

2、\(n\)次独立重复实验中,离散型随机变量\(X\sim B(n,p)\),则\(EX=np\)\(DX=np(1-p)\)

连续型随机变量

考查连续型随机变量的概率,简单的正态分布知识

https://www.cnblogs.com/wanghai0666/p/6588675.html

高阶综合

【2015新课标Ⅰ第19题】某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费\(x\)(单位:千元)对年销售量\(y\)(单位:t)和年利润\(z\)(单位:千元)的影响,对近8年的年宣传费\(x_i\)和年销售量\(y_i\)(\(i=1,2,…,8\))数据作了初步处理,得到下面的散点图及一些统计量的值。

\(\bar{x}\) \(\bar{y}\) \(\bar{w}\) \(\sum\limits_{i=1}^{8}{(x_i-\bar{x})^2}\) \(\sum\limits_{i=1}^{8}{(w_i-\bar{w})^2}\) \(\sum\limits_{i=1}^{8}{(x_i-\bar{x})(y_i-\bar{y})}\) \(\sum\limits_{i=1}^{8}{(w_i-\bar{w})(y_i-\bar{y})}\)
\(46.6\) \(563\) \(6.8\) \(289.8\) \(1.6\) \(1469\) \(108.8\)

表中\(w_i=\sqrt{x_i}\)\(\bar{w}=\cfrac{1}{8}\sum\limits_{i=1}^{8}{w_i}\)

附:对于一组数据\((u_1,v_1)\)\((u_2,v_2)\)\(\cdots\)\((u_n,v_n)\),其回归直线\(v=\alpha+\beta u\)的斜率和截距的最小二乘估计分别为\(\hat{\beta}=\cfrac{\sum\limits_{i=1}^{8}{(u_i-\bar{u})(v_i-\bar{v})}}{\sum\limits_{i=1}^{n}{(u_i-\bar{u})^2}}\)\(\hat{\alpha}=\bar{v}-\hat{\beta}\bar{u}\)

(Ⅰ)根据散点图判断,\(y=a+bx\)\(y=c+d\sqrt{x}\)哪一个适宜作为年销售量\(y\)关于年宣传费\(x\)的回归方程类型?(给出判断即可,不必说明理由)

分析:由散点图可以分析,\(y=c+d\sqrt{x}\)更适宜作为年销售量\(y\)关于年宣传费\(x\)的回归方程类型,图中的变量呈现曲线回归。

(Ⅱ)根据(Ⅰ)的判断结果及表中数据,建立\(y\)关于\(x\)的回归方程;

分析:令\(w=\sqrt{x}\),先建立\(y\)关于\(w\)的线性回归方程,

由于\(\hat{d}=\cfrac{108.8}{1.6}=68\)

\(\hat{c}=\bar{y}-\hat{d}\bar{w}=563-68\times 6.8=100.6\)

所以\(y\)关于\(w\)的线性回归方程为\(\hat{y}=100.6+68w\)

\(y\)关于\(x\)的线性回归方程为\(\hat{y}=100.6+68\sqrt{x}\).

(Ⅲ)已知这种产品的年利润\(z\)\(x\)\(y\)的关系为\(z=0.2y-x\),根据(Ⅱ)的结果回答下列问题:

(i)年宣传费\(x=49\)时,年销售量及年利润的预报值是多少?

分析:由(Ⅱ)知,年宣传费\(x=49\)时,年销售量的预报值\(\hat{y}=100.6+68\sqrt{49}=576.6\)

年利润\(z\)的预报值\(\hat{z}=0.2\times 576.6-49=66.32\)

(ii)年宣传费\(x\)为何值时,年利润的预报值最大?

分析:由(Ⅱ)知,年利润\(z\)的预报值\(\hat{z}=0.2\times (100.6+68\sqrt{x})-x\)

\(=-x+13.6\sqrt{x}+20.12=-[(\sqrt{x})^2-13.6\sqrt{x}]+20.12\)

\(\sqrt{x}=\cfrac{13.6}{2}=6.8\)时,即当\(x=46.24\)时年利润的预报值最大。

【2017全国卷1理科19题高考真题】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取\(16\)个零件,并测量其尺寸(单位:cm).根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布\(N(\mu,\sigma^2)\)

(1)假设生产状态正常,记\(X\)表示一天内抽取的\(16\)个零件中其尺寸在\((\mu-3\sigma,\mu+3\sigma)\)之外的零件数,求\(P(X≥1)\)\(X\)的数学期望;

分析:由题可知,尺寸落在\((\mu-3\sigma,\mu+3\sigma)\)之内的概率为\(0.9974\)

则尺寸落在\((\mu-3\sigma,\mu+3\sigma)\)之外的概率为\(1-0.9974=0.0026\)

因为\(P(X=0)=C_{16}^0\times (1-0.9974)^0\times 0.9974^{16}=0.9592\)

所以\(P(X\ge 1)=1-P(X=0)=0.0408\)

又由于\(X\sim B(16,0.0026)\),故\(E(X)=16\times 0.0026=0.0416\)

(2)一天内抽检零件中,如果出现了尺寸在\((\mu-3\sigma,\mu+3\sigma)\)之外的零件,就认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查.

(ⅰ)试说明上述监控生产过程方法的合理性;

分析:如果生产状态正常,一个零件尺寸在\((\mu-3\sigma,\mu+3\sigma)\)之外的概率只有\(0.0026\),一天内抽取的16个零件中,出现尺寸在\((\mu-3\sigma,\mu+3\sigma)\)
外的零件的概率只有\(0.0408\),发生的概率很小。因此一旦发生这种状况,就有理由认为这条生产线在这一天的生产过程可能出现了异常情况,需对当天的生产过程进行检查,可见上述监控生产过程的方法是合理的.

(ⅱ)下面是检验员在一天内抽取的16个零件的尺寸:

抽取次序 1 2 3 4 5 6 7 8
零件尺寸 09.95 10.12 09.96 09.96 10.01 09.92 09.98 10.04
抽取次序 9 10 11 12 13 14 15 16
零件尺寸 10.26 09.91 10.13 10.02 09.22 10.04 10.05 09.95

经计算得\(\bar{x}=\cfrac{1}{16}\cdot\sum\limits_{i=1}^{16}{x_i}=9.97\)\(s=\sqrt{\cfrac{1}{16}\cdot\sum\limits_{i=1}^{16}{(x_i-\bar{x})^2}}=\sqrt{\cfrac{1}{16}(\sum\limits_{i=1}^{16}{x_i^2-16\bar{x}^2})}\approx 0.212\)

\(\sqrt{\sum\limits_{i=1}^{16}{(i-8.5)^2}}\approx 18.439\)\(\sum\limits_{i=1}^{16}{(x_i-\bar{x})(i-8.5)}=-2.78\),其中\(x_i\)为抽取的第\(i\)个零件的尺寸,\(i=1,2,\cdots,16\)

用样本平均数\(\bar{x}\)作为\(\mu\)的估计值\(\hat{\mu}\),用样本标准差\(s\)作为\(\sigma\)的估计值\(\hat{\sigma}\),用估计值判断是否需对当天的生产过程进行检查?剔除\((\mu-3\sigma,\mu+3\sigma)\)之外的数据,用剩下的数据估计\(\mu\)\(\sigma\)(精确到0.01).

附:若随机变量\(Z\)服从正态分布\(N(\mu,\sigma^2)\),则\(P(\mu-3\sigma<Z<\mu+3\sigma)=0.9974\)\(0.9974^{16}≈0.9592\)\(\sqrt{0.008}≈0.09\)

分析:由\(\bar{x}=9.97\)\(s\approx 0.212\),得到\(\mu\)的估计值\(\hat{\mu}=9.97\)\(\sigma\)的估计值\(\hat{\sigma}= 0.212\)

由样本数据可以看出,有一个零件的尺寸在\((\mu-3\sigma,\mu+3\sigma)\)之外,因此需对当天的生产过程进行检查。

剔除\((\mu-3\sigma,\mu+3\sigma)\)之外的数据\(9.22\),剩下数据的平均值为\(\cfrac{16\times 9.97-9.22}{15}=10.02\)

因此\(\mu\)的估计值\(\hat{\mu}=10.02\)

由于\(\sum\limits_{i=1}^{16}{x_i^2}=16\times 0.212^2+16\times 9.97^2\),剔除数据\(9.22\)后剩下的数据,

\(\sum\limits_{i=1}^{15}{x_i^2}=16\times 0.212^2+16\times 9.97^2-9.22^2=1506.125\)

\(\sum\limits_{i=1}^{15}{x_i^2}-15\times\bar{x}_{15}^2=1506.125-15\times10.02^2=0.119104\)

故剩余数据的样本方程为\(\cfrac{1}{15}(\sum\limits_{i=1}^{15}{x_i^2}-15\times\bar{x}_{15}^2)\approx 0.008\)

故所求的\(\sigma\)的估计值为\(\hat{\sigma}=\sqrt{0.008}\approx 0.09\)

即剩下15个数据的平均数的估计值\(\hat{\mu}=10.02\),标准差的估计值\(\hat{\sigma}=0.09\)

posted @ 2018-05-22 11:20  静雅斋数学  阅读(433)  评论(0编辑  收藏  举报
您已经努力一段时间了
活动活动喝杯咖啡吧
                  ----静雅斋