【转载】- 保姆级MTBF入门介绍

本文更适合非可靠性专业人士阅读,也欢迎可靠性专业大神指正!

https://zhuanlan.zhihu.com/p/653041731

功能安全(FuSa)https://www.cnblogs.com/ljbguanli/p/18916623 

 

直接上干货!以下是我花费了一周时间原创的MTBF计算模板示意图,这个模板是基于本文介绍的公式创建的,可以轻松地将可靠性试验数据转化为MTBF值,甚至估算售后返修率。更重要的是,这个模板已经在我的实际工作中被证明非常有效。

下载链接放在最后,原创不易欢迎关注、点赞、回复!

http://weixin.qq.com/r/axLRyd3EwIC-rZmq90d5 (二维码自动识别)

 

MTBF是什么意思?

MTBF 即平均故障间隔时间,英文全称是“Mean Time Between Failure”,指产品在规定的工作环境条件下开始工作到出现第一个故障的时间的平均值。MTBF越长表示产品可靠性越高,在寿命周期内的故障和维修次数也就越低,单位为“小时”。通常也指相邻两次故障之间的平均工作时间,它仅适用于可维修产品(不可维修产品用MTTF)

 

 

这里要请出出镜率极高的浴盆曲线

浴盆又称失效率曲线,指产品从投入到报废为止的整个生命周期内,其可靠性的变化呈现一定的规律,大致分为早期失效期、随机失效期、损耗失效期。一般认为MTBF是评价的随机失效期Ⅱ。

 

 

敲黑板:MTBF并不等同于单个产品的寿命

MTBF可以反映产品可靠性,但并不等同于单个产品的使用寿命。例如,在产品规格中,我们可能会看到MTBF达到10万甚至100万小时的描述,但这并不意味着每个产品的寿命都能达到这么多小时。要真正理解MTBF的含义,需要从其计算过程入手,这是一项有点复杂的任务。不过不要慌,本文会手把手教会你。

MTBF简算公式为:MTBF=1/λ

这个公式是怎么来的呢?

λ 代表失效率(Failure Rate) 在多个样品的测试中,λ是失效个数 r 与 测试总样品n 在指定测试条件下运行 t 时间的比值即 λ= r /( n*t )

当产品的寿命服从指数分布时,失效率的倒数就是MTBF

λ=1/MTBF (MTBF的公式就是从这里推导出来的)

举个经典的栗子:某固态硬盘SSD MTBF标称为150万小时,保修5年;150万小时约为171年,并不是说该产品SSD每块盘均能工作171年不出故障。λ=1/MTBF=1/171年,即该固态硬盘的平均年故障率约为0.6%。一年内,平均1000块固态硬盘有6块会出故障。

看到这里应该就可以明白 MTBF实际上多样本的统计值,对应到每一个产品个体来说它代表的是一定时间内故障概率的高低,注意是概率。既然是概率,那么标称MTBF150万小时的SSD,在你手上第一天就坏掉也是有可能的。

对于生产厂家来说,他们标称的MTBF具体是怎么测试出来的呢。标称MTBF150万小时的SSD,需要真的测试150万小时也就是171年么?

MTBF一般有三种测试方法:预测法、实测法、实验法

1、预测法

预测法是通过理论模型计算的方式评估MTBF值,就是纯理论计算。这个方式成本最低但局限性也很明显的,笔者没有用过这个方法不做赘述,有兴趣的读者可以自行查阅如下标准。目前最通用的标准是MIL-HDBK-217GJB/Z299B和Bellcore,分别用于军工产品和民用产品。其中,MIL-HDBK-217是由美国国防部可靠性中心及Rome实验室提出并成为行业标准,专门用于军工产品MTBF值计算,GJB/Z299B是我国军用标准;而Bellcore是由AT&TBell实验室提出并成为商用电子产品MTBF值计算的行业标准。

2、实测法

顾名思义,就是直接测试到需要宣称的MTBF时间,最终统计结果。这种方式所得出的结果最为准确,但耗时太长已经不适应目前快节奏的产品研发需求(除非MTBF预期值很小)。所以此方法在电子产品研发阶段几乎不再使用,但并非完全没有意义。比如可以持续监控数年售后真实MTBF数据,评估出产品在真实环境下的MTBF值,供后续同类产品参考。

3、实验法(重点)

这种方法是比较推荐的一种方法,通过合理的测试方法,利用测试数据评估出来的MTBF值。器准确性还是够用的,笔者实践用的就是这一种方法。

实验法大致也分:

定时截尾试验:指实验到规定的时间终止。

定数截尾试验:指实验到出现规定的故障数或失效数时而终止。

 

简单算法(不考虑置信度) :

MTBF=总测试时间 Total Test Time * 加速因子 AF / 失效数 failure n

相对严谨算法(考虑置信度):

MTBF=总测试时间 Total Test Time* 加速因子 AF/ 信心系数 UCL

两种方式主要区别在于是否考虑置信度,置信度的选择需要一定的经验。

公式中:总测试时间Total Test Time=(样品数量 Sample Size) *(测试天数Test Days)*( 开机小时数Power On Hours/ 天数Day)

UCL :Unit Confidence Level,信心系数。这里涉及到统计学的知识此处略过,UCL可直接查表得到。

Confidence Level:信心度 ,一般取60%

下表就是Confidence Level =60%时的UCL查询表(来自JESD47)

表中AL指失效的产品数,n就是要查询UCL值。

 

练习:

100块固态硬盘SSD样品,信心度为60%,用户使用温度为30度,测试温度为55度。测试时硬盘24小时工作,假设在测试60天后,有1块盘失效,请计算MTBF值。

解:

首先需要计算出加速因子 AF

这里AF=e{ Ea/Kb*[1/Tn-1/Ta]}=24.78 (加速因子的具体介绍放在后文,这里记住结果即可)

然后确认UCL,已知信心度为60%,失效数为1,查表可知UCL=2.03

带入公式 :

MTBF=总测试时间 Total Test Time* 加速因子 AF/ 信心系数 UCL

=样品数100*测试天数 60* 每日工作小时 24* AF 24.78/ UCL 2.03

≈170W 小时

Confidence Level 不想取60%怎么办?其它常用Confidence Level 取值对应的UCL查询表也帮你整理好了。

ConfidenceLevel Number of failure
0 1 2 3 4 5 6 7
95% 2.9957 4.7439 6.2958 7.7537 9.1535 10.5130 11.8424 13.1481
90% 2.30262.3026 3.8897 5.3223 6.6808 7.9936 9.2747 10.5321 11.7709
85% 1.8971 3.8897 4.7231 6.0135 7.2670 8.4947 9.7031 10.8963

现在来介绍一下加速因子AF怎么计算

首先要明白为什么会有加速因子,这是因为产品设计寿命一般都是按年计算。研发过程中,需要验证样品是否满足设计寿命,但又不可能真的测试好几年。那有没有缩短测试时间的办法呢?当然有,针对某些测试时间比较长的试验, 往往会选择通过加速应力的方式,缩短试验时间,节约试验经费,达到想要的试验结果,这种试验被称为加速试验,其基本思想是利用高应力下的寿命特征去外推正常应力水平下的寿命特征。实现这个基本思想的关键在于建立寿命特征与应力水平之间的关系,即加速模型。

常用的加速模型如下:

阿伦纽斯模型 Arrhenius

阿伦纽斯模型(Arrhenius Model),仅计算温度应力的加速作用,相对最简单。常用与失效机理主要由温度引起的产品

 

 

AF(t):温度加速因子;

Ea:激活能(Activation energy介于0.3 eV~1.2 eV);

K:玻尔兹曼常数(Boltzman Constant);

Tu:Tuse为正常使用的环境温度, 绝对温度(K)=℃+273;

Ts:Tstress为试验应力时环境温度,绝对温度(K)=℃+273;

激活能Ea

激活能Ea是使晶体原子离开平衡位置迁移到另一个新的平衡或非平衡位置所需要的能量。Ea根据原材料的不同,有不同的取值,一般情况下如下表所示。电子产品按经验通常选取0.67eV。

氧化膜破坏 0.3 eV
离子性(SiO2中Na离子漂移) 1.0~1.4 eV
离子性(Si-SiO2界面的慢陷阱) 1.0 eV
由于电迁移而断线 0.6 eV
铝腐蚀 0.6~0.9eV
金属间化合物生长 0.5~0.7eV

玻尔兹曼常数 K

玻尔兹曼常数(Boltzmann Constant)(k 或 kB)是有关于温度及能量的一个物理常数直接按下表取值使用即可。

因为激活能Ea单位是eV所以,计算式取8.6173324(78)×10^-5

数值 单位
1.3806488(13)×10^−23 J.K^−1
8.6173324(78)×10^-5 eV.K^−1
1.3806488(13)×10^−16 erg.K^−1

哈尔伯格-佩克模型 Hallberg-Peck(笔者最常用的模型)

Hallberg-Peck模型综合考虑了温度、湿度影响,是在Arrhenius模型上的延伸。在众多的环境试验中,温度、湿度是最为常见的,同时也是使用频率最高的模拟环境因子。实际环境中温度、湿度也是不可忽略的影响产品使用寿命的因素。Hallberg-Peck模型中的温、湿度加速因子计算模型如下式。

 

 

AF(T&H):湿度&湿度加速因子;

RHs:RHstress为施加应力相对湿度值;

RHu:RHuse为正常使用条件下的相对湿度值;

n: 为湿度加速率常数介于2~3,推荐选择3;

其余参数同Arrhenius模型。

艾琳模型 Eyring

产品除了环境应力的作用外,电应力的作用也不可忽视。电应力也会促使器件内部产生离子迁移、质量迁移等,造成短路、绝缘击穿短路失效等。器件在电压、电流或功率等电应力作用下,应力越强、失效速率越快,器件寿命越短。Eyring模型是Arrhenius模型的扩展,用于温度和电压同时加速的试验项目。

 

β:电压加速常数(0.5≤β≤1.0,根据不同失效机理,默认值为1.0);

Vstress:试验时应力电压

Vuse:使用是的电压

其余参数同Arrhenius模型。

此外还有评估温度冲击加速的 科芬-曼森模型,据说该模型能够比较好的模拟出焊接失效的场景。评估随机振动的加速模型等等,篇幅有限不做介绍。

看到这里,相信大家都已经了解了MTBF的基础知识了。

下面就是基于Hallberg-Peck模型的MTBF自动计算模板下载链接(滑到最后)

posted on 2025-10-29 09:20  ENGINEER-F  阅读(5)  评论(0)    收藏  举报