⑴ 服务器设备故障概率问题,求专家指点!!!
假设设备工作相互独立,且发生故障是等可能的,并按天计算故障率。
1.上年度,78台设备,有41台发生78台次故障,就是说修好后又坏了吧。。所以,上一年度该类设备的故障率p是78/365=0.2137
2.两台设备同一天发生故障,是在41台故障设备中任选2台,所有故障的设备每天发生故障的概率相等为1,9/365. 用等可能概型计算就好,2台同一天故障的概率为Combin(41;2)*(1,9/365)^2*((365-1,9)/365)^39=1.81%
我想解释一下,
第一,如果在全年的78次故障里任选2次,会包括同一台设备在不同的2天时发生故障的概率,就是说,2次故障不是同一天发生的。不能保障题目的要求计算会有误。所以,不能用78次!
第二,不能用78/365的概率水平,是因为已知了这41台在上一年的故障率为78/41.每台发生1.9次。用1.9/365的概率,是要表达每台机器每天发生故障的概率,A可以以此概率今天发生,B也可以以此概率今天发生,然后明天接着以此概率发生,一直到一年中 这41台设备以此概率发生了78次事故。
3.根据故障率p=0.2137,样本容量n=78,可以用二项分布确定需要的台数。但你说的刚好满足替换要求,不是太明确,我觉得给一个概率水平会好些,比如99.99999% 。所以题目就是求一个二项分布里N的数量的计算题。P(X>N+1)的概率= Σk=N+1到78combin(78;k)*p^k*(1-p)^(78-k),是个求和式。解出k就得到N了。这个式子基本很难算。但由题可以看出来n*p=16.7且 n*(1-p)=61 都大于5,可以用正态分布近似计算这个二项分布。所以用Z=(N-np)/((np*(1-p))^1/2
Z在99.99999%是等于6,解出N=38.3,需要做+0.5(或-0.5)的矫正,因为二项分布是离散型的。所以需要准备39台备用设备,才能几乎100%的保证替换要求。如果降低需求,比如99.5%需要27台,97.5%需要24台,也没有少多少。。。台数好像有点多。。。我觉得是因为计算出来的故障率太高的缘故(p=0.2173)。如果故障率计算的对,那么要达到替换要求,就需要准备这么多设备。故障率的计算有严格的算法,需要计算设备停工时间,维修时间,使用时间,计划使用时间...根据已知条件,得不到太实际的结果。写到最后我也晕了,希望我没有理解错。理解错了还请大家帮我纠正。多谢了
⑵ FIT失效率(一)
事情的经过是这样的,前两天在回复完客户的需求后,在督促供应商给出关于他们产品的可靠性报告和FIT报告的时候,供应商回复我不知道FIT报告是什么,甚至都不知道FIT是什么。。。我解释了半天(这家供应商是国外公司的代理公司,并非业内人士,后来才知道),发现自己也好像说不出一个一二三来(我果然是个水货),想了想还是得把这个东西理一理。
在一切的一切开始之前,我们先来谈一下FIT是什么鬼~FIT(failures in time/有的地方也叫failures instance time)直译过来就是时基失效。与此同时这货也是有定义的,它主要是用来定义产品的可靠性,同时它还是它本身参数的单位,1 FIT(失效率)指的是1个(单位)的产品在1*10^9小时内出现1次失效(或故障)的情况。好,说人话,有个产品呢在使用1亿小时之内,只发生了1次失效,那我们就称这个产品在该时间段内的失效率是1fit。记住,既然是时基失效,那一切抛开时间谈失效率的行为都是耍流氓,毕竟可靠也要有个限度是吧?好,搞清这个的定义以后呢,我们来看看跟它对应的一个很重要的可靠性概念MTBF(Mean Time Between Failure),也就是它的倒数(这个倒数的情况是要在产品的寿命服从指数分布的情况下)。
简单理解一下,好比我们做个实验,我们同时使用100个灯泡做老化实验(我纯粹举例的),然后做了一年也就是365天,发现有20个不亮了(失效数是20个)最后MTBF怎么算呢?算不出来。。。因为MTBF是针对可维修产品的一种可靠性参数,灯泡这玩意儿坏了没法修,所以不适用这个,灯泡你应该用MTTF(平均失效时间)来衡量,这个后面有机会再讲。好,咱们重新举例,我们使用一台手机,使用了10000小时,共发生了4次故障,那我们根据定义就可以算一下这个手机的MTBF,就是10000/4=2500小时。算了这个有什么用?MTBF越长,说明在相同的使用时间内发生失效的次数就越小,也就是这个产品在单位时间内发生故障的概率越小,也就是说这个产品在对应时间内的FIT值越小,这是好事,也是可靠性工程师一直追求的目标。
MTBF讲清楚了,我们再回到最开始的FIT报告,FIT报告一般都会要求说写明条件,什么条件下(这个条件一般指的是环境条件,如温度,湿度等等),什么置信度的情况下,使用多长时间的得出的一个值。而这个值就是我们需要的在产品的可靠性设计中需要考虑到的,是否能够满足我们对产品的使用要求,而这个值在正常使用中有三种算法。
第一种,通过经验或者国际上的通用标准参考文件,考虑复杂产品属于并联系统还是串联系统,如果是串联系统的话呢,此时我们就要针对各个部分结构件的失效率参考值,将他们加起来(串联系统的失效率是累加的,因为不存在冗余),此刻我们得到的这个FIT值会非常的大,此时的FIT值我们仅作为产品研发设计阶段的一个参考值,实际不会以这个来衡量我们产品的真实失效情况。
第二种,在经过一系列的设计实验后,产品已经定型并且在供给客户市场使用(也就是性能稳定的正常使用时期),通过监控产品的可靠性失效数量,在已知总的出货数量的情况下,能够计算出总的使用时长,基于这些数据就可以算出我们产品的FIT值,这个FIT值是产品的真实情况反应出来的失效率,我们一般认为这个数据是比较准确的,也是最有参考价值的数据。
补充一下置信度的概念,在我们FIT报告里面,经常看到什么90%置信度,60%置信度的,很多人往往不明确这个是什么,为啥要这样来写?这是因为可靠度本身就是一门基于数理统计学的学科,它是通过已有的产品数据来估计对应产品的规律,以此来衡量产品的特性,既然涉及到估计,这里就引入置信度的概念——统计学中针对一个概率样本的区间估计,体现的是参数的真实值有多大的概率落在测试值的周围,90%置信度也就是说有90%的可能会接近于我们的测试值。
第三种,在我们产品使用了相当一段时间之后,由于产品本身老化的原因或者是对应结构的耗损引起的失效,此时的失效率将会比较大,此时我们一般会根据供应商或者我们自己的实验结果来(此项数据一般需要有足够的数据支持)衡量产品的失效率,这个也是经常找供应商要的数据部分
以上三种方式并不是使用与所有的产品的,有些质量很棒的产品在寿命周期内就是一条直线(现在知道为啥我说第二种方式经常用到了吧,因为我们公司产品质量好啊,嘿嘿)三种方式其实分别与我们产品的故障率曲线是紧密相关的,在产品研发设计阶段更容易出现因为设计不完善,材料选用,结构问题等等问题引起的早期失效,此时就是我们的第一种情况,早期故障期,发生故障的概率会随着研发的深入,产品的成熟而降低,在初期的可靠性设计中应该将FIT值算出来作为产品可靠性的一个衡量基准(可惜目前绝大数的公司都没有这一步);那在产品真正成熟后,故障率会降到一个比较低的基准,此时发生的失效我们称之为随机失效(也就是我们经常要的random-life的FIT),这个也即时和第二种FIT计算方式对应起来,此时的失效率即是反应成熟产品可靠性的一个重要参数。而到了最后的耗损故障期(也就是我们常说的wear-out life)的失效率又会突然增大,主要的原因在于老化,疲劳,腐蚀等等耗损原因引起的失效,此时的意义在于我们可以监控耗损阶段的起始位置,我们可以在快到那个地方的时候经进行预防性修复,这样就可以延长产品的使用时间啦。三个阶段都有自己独特的失效率特点,我们还是需要根据实际情况来选用分析数据,这些都可以为我们的产品可靠性提供服务,甚至与我们可以人为地去干涉这个浴盆曲线。
好了,本篇关于FIT的就先说到这里了,很多是我自己的理解,如果有不对的地方还请帮忙指出,下次将谈谈FIT详细的计算方法。
⑶ 设备故障率如何计算目标定在多少合理
设备故障就意味着停产,你有多长时间未维修好,企业就会损失多少时间的利润。因此故障率是硬性指标。从企业角度看,不会理解维修工是否很忙。企业只关心是否可以恢复生产。所以对于故障率我们不应只考虑如何去修,应该多考虑如何去保养,有计划的维修。尽量保证设备在计划的时间段不出故障,或者在设备故障前期就进行维修。这样才可以省时省力、省钱。
⑷ 操作系统LRU算法习题求解!!!
LRU队列长度为 (384/128) = 3。
87、138、277、56、390、532、285、410、45、180、330、190
对应的页面号依次为:
0 、 1 、 2 、 0 、 3 、 4 、 2 、 3 、 0 、 1 、 2 、 1
然后看看那几个页面会缺页:
0、1、2 都会缺页,因为一开始内存里面什么页面都没有。
0会命中。 现在内存里面页面的LRU顺序为0,2,1
3、4都会缺页。 内存中没有。 现在内存里面LRU顺序为 4,3,0
2会缺页。 内存中没有。 LRU顺序为 2,4,3
0、1会缺页。 内存中没有。 LRU顺序为 1,0,2
2、1会命中。
总共12次访问,只有3次命中,9次失效。
失效率为 9/12 = 75%
⑸ 设备故障率怎么算的
设备故障率=单位时间内故障发生的比率。
实践证明,可维修设备的故障率随时间的推移呈图示曲线形状,这就是着名的“浴盆曲线”。初始故障期:故障率由高而低。材料缺陷、设计制造质量差、装配失误、操作不熟练等原因造成。
设备故障率的演变分为:
初期故障期,这时故障的原因主要由于设计、制造不良,保管、运输不慎。所以,设备在运转初期故障较高,经过运转、跑合、调整、维修,故障率将逐步下降并趋于稳定。
偶发故障期,此时设备的零部件均未达到使用寿命,不易发生故障,但由于操作失误等原因,在一部分零件上积累了超过设计强度的应力,导致了事故的发生。
⑹ 降低cache失效率有哪几种方法
实验四 Cache性能分析
实验目的
1. 加深对Cache的基本概念、基本组织结构以及基本工作原理的理解;
2. 了解Cache的容量、相联度、块大小对Cache性能的影响;
3. 掌握降低Cache失效率的各种方法,以及这些方法对Cache性能提高的好处;
4. 理解Cache失效的产生原因以及Cache的三种失效;
5. 理解LRU与随机法的基本思想,及它们对Cache性能的影响;
实验平台
SimpleScalar模拟器
实验内容及步骤
1. 运行SimpleScalar模拟器;
2. 在基本配置情况下运行程序(请指明所选的测试程序),统计Cache总失效次数、三种不同种类的失效次数;
3. 改变Cache容量(*2,*4,*8,*64),运行程序(指明所选的测试程序),统计各种失效的次数,并分析Cache容量对Cache性能的影响;
4. 改变Cache的相联度(1路,2路,4路,8路,64路),运行程序(指明所选的测试程序),统计各种失效的次数,并分析相联度对Cache性能的影响;
5. 改变Cache块大小(*2,*4,*8,*64),运行程序(指明所选的测试程序),统计各种失效的次数,并分析Cache块大小对Cache性能的影响;
6. 分别采用LRU与随机法,在不同的Cache容量、不同的相联度下,运行程序(指明所选的测试程序)统计Cache总失效次数,计算失效率。分析不同的替换算法对Cache性能的影响。
预备知识
1. SimpleScalar模拟器的相关知识。详见相关的文档。
2. 复习和掌握教材中相应的内容
(1) 可以从三个方面改进Cache的性能:降低失效率、减少失效开销、减少Cache命中时间。
(2) 按照产生失效的原因不同,可以把Cache失效分为三类:
① 强制性失效(Compulsory miss)
当第一次访问一个块时,该块不在Cache中,需从下一级存储器中调入Cache,这就是强制性失效。这种失效也称为冷启动失效或首次访问失效。
② 容量失效(Capacity miss)
如果程序执行时所需的块不能全部调入Cache中,则当某些块被替换后,若又重新被访问,就会发生失效。这种失效称为容量失效。
③ 冲突失效(Conflict miss)
在组相联或直接映象Cache中,若太多的块映象到同一组(块)中,则会出现该组中某个块被别的块替换(即使别的组或块有空闲位置),然后又被重新访问的情况。这就是发生了冲突失效。这种失效也称为碰撞失效(collision)或干扰失效(interference)。
(3) 降低Cache失效率的方法:增加Cache块大小、提高相联度、Victim Cache、伪相联Cache、硬件预取技术、由编译器控制的预取和编译器优化。
(4) 替换算法
① 随机法:为了均匀使用一组中的各块,这种方法随机地选择被替换的块。
② 最近最少使用法LRU(Least Recently Used):选择近期最少被访问的块作为被替换的块。但由于实现比较困难,现在实际上实现的LRU都只是选择最久没有被访问过的块作为被替换的块。
测试程序
gzip:
Gzip_base.pisa.little: smred.log, mdred.log, lgred.log;
Gzip_preak.pisa.little: smred.log/random/source, mdred.log/random/source,
lgred.log/random/source;
Gcc:
cc1_base.pisa_littlecc1_peak.pisa_little: smred.c-iterate, mdred.reland, test.cccp;
mesa:
mesa_base.pisa_littlemesa_peak.pisa_little: lgred.in;
mcf:
mcf_base.pisa_little: smred, mdred;
mcf_peak.pisa_little: smred, mdred, lgred
每个测试程序所需时间大概是10分钟,选择测试程序时注意从不同组中选择,以便使得出的结果不会因为对单项有所侧重而有失偏颇。
每个人从中选出4~6个测试程序进行测试。
⑺ 设备的故障率计算问题,请教高手
我公司的月设备故障率计算方法:月故障率=本月设备故障时间总和/本月设备计划使用时间*100%
⑻ 保单失效率与保单年度的关系是
人寿保险缴费时间能延长60天以内。
保单失效是指投保人未按合同约定交纳续期保费,到宽限期(每张保单均有60天的缴费宽限期)最后一日仍未将保费交齐,而使保单暂时失去效力,保单失效后,保险公司不再承担保险责任投保人可在保单暂时失效日起两年内到保险公司申请复效,否则,保单将永久失效。
引致保单失效的原因是多方面的,归纳起来主要有以下几方面:
1.社会经济环境的变化:国外研究表明,保单失效率要受社会整体经济环境变化的影响。经济环境向好时,保单失效率相对降低;经济环境恶化或经济波动时保单失效率相对提高。由于寿险合同一般为长期合同,其价格和保险金额一旦确定,在保险有效期间许多产品拥有相对稳定且较高的价值;而一旦经济环境变得恶劣且波动大;市场利率的升高或通货膨胀率;连续大规模国家财政赤字及其引起的高利率就会使保单持有人因担忧寿险产品的灵活性或保值性而导致失效率提高。
2.投保人的经济状况:投保人的经济状况很显然会影响到保单的失效率,在参加相同保险的人群中,经济状况差而收入不稳定的投保群体必然比经济状况好而收入稳定的群体的失效率高。
3.被保人的健康状况:对参加死亡保单的投保群体而言,当健康的被保人感到缴费困难时,往往会毫不犹豫地退保,而健康状况不好的被保人会充分认识到保险的价值而尽量缴付保费,不会轻易退保。
4.保单年度:保单失效率一般随保单年度的增加而降低。当然也有例外,如保费递增的定期寿险的失效率,常常会随保单年度的增加而提高,而个人年金各年的失效率基本比较稳定。
5.被保人的投保年龄:十几岁到二十几岁的人口保单失效率较高,而30岁以上的被保人随年龄增大而使失效率降低。
6.保额:大额保单的失效率通常较低额保单的失效率低。
7.保费支付方式的频率:按年缴费与每月从工资中扣除保费的失效率较低,而每月直接缴费时失效率较高。
8.性别:当其他情况相同时,女性的保单失效率较男性低。
9.保单类型:保单的类型不同其失效率是有所区别的。如定期寿险、终身寿险、个人年金等的失效率各不相同。
扩展阅读:【保险】怎么买,哪个好,手把手教你避开保险的这些"坑"
⑼ 设备平均故障率如何计算
设备故障率=[(停机等待时间+维修时间)÷计划使用总时间]×100%
设备故障:设备在其寿命周期内,由于磨损或操作使用等方面的原因,使设备暂时丧失其规定功能的状况。
a)突发故障:突然发生的故障。发生时间随机,较难预料,设备使用功能丧失。
b)劣化故障:由于设备性能的逐渐劣化所引起的故障。发生速度慢,有规律可循,局部功能丧失。
设备故障率:单位时间内故障发生的比率。