⑴ 伺服器設備故障概率問題,求專家指點!!!
假設設備工作相互獨立,且發生故障是等可能的,並按天計算故障率。
1.上年度,78台設備,有41台發生78台次故障,就是說修好後又壞了吧。。所以,上一年度該類設備的故障率p是78/365=0.2137
2.兩台設備同一天發生故障,是在41台故障設備中任選2台,所有故障的設備每天發生故障的概率相等為1,9/365. 用等可能概型計算就好,2台同一天故障的概率為Combin(41;2)*(1,9/365)^2*((365-1,9)/365)^39=1.81%
我想解釋一下,
第一,如果在全年的78次故障里任選2次,會包括同一台設備在不同的2天時發生故障的概率,就是說,2次故障不是同一天發生的。不能保障題目的要求計算會有誤。所以,不能用78次!
第二,不能用78/365的概率水平,是因為已知了這41台在上一年的故障率為78/41.每台發生1.9次。用1.9/365的概率,是要表達每台機器每天發生故障的概率,A可以以此概率今天發生,B也可以以此概率今天發生,然後明天接著以此概率發生,一直到一年中 這41台設備以此概率發生了78次事故。
3.根據故障率p=0.2137,樣本容量n=78,可以用二項分布確定需要的台數。但你說的剛好滿足替換要求,不是太明確,我覺得給一個概率水平會好些,比如99.99999% 。所以題目就是求一個二項分布里N的數量的計算題。P(X>N+1)的概率= Σk=N+1到78combin(78;k)*p^k*(1-p)^(78-k),是個求和式。解出k就得到N了。這個式子基本很難算。但由題可以看出來n*p=16.7且 n*(1-p)=61 都大於5,可以用正態分布近似計算這個二項分布。所以用Z=(N-np)/((np*(1-p))^1/2
Z在99.99999%是等於6,解出N=38.3,需要做+0.5(或-0.5)的矯正,因為二項分布是離散型的。所以需要准備39台備用設備,才能幾乎100%的保證替換要求。如果降低需求,比如99.5%需要27台,97.5%需要24台,也沒有少多少。。。台數好像有點多。。。我覺得是因為計算出來的故障率太高的緣故(p=0.2173)。如果故障率計算的對,那麼要達到替換要求,就需要准備這么多設備。故障率的計算有嚴格的演算法,需要計算設備停工時間,維修時間,使用時間,計劃使用時間...根據已知條件,得不到太實際的結果。寫到最後我也暈了,希望我沒有理解錯。理解錯了還請大家幫我糾正。多謝了
⑵ FIT失效率(一)
事情的經過是這樣的,前兩天在回復完客戶的需求後,在督促供應商給出關於他們產品的可靠性報告和FIT報告的時候,供應商回復我不知道FIT報告是什麼,甚至都不知道FIT是什麼。。。我解釋了半天(這家供應商是國外公司的代理公司,並非業內人士,後來才知道),發現自己也好像說不出一個一二三來(我果然是個水貨),想了想還是得把這個東西理一理。
在一切的一切開始之前,我們先來談一下FIT是什麼鬼~FIT(failures in time/有的地方也叫failures instance time)直譯過來就是時基失效。與此同時這貨也是有定義的,它主要是用來定義產品的可靠性,同時它還是它本身參數的單位,1 FIT(失效率)指的是1個(單位)的產品在1*10^9小時內出現1次失效(或故障)的情況。好,說人話,有個產品呢在使用1億小時之內,只發生了1次失效,那我們就稱這個產品在該時間段內的失效率是1fit。記住,既然是時基失效,那一切拋開時間談失效率的行為都是耍流氓,畢竟可靠也要有個限度是吧?好,搞清這個的定義以後呢,我們來看看跟它對應的一個很重要的可靠性概念MTBF(Mean Time Between Failure),也就是它的倒數(這個倒數的情況是要在產品的壽命服從指數分布的情況下)。
簡單理解一下,好比我們做個實驗,我們同時使用100個燈泡做老化實驗(我純粹舉例的),然後做了一年也就是365天,發現有20個不亮了(失效數是20個)最後MTBF怎麼算呢?算不出來。。。因為MTBF是針對可維修產品的一種可靠性參數,燈泡這玩意兒壞了沒法修,所以不適用這個,燈泡你應該用MTTF(平均失效時間)來衡量,這個後面有機會再講。好,咱們重新舉例,我們使用一台手機,使用了10000小時,共發生了4次故障,那我們根據定義就可以算一下這個手機的MTBF,就是10000/4=2500小時。算了這個有什麼用?MTBF越長,說明在相同的使用時間內發生失效的次數就越小,也就是這個產品在單位時間內發生故障的概率越小,也就是說這個產品在對應時間內的FIT值越小,這是好事,也是可靠性工程師一直追求的目標。
MTBF講清楚了,我們再回到最開始的FIT報告,FIT報告一般都會要求說寫明條件,什麼條件下(這個條件一般指的是環境條件,如溫度,濕度等等),什麼置信度的情況下,使用多長時間的得出的一個值。而這個值就是我們需要的在產品的可靠性設計中需要考慮到的,是否能夠滿足我們對產品的使用要求,而這個值在正常使用中有三種演算法。
第一種,通過經驗或者國際上的通用標准參考文件,考慮復雜產品屬於並聯系統還是串聯系統,如果是串聯系統的話呢,此時我們就要針對各個部分結構件的失效率參考值,將他們加起來(串聯系統的失效率是累加的,因為不存在冗餘),此刻我們得到的這個FIT值會非常的大,此時的FIT值我們僅作為產品研發設計階段的一個參考值,實際不會以這個來衡量我們產品的真實失效情況。
第二種,在經過一系列的設計實驗後,產品已經定型並且在供給客戶市場使用(也就是性能穩定的正常使用時期),通過監控產品的可靠性失效數量,在已知總的出貨數量的情況下,能夠計算出總的使用時長,基於這些數據就可以算出我們產品的FIT值,這個FIT值是產品的真實情況反應出來的失效率,我們一般認為這個數據是比較准確的,也是最有參考價值的數據。
補充一下置信度的概念,在我們FIT報告裡面,經常看到什麼90%置信度,60%置信度的,很多人往往不明確這個是什麼,為啥要這樣來寫?這是因為可靠度本身就是一門基於數理統計學的學科,它是通過已有的產品數據來估計對應產品的規律,以此來衡量產品的特性,既然涉及到估計,這里就引入置信度的概念——統計學中針對一個概率樣本的區間估計,體現的是參數的真實值有多大的概率落在測試值的周圍,90%置信度也就是說有90%的可能會接近於我們的測試值。
第三種,在我們產品使用了相當一段時間之後,由於產品本身老化的原因或者是對應結構的耗損引起的失效,此時的失效率將會比較大,此時我們一般會根據供應商或者我們自己的實驗結果來(此項數據一般需要有足夠的數據支持)衡量產品的失效率,這個也是經常找供應商要的數據部分
以上三種方式並不是使用與所有的產品的,有些質量很棒的產品在壽命周期內就是一條直線(現在知道為啥我說第二種方式經常用到了吧,因為我們公司產品質量好啊,嘿嘿)三種方式其實分別與我們產品的故障率曲線是緊密相關的,在產品研發設計階段更容易出現因為設計不完善,材料選用,結構問題等等問題引起的早期失效,此時就是我們的第一種情況,早期故障期,發生故障的概率會隨著研發的深入,產品的成熟而降低,在初期的可靠性設計中應該將FIT值算出來作為產品可靠性的一個衡量基準(可惜目前絕大數的公司都沒有這一步);那在產品真正成熟後,故障率會降到一個比較低的基準,此時發生的失效我們稱之為隨機失效(也就是我們經常要的random-life的FIT),這個也即時和第二種FIT計算方式對應起來,此時的失效率即是反應成熟產品可靠性的一個重要參數。而到了最後的耗損故障期(也就是我們常說的wear-out life)的失效率又會突然增大,主要的原因在於老化,疲勞,腐蝕等等耗損原因引起的失效,此時的意義在於我們可以監控耗損階段的起始位置,我們可以在快到那個地方的時候經進行預防性修復,這樣就可以延長產品的使用時間啦。三個階段都有自己獨特的失效率特點,我們還是需要根據實際情況來選用分析數據,這些都可以為我們的產品可靠性提供服務,甚至與我們可以人為地去干涉這個浴盆曲線。
好了,本篇關於FIT的就先說到這里了,很多是我自己的理解,如果有不對的地方還請幫忙指出,下次將談談FIT詳細的計算方法。
⑶ 設備故障率如何計算目標定在多少合理
設備故障就意味著停產,你有多長時間未維修好,企業就會損失多少時間的利潤。因此故障率是硬性指標。從企業角度看,不會理解維修工是否很忙。企業只關心是否可以恢復生產。所以對於故障率我們不應只考慮如何去修,應該多考慮如何去保養,有計劃的維修。盡量保證設備在計劃的時間段不出故障,或者在設備故障前期就進行維修。這樣才可以省時省力、省錢。
⑷ 操作系統LRU演算法習題求解!!!
LRU隊列長度為 (384/128) = 3。
87、138、277、56、390、532、285、410、45、180、330、190
對應的頁面號依次為:
0 、 1 、 2 、 0 、 3 、 4 、 2 、 3 、 0 、 1 、 2 、 1
然後看看那幾個頁面會缺頁:
0、1、2 都會缺頁,因為一開始內存裡面什麼頁面都沒有。
0會命中。 現在內存裡面頁面的LRU順序為0,2,1
3、4都會缺頁。 內存中沒有。 現在內存裡面LRU順序為 4,3,0
2會缺頁。 內存中沒有。 LRU順序為 2,4,3
0、1會缺頁。 內存中沒有。 LRU順序為 1,0,2
2、1會命中。
總共12次訪問,只有3次命中,9次失效。
失效率為 9/12 = 75%
⑸ 設備故障率怎麼算的
設備故障率=單位時間內故障發生的比率。
實踐證明,可維修設備的故障率隨時間的推移呈圖示曲線形狀,這就是著名的「浴盆曲線」。初始故障期:故障率由高而低。材料缺陷、設計製造質量差、裝配失誤、操作不熟練等原因造成。
設備故障率的演變分為:
初期故障期,這時故障的原因主要由於設計、製造不良,保管、運輸不慎。所以,設備在運轉初期故障較高,經過運轉、跑合、調整、維修,故障率將逐步下降並趨於穩定。
偶發故障期,此時設備的零部件均未達到使用壽命,不易發生故障,但由於操作失誤等原因,在一部分零件上積累了超過設計強度的應力,導致了事故的發生。
⑹ 降低cache失效率有哪幾種方法
實驗四 Cache性能分析
實驗目的
1. 加深對Cache的基本概念、基本組織結構以及基本工作原理的理解;
2. 了解Cache的容量、相聯度、塊大小對Cache性能的影響;
3. 掌握降低Cache失效率的各種方法,以及這些方法對Cache性能提高的好處;
4. 理解Cache失效的產生原因以及Cache的三種失效;
5. 理解LRU與隨機法的基本思想,及它們對Cache性能的影響;
實驗平台
SimpleScalar模擬器
實驗內容及步驟
1. 運行SimpleScalar模擬器;
2. 在基本配置情況下運行程序(請指明所選的測試程序),統計Cache總失效次數、三種不同種類的失效次數;
3. 改變Cache容量(*2,*4,*8,*64),運行程序(指明所選的測試程序),統計各種失效的次數,並分析Cache容量對Cache性能的影響;
4. 改變Cache的相聯度(1路,2路,4路,8路,64路),運行程序(指明所選的測試程序),統計各種失效的次數,並分析相聯度對Cache性能的影響;
5. 改變Cache塊大小(*2,*4,*8,*64),運行程序(指明所選的測試程序),統計各種失效的次數,並分析Cache塊大小對Cache性能的影響;
6. 分別採用LRU與隨機法,在不同的Cache容量、不同的相聯度下,運行程序(指明所選的測試程序)統計Cache總失效次數,計算失效率。分析不同的替換演算法對Cache性能的影響。
預備知識
1. SimpleScalar模擬器的相關知識。詳見相關的文檔。
2. 復習和掌握教材中相應的內容
(1) 可以從三個方面改進Cache的性能:降低失效率、減少失效開銷、減少Cache命中時間。
(2) 按照產生失效的原因不同,可以把Cache失效分為三類:
① 強制性失效(Compulsory miss)
當第一次訪問一個塊時,該塊不在Cache中,需從下一級存儲器中調入Cache,這就是強制性失效。這種失效也稱為冷啟動失效或首次訪問失效。
② 容量失效(Capacity miss)
如果程序執行時所需的塊不能全部調入Cache中,則當某些塊被替換後,若又重新被訪問,就會發生失效。這種失效稱為容量失效。
③ 沖突失效(Conflict miss)
在組相聯或直接映象Cache中,若太多的塊映象到同一組(塊)中,則會出現該組中某個塊被別的塊替換(即使別的組或塊有空閑位置),然後又被重新訪問的情況。這就是發生了沖突失效。這種失效也稱為碰撞失效(collision)或干擾失效(interference)。
(3) 降低Cache失效率的方法:增加Cache塊大小、提高相聯度、Victim Cache、偽相聯Cache、硬體預取技術、由編譯器控制的預取和編譯器優化。
(4) 替換演算法
① 隨機法:為了均勻使用一組中的各塊,這種方法隨機地選擇被替換的塊。
② 最近最少使用法LRU(Least Recently Used):選擇近期最少被訪問的塊作為被替換的塊。但由於實現比較困難,現在實際上實現的LRU都只是選擇最久沒有被訪問過的塊作為被替換的塊。
測試程序
gzip:
Gzip_base.pisa.little: smred.log, mdred.log, lgred.log;
Gzip_preak.pisa.little: smred.log/random/source, mdred.log/random/source,
lgred.log/random/source;
Gcc:
cc1_base.pisa_littlecc1_peak.pisa_little: smred.c-iterate, mdred.reland, test.cccp;
mesa:
mesa_base.pisa_littlemesa_peak.pisa_little: lgred.in;
mcf:
mcf_base.pisa_little: smred, mdred;
mcf_peak.pisa_little: smred, mdred, lgred
每個測試程序所需時間大概是10分鍾,選擇測試程序時注意從不同組中選擇,以便使得出的結果不會因為對單項有所側重而有失偏頗。
每個人從中選出4~6個測試程序進行測試。
⑺ 設備的故障率計算問題,請教高手
我公司的月設備故障率計算方法:月故障率=本月設備故障時間總和/本月設備計劃使用時間*100%
⑻ 保單失效率與保單年度的關系是
人壽保險繳費時間能延長60天以內。
保單失效是指投保人未按合同約定交納續期保費,到寬限期(每張保單均有60天的繳費寬限期)最後一日仍未將保費交齊,而使保單暫時失去效力,保單失效後,保險公司不再承擔保險責任投保人可在保單暫時失效日起兩年內到保險公司申請復效,否則,保單將永久失效。
引致保單失效的原因是多方面的,歸納起來主要有以下幾方面:
1.社會經濟環境的變化:國外研究表明,保單失效率要受社會整體經濟環境變化的影響。經濟環境向好時,保單失效率相對降低;經濟環境惡化或經濟波動時保單失效率相對提高。由於壽險合同一般為長期合同,其價格和保險金額一旦確定,在保險有效期間許多產品擁有相對穩定且較高的價值;而一旦經濟環境變得惡劣且波動大;市場利率的升高或通貨膨脹率;連續大規模國家財政赤字及其引起的高利率就會使保單持有人因擔憂壽險產品的靈活性或保值性而導致失效率提高。
2.投保人的經濟狀況:投保人的經濟狀況很顯然會影響到保單的失效率,在參加相同保險的人群中,經濟狀況差而收入不穩定的投保群體必然比經濟狀況好而收入穩定的群體的失效率高。
3.被保人的健康狀況:對參加死亡保單的投保群體而言,當健康的被保人感到繳費困難時,往往會毫不猶豫地退保,而健康狀況不好的被保人會充分認識到保險的價值而盡量繳付保費,不會輕易退保。
4.保單年度:保單失效率一般隨保單年度的增加而降低。當然也有例外,如保費遞增的定期壽險的失效率,常常會隨保單年度的增加而提高,而個人年金各年的失效率基本比較穩定。
5.被保人的投保年齡:十幾歲到二十幾歲的人口保單失效率較高,而30歲以上的被保人隨年齡增大而使失效率降低。
6.保額:大額保單的失效率通常較低額保單的失效率低。
7.保費支付方式的頻率:按年繳費與每月從工資中扣除保費的失效率較低,而每月直接繳費時失效率較高。
8.性別:當其他情況相同時,女性的保單失效率較男性低。
9.保單類型:保單的類型不同其失效率是有所區別的。如定期壽險、終身壽險、個人年金等的失效率各不相同。
擴展閱讀:【保險】怎麼買,哪個好,手把手教你避開保險的這些"坑"
⑼ 設備平均故障率如何計算
設備故障率=[(停機等待時間+維修時間)÷計劃使用總時間]×100%
設備故障:設備在其壽命周期內,由於磨損或操作使用等方面的原因,使設備暫時喪失其規定功能的狀況。
a)突發故障:突然發生的故障。發生時間隨機,較難預料,設備使用功能喪失。
b)劣化故障:由於設備性能的逐漸劣化所引起的故障。發生速度慢,有規律可循,局部功能喪失。
設備故障率:單位時間內故障發生的比率。