1. 伺服器壽命周期內只會關機一次,為什麼能夠長時間持續工作而不宕機
首先我們先說說伺服器為什麼可以長期工作原因:(1)伺服器雖然也是電腦,但是伺服器屬於特殊而且高端的機器,因為其特殊性,所以有些部件設計的與普通家用電腦更特別的地方,針對伺服器其最基本的要求就是穩定性,所以伺服器的處理器內置多種糾錯機制,再加上伺服器的內存使用的都是帶ecc校驗模塊的內存,其作用就是用來處理伺服器大型數據處里時出現的數據錯誤,而且在數據干擾出錯風險要比非ecc內存降低很多,伺服器使用的是純銅散熱器,最主要其機箱都配置4到6個高轉速散熱風扇,而且內置顯卡基本處於不工作狀態。還有一點就是其主板都是6層以上pcb,硬碟設置使用壽命是普通硬碟的2到三倍。
這些都是為伺服器長期運行提供了保障。
(2)專用操作系統例如windows server以及unix linux這類操作系統可以不需要在接顯示器下,關閉圖形界面的伺服器程序,專用操作系統提供了更安全更穩定的保證
(3)伺服器可以在不關機的狀態,更換電源,一般伺服器都是配置2塊熱插拔電源
。第二,伺服器硬碟也可以在工作狀態更換,即便那塊硬碟出現故障,也是可以隨時更換。第三,伺服器內存一般都是在8條或者12條,如果那一根內存出現錯誤,或者損壞,伺服器一樣可以正常工作。
(4)伺服器可以長期運行,不關機還有一個最主要的方面是在於伺服器的工作環境,一般伺服器都會放至於無塵,恆溫,的環境,這些在外因素也是伺服器可以長期不關機的必要因素。所以一台伺服器在購買以後開始工作,基本是直到伺服器達不到企業所求狀態才會升級或者更換。
是電腦就可以長時間工作而不宕機。
其實關電腦這件事情挺LOW的。W君用的計算機基本上都是隨時處於待機狀態。從1992年就開始有能源之星的標准了。
由於是一個 歷史 悠久的標准,那麼目前大多數計算機都支持能源之星的節能策略。即在一段時間不使用計算機即進入睡眠狀態。
計算機在睡眠狀態中會保持一個極低的耗電量,僅僅維持計算機內存內的數據和一些必要性的中斷檢測,當計算機在觸動鍵盤或滑鼠的時候計算機立即進入全速工作狀態。
而進一步的計算機還可以進行休眠,即將內存數據轉儲在硬碟上整體進行關閉、等到再次開機的時候即就從硬碟回復內存數據還原到休眠前的狀態。休眠的過程中耗電量和關機的耗電量是一樣的幾乎=0。
所以說,「關機」對於一般用戶實際上是沒有任何意義的。普遍意義上的計算機「關機」其實是服務於計算機的長期封存、更換部件、等需要將電源線拔出插座的場景下。
而伺服器對於一般的用戶來說很扛造是一個假相。 伺服器並不比家用的計算機更耐用。
大部分情況下伺服器工作在一個恆溫恆濕除塵的機架上,並且機架的電源系統經過了穩壓過濾。這樣伺服器基本恆定在一個最適合計算機系統工作狀態的環境中。
環境穩定的狀態下計算機出故障的可能性就降低到極低了。
而家用計算機很難做到數據中心機房的標准,各種環境影響會在長期過程中對家用計算機形成傷害。
但W君也僅僅說是一個長期才會產生的影響。很多人的計算機買來之後幾個月就會出故障是因為——折騰。
不折騰是伺服器系統的又一個優點,當一個伺服器部署完畢後幾乎就不會再對伺服器進行各種的軟硬體添加和修改。維護人員僅僅對維護用的有限幾個參數進行調節。而家用計算機今天裝一個某某全家桶、明天裝一個某某管家、後天再下載幾個破解軟體無疑就給計算機的軟體運行帶來風險。動不動就會出現某某內存不可讀等等的錯誤,其實就是用戶自己在作死。
說個小秘密:伺服器的操作系統功能還沒個人用的操作系統功能多呢。伺服器操作系統是個人用系統功能的一個子集,例如現在的windows 10專業版已經涵蓋了伺服器windows 2016的大部分功能。而伺服器版本的內容則是在一個windows功能全集上摘取了必要的穩定的功能子集附帶了一些自己所特有需要的功能,說實話並沒有個人用的功能多。這也說明了伺服器在求簡單——越簡單的東西越耐用。
其次不得不說的一點,哪怕是再差的伺服器用料也會比大部分消費級的個人電腦強。在伺服器市場上價格基本上不是一個太大的決定因數,而針對於消費級個人電腦來說各種降低成本的方法就造就了很多個人電腦的低品質。例如某洲筆記本為了讓成本降低用可以致癌的塑料製作筆記本外殼、例如某想電腦當時在推出國內第一台萬元基本的奔騰II的時候竟然給配486的標配顯示卡、例如某某霸的顯卡上所有電容器都是山寨貨等等的因數導致了硬體本身就不合格。所以如果不買大廠的計算機甚至自己用雜牌配件組裝一台計算機,即便放在伺服器環境下也會跑不起幾天的。
最後再重申一下——所有電腦都可以長期使用不宕機
真正的伺服器確實在設計壽命之內只有一次開機關機的操作。當然了,重啟和意外斷電不算。
能保證伺服器穩定運行幾年不宕機,主要是伺服器的硬體和軟體的設計初期就把穩定性放在第一位了。畢竟性能不夠可以增加伺服器,如果動不動就宕機,那就損失大了。服務暫時終止還是小事,數據丟失那就問題大了。所以,對於伺服器來說,穩定性大於性能!
對於PC玩家來說,沒遇到過藍屏的人生是不完整的!而造成藍屏的罪魁禍首就是內存條!電壓不穩或者接觸不良都會導致藍屏。燃鵝,在恆溫恆濕的機房裡內存條的金手指是不會因為生銹造成接觸不良的!備用電源和強大的電源管理系統也能保證電壓的穩定供給。所以,造成藍屏的伺服器內存條是不會因為外部因素導致抽風的!
最重要的就是伺服器內存條和PC內存條是不一樣的,被稱為ECC內存,這種內存條自帶硬體的錯誤檢查和糾正技術!這種內存條即使長期運行也不會產生錯誤的垃圾數據,系統接收的都是正常的數據,自然不能崩潰,藍屏也就不會出現了!也就能保證伺服器在設計壽命之內穩定的運行了!
你好,很高興回答您的問題。
伺服器壽命周期內只會關機一次,為什麼能夠長時間持續工作而不宕機?
我想主要是以下幾這個方面決定了:
硬體很牛
伺服器的用料確實窮奢極欲,能有好的決不用差的,跟普通家用完全不同。CPU內置多種容錯糾錯機制;內存使用帶ECC校驗晶元的內存,數據干擾出錯風險比非ECC內存降低很多。硬碟和內存壞了就換,一般可熱插拔不需要關機。
軟體很穩
就不提Windows server與家用系統的區別了,更強大的Linux和Unix本身就是高度精確和簡練的,在不需要外接顯示器的情況下,都可以關掉圖形化界面的服務程序。專一的干好一樣工作。
環境很優
這是至關重要的,溫度、濕度、防震、防塵、電源都有極高的要求。24小時維持低溫低濕環境,有大型UPS和柴油發電機侯著。工作10的伺服器可能比你一年的家用電腦還要干凈。
總之,有了這些優越的條件,無塵機房+不間斷電源+備份伺服器+消防設施+散熱系統,像護住一個嬰兒一樣,所以才能長時間穩定的工作。
我是老段,一個40多歲還有做自媒體的老大叔,有關於 科技 領域的問題,如:電子,電腦,機床,數控,網路,自媒體方面的都可以問我,一起交流學習。
伺服器生命周期內很難說只會關機一次的哦。碰到問題了,如維修維護搬遷等,那也只能關機重啟不是?
伺服器長時間工作會不會宕機,那要看是什麼樣的機器。
1.有些低端伺服器實際上和一般的PC機/工作站類似,是沒有所謂的冗餘設計。這種伺服器會和PC一樣有死機的風險。實際上,一般的PC機也是可以改裝成伺服器使用的,過去就有很多人把PC改成家用或小網站的伺服器,以降低成本。
2.一般的中高端伺服器,一般都有冗餘設計,比如電源、內存和硬碟等,冗餘設計的目的就是當其中一個有故障發生時,伺服器還能正常工作。但這不包括如零部件發生短路或系統過載這些情況,比如某條快閃記憶體短路,那麼還是可以造成伺服器宕機的。
3.絕大部分的伺服器都有自我診斷設計,當伺服器零部件運行在設計指標極限時,會發出警告信號,提醒維護人員前往查看或診斷維護,避免不必要的宕機等事件發生。
4.當某台伺服器宕機時,一般來說不影響外部訪問,因為有備份伺服器/或機房的存在。
伺服器能長時間工作,當然也是和其高可靠性設計指標有關系,而機房的適宜環境溫度,更進一步提高了其運行壽命。
最重要的就是冗餘電源,還有RAID5以上級別的磁碟陣列。有的還在RAID5基礎上加了熱備硬碟。
首先伺服器在設計時就考慮了長期穩定運行,幾乎所有的硬體都可以帶電熱插拔更換,家用電腦暫時無法做到,其次伺服器系統雖然跟家用系統核心一樣,但為了保證長期運行,具有更好的容錯管理機制,同時,伺服器系統為了保證系統的穩定運行,一般不需要的組件默認是不運行的,這樣降低了組件出錯的概率,提升了系統的穩定性,要知道是程序就會有bug的。再有伺服器一般運行程序很單一,一般生命周期內就只跑固定的程序,減少了程序間的互相干擾,多方因素綜合,造就了伺服器系統可以長期穩定運行。
以前我維護的一個區級機房幾台空調一個月幾十萬的電費,常年在20 恆溫恆濕還有除塵裝置,ups拖幾十個大電池,電好像也有要求忘了,環境要求很苛刻,排除黑客攻擊的因素,一般情況下沒有看到硬重啟,至於遠程重啟也比較少見。有一個老古董的伺服器運行了十來年,至於有沒有壽命周期我不知道,只知道幾家維安公司定期巡檢,會對機器檢查進行評估,大部分時候是客 戶要求換機器。至於壽命周期我還真不知道。
伺服器的不當機是靠硬體的冗餘技術來保證的,沒有什麼稀奇的地方。比如伺服器是雙電源,硬碟是RAID,住在機房裡,一個電源壞了拔出來換,一塊硬碟壞了拔出來換。
簡潔回答三點
1 模塊化
2 熱插拔
3 熱備份
2. 為什麼伺服器的宕機一般都發生在凌晨使用率最低的時候
計科專業從事嵌入式軟體開發多年,最近因為公司需要搞後台研發,經常選擇升級的時機放在凌晨,而且大型的數據處理也是放在這個時間段內,經常發生的伺服器宕機也是在這個時段。都是在用戶使用少的時候開始折騰,折騰的次數多也就容易出現伺服器問題。由於做的是物聯網設備,在工作中遇到的宕機主要有這么幾種情況,對大量數據的操作導致CPU佔比在一段時間內驟增從而導致數據接收模塊出問題,導致系統監控出現問題,很多設備信息檢測不到了。
對資料庫的操作太頻繁導致效率的下降,也是影響系統性能很重要的一部分,其實伺服器也是普通電腦的構成,主要的資源是CPU和內存,這兩個因素無論是哪種都有可能導致系統的崩盤,如果是CPU被占滿了,系統的反應會變得異常緩慢,時間長了可能還會慢慢緩過勁來,內存如果占滿了那麼會導致系統的崩潰,直接運行不下去了,其實宕機核心點不會跑出這兩種因素。
現在就常見的伺服器宕機問題做個歸納總結:
1.磁碟空間被占滿,現在程序員運行的時候都習慣於帶上log列印,如果時間長了加上沒有清理的機制早晚會出問題,這個錯誤在平時運行過程中經常出現,如果使用的雲計算伺服器通常在系統崩盤之前都會發個簡訊,通知你的系統處於崩潰的邊緣。
2.並發性能問題,如果多個人同時操作一個資料庫或者數據塊,會導致系統假死狀態,這種屬於爭搶CPU資源問題,可以通過增加硬體配置以及優化軟體代碼的效率去解決,數據量如何足夠大就可以考慮分布式的管理
3.數據受損或者被破壞導致系統崩盤,所以常見的做法是都會配置備份盤,出現問題抓緊拿到備份盤來頂上,現在公司使用的是阿里雲的伺服器,穩定性相比之前好太多了,中間換過電信雲,騰訊雲雖然價格低點,最後受不了直接換成阿里雲,再也不想換回去了,數據的穩定性永遠是第一位的。
4,一些沒有必要的誤操作,很多時候是因為程序員或者運維人員的誤操作大致伺服器大面積的宕機,這種事件在很多雲服務提供商身上都發生過,根本層面還是管理問題。後台管理的任何細節都有可能
伺服器宕機查找問題的幾個線索:
1.看看伺服器是不是存在內存泄漏問題,有些時候重啟機器開始還能正常運行弄了一段時間之後就會變得非常緩慢,十有八九都是內存的問題
2.是否有黑客入侵造成,有些非常關鍵重要的數據也是黑客最感興趣的,一般來講這種概率不是很高
3.是不是資料庫死鎖導致的,訪問量過大導致,連接數過多造成的。
伺服器宕機一旦發生就會引起用戶的無數的投訴,無論在什麼情況下穩定永遠是第一位,現在大的功能升級除非已經百分百驗證成功,否則引起的後果不堪設想。
希望能幫到你。
之前我們單位夜晚有一台設備down了,這台設備做的堆疊,而不是備份,所有下聯線路全部連接在主設備上。結果當晚凌晨,主設備的電源模塊損壞了!這... 你能看出規律嗎?我也想知道為什麼它偏偏凌晨損壞了!
所以說,偶然性事件,不能說大部分!
但是夜間割接倒是正常,選擇在用戶最少的時候做可能影響業務的必要事情是常識。
雖說在凌晨的時候,使用系統的用戶非常少,但是伺服器在這個時候要做的工作可能一點兒也沒有少:
再說一個很久以前看到的,同行們分享的伺服器宕機的經歷,有些經歷非常之神奇,大家就當段子看吧(為了方便,我就按照第一人稱來講述)。
我們服務的甲方是一家醫院,機房就在醫院的樓中,最近機房的伺服器經常性的發生宕機,公司的工程師去了幾次也沒有發現問題;後來公司被折騰的沒辦法了,決定讓一個工程師晚上住在機房,看看半夜機房中究竟發生了什麼事兒,想著就算找不到原因,也能在伺服器宕機後第一時間重啟。
後來發現原因,到了凌晨三四點的時候,機房門打開了,進來一個值夜班的小護士,看了一眼說:「又沒有人,開著空調不浪費電么?」然後就把機房的空調關掉了,然後氣溫上升...
我將持續分享Java開發、架構設計、程序員職業發展等方面的見解,希望能得到你的關注。
偶發性的,可以能是你淺意識的,因為這種問題印像最深刻,可能認為比較多,通過做記錄去試下。
宕機一般分5種情況:
1、程序上出了問題導致程序崩潰。
2、cpu\\Gpu 、內存占滿了。
3、硬碟空間滿了
4、資料庫表空間滿了
5、機房溫度過高
以上是個人在運維過程中所遇到的問題,做的總結性回答
這里需要說明一下,伺服器宕機是什麼意思呢? 我們日常說的「宕機」中的「宕」其實指的是英文「down」,宕機表示當前伺服器或服務無響應或者不在線狀態。
伺服器的宕機可分為人為控制的宕機、不可控的宕機。 這兩者有什麼區別呢,下面來具體說明一下:
1、人為可控的宕機行為
伺服器長時間的運行可能會帶來一些(非致命性)問題,又或者我們需要對伺服器進行軟/硬體的升級維護時,可能需要停機或者重啟操作。這種情況下的宕機是可控的,在我們的計劃之內。
2、不可控宕機行為
這種因素就很多了,比如說 伺服器突然藍屏、服務異常崩潰、突然斷電斷網了 ,這時候服務(器)就無法正常提供服務,這些都是不可控因素導致的。
而 在我們的日常運維工作中,計劃性的宕機維護一般都選擇在半夜 來做這些事,為什麼呢,原因主要有這幾點:
1、 減少對用戶的影響
凌晨大家基本上都休息了,用戶量較白天來說小得多,所以選擇在此時進行系統及硬體的維護導致的宕機對用戶的影響較小,就算有影響也只是影響小部分用戶。
2、 有足夠的時間來處理故障
在凌晨進行維護,就算有問題,技術人員也有足夠的時間(比如說:00~05點)去處理故障。如果換成在日間維護,服務(器)宕機1小時以上投訴單全都過來了,壓力很大的。
伺服器宕機是指伺服器因為一些原因導致伺服器無法正常運行,造成網路斷開,無法正常使用網路。伺服器宕機一般都發生在凌晨,為什麼會出現這種情況呢? 像我們公司是從事 科技 互聯網設備生產的,為了不影響正常生產,系統升級的時候一般都是在凌晨,而且很多的數據處理也放在這個時候,伺服器在這個時候也容易出現問題,具體分析有以下幾種原因:
1. 系統在升級或處理大的數據時,硬碟空間被占滿,如果沒有人能及時清理磁碟空間,伺服器就會出現卡頓的問題造成宕機。
2.如果是多台設備同時在操作,使用這一個資料庫,會引起系統假死的現象,這個是屬於搶佔CPU的資源造成的,會導致伺服器不堪自負,網站訪問量猛增,程序中毒遭到很多的應用都在消耗伺服器,最終死機無法響應。
3.由於凌晨維護人員減少,會出現斷電,溫度過高等等環境因素的影響,使伺服器死機等等,不過這種情況是很少見的,因為現在機房都有發電機備用避免停電造成的數據丟失,溫度也是採用的恆溫系統。
4.有的企業為了節省伺服器的費用,會租用較低配置的伺服器來從事很多的工作,使伺服器超負荷運轉,結果是可以預料得到的,宕機就會經常發生。
5.伺服器宕機一般和內存有很大的關系,有些伺服器運行了一段時間後速度就變慢了,基本上就是內存出現問題,要檢查一下內存是否存在泄漏的問題。
伺服器宕機會出現一系列的問題,造成的損失也是無法估量的,只有平時定期做好維護,在凌晨的時候也要注意掌握使用狀況才能避免宕機,無論在任何時候,伺服器的穩定運轉才是最重要的。
伺服器應用軟體在運行過程中狀態很穩定,一般不會發生問題。宕機發生在凌晨概率高的原因是:一是功能升級、硬體更換多在凌晨,導致問題發生概率高;二是批量執行多在凌晨,瞬間資源消耗很大,數據問題、硬體資源問題、甚至處理邏輯問題都容易導致宕機。另外,如果是聯機交易出了問題,很容易被發現,不會讓系統宕機。
原理其實很簡單:這就如同我們白天忙碌著很多事物性的工作,就如同搬運工一樣,不停的搬運物品入庫,只有在物品都搬運完了的時候,我們才能開始整理這些物品,整理倉庫,。
其二,伺服器在白天的時候,其實都在實時處理數據的「搬運工」狀態,只有在實時性數據處理工作(搬運工作)完成以後,才有機會或才能騰出手來去做數據的歸納和整理。所以,伺服器的宕機時間,通常會發生在使用率最低的時間段。僅此。
正常跑穩的業務,一般很難因為正常業務操作造成伺服器宕機的。伺服器資源問題大部分情況下是可預測,可控制的。
最容易造成宕機的事情,反而是開發/運維的不當操作造成的。比如更換伺服器硬體,升級/安轉os程序包,發布新代碼,批量更新數據等等,這些事一般都是半夜業務量小的時候做。
因為凌晨是最困得時候,伺服器一打盹就宕機了。