㈠ 常見伺服器故障類型及排查方法總結
四,伺服器故障排查方法總結
問題描述:
每當出現網站訪問不了的時候,估計應該就是伺服器出現故障了,這個時候大部分情況都是屬於資料庫出現問題。
查找步驟:
1、查找top檢查伺服器負載是否有問題
一般網站訪問不了,top顯示的負載都是很大的,這個時候可以看到mysql的進程佔用資源很高,往往就是mysql發生故障了
2、在伺服器中查看網站的訪問記錄
這些訪問記錄存儲在:/home/對應的網站名/access-logs/對應的網站名
可以先通過tail查看,查看出異常的ip的時候可以通過grep進行過濾查看,在這個文件一般都可以找到惡意爬蟲、惡意訪問的記錄,這些往往有可能是導致mysql資料庫掛掉的原因。
3、這個時候先對資料庫進行重啟,對apache進行重啟
service mysql restart
service httpd restart
重啟之後一般都可以暫時恢復正常的訪問的了。如果是出於惡意訪問的話,找出惡意訪問的ip把它禁止掉即可,如果是網站資料庫出現故障,那麼還要進行資料庫排查。
4、查找資料庫錯誤日誌
首先需要知道資料庫mysql的安裝目錄,可以通過whereis mysql找到,但是這往往沒用
還有一種方法,就是通過ps -ef | grep mysql來查看
或者也可以通過進入mysql,使用select @@basedir as basePath from al來查看mysql安裝目錄
我們在第二種查找方法ps -ef | grep mysql中對應mysql的幾種日誌找到其所在目錄,然後查看對應文件進行分析
mysql有以下幾種日誌
錯誤日誌:-log-err
查詢日誌:-log
慢查詢日誌:-log-slow-queries
更新日誌:-log-update
二進制日誌:-log-bin
以上便是對應的資料庫錯誤日誌和慢查詢日誌的查看方法了
在伺服器的維修中,線索都會顯得撲朔迷離,有的甚至按起葫蘆翹起瓢。一般來說不可能一次就可以准確地判斷出問題的所在。這樣就要求工程師要有信心和耐心。出現錯誤一般的方法都是根據經驗優先使用最簡單排錯方法測試,如果沒有解決問題再找其它因素進行測試。總之,伺服器出錯後必須一步一步解決,沒有捷徑可言。
㈡ 伺服器常見故障是什麼,怎麼排除
1、伺服器常見的故障及其排除方法
伺服器中的某項服務被停止 •系統資源不足 •伺服器軟體故障
伺服器軟體故障是在伺服器故障中佔有比例最高的部份,約佔70%。導致伺服器出現軟體故障的原因有很多,最常見的是伺服器BIOS版本太低、伺服器的管理軟體或伺服器的驅動程序有BUG、應用程序有沖突及人為造成的軟體故障。伺服器軟體設置不當也會可能造成網路故障。
管理方面的問題
如用戶的帳戶和安全設置方面的潛在問題,服務許可權沒有給用戶、配置不當或限制某些服務等問題
2 伺服器故障排除的基本原則
伺服器故障排除的基本原則如下:
(1) 盡量恢復系統預設配置
(2) 從基本到復雜
首先將存在故障的伺服器獨立運行,待測試正常後再接入網路運行,觀察故障現象變化並處理;然後從可以運行的硬體開始逐步到現實系統為止;最後從基本操作系統開始逐步到現實系統為止。
(3)交換對比
首先在最大可能相同的條件下,交換操作簡單效果明顯的部件;其次是交換軟體環境;再者是交換硬體,既交換硬體環境;最後是交換整機,既交換整體環境。
在伺服器故障排除時,需要收集如下一些信息:
伺服器信息:機器型號(P/N:)、機器序列號(S/N:)、Bios 版本、是否增加其它設備(如網卡,SCSI 卡,內存,CPU等)、硬碟如何配置和安裝什麼操作系統及版本。
故障信息:在POST(加電自檢)時,屏幕顯示的異常信息、伺服器本身指示燈的狀態和報警聲,以及操作系統的事件記錄文件等信息。
確定故障類型和故障現象:開機無顯示;上電自檢階段故障;安裝階段故障和現象;操作系統載入失敗和系統運行階段故障。
㈢ X3550 M5伺服器怎麼查看告警信息,因為沒有警告面板
外觀上查看故障燈,把後蓋打開,看看故障燈在那塊,一般是黃色的,內存,硬碟,主板都有故障燈,或是進管理口查看,雲修網,伺服器故障解決。
㈣ 查看伺服器硬體信息方法
你們知道伺服器硬體信息怎麼查看嗎,下面是我帶來查看伺服器硬體信息 方法 的內容,歡迎閱讀!
查看伺服器硬體信息方法:
一、DOS命令查看伺服器的配置
1.查詢CPU個數
cat /proc/ cpu info | grep physical | sort -n | uniq | wc -l
2.查詢伺服器型號
dmidecode | grep "Proct Name"
或
dmidecode -s system-proct-name
3.查看CPU幾核
cat /proc/cpuinfo | grep physical | sort -n | uniq -c
4.查看CPU信息<型號>
cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq
5.查看CPU運行位數
# getconf LONG_BIT
(說明當前CPU運行在32bit模式下, 但不代表CPU不支持64bit)
# cat /proc/cpuinfo | grep flags | grep 'lm' | wc -l
(結果大於0, 說明支持64bit計算. lm指long mode, 支持lm則是64bit)
6.查看當前 操作系統 內核信息
uname -a
7.查看網卡速率
ethtool eth0
8.查看當前操作系統發行版信息
lsb_release -d
9.查看內存的插槽數,已經使用多少插槽.每條內存多大
dmidecode|grep -P -A5 "Memorys+Device" | grep Size |grep -v Range | cat -n
10. 查看內存的頻率
dmidecode|grep -A16 "Memory Device"|grep 'Speed' | cat -n
11.查看伺服器出廠編號<適用於DELL 。 LENOVO則顯示不出來>
dmidecode -s chassis-serial-number
12.對於DELL伺服器的信息可通過DSET獲取
DSET工具2.2使用說明(Windows版):
DSET工具2.1使用說明(linux版):
13.For Windows(win2003 winXP以上版本):
命令1:wmic bios get serialnumber(獲取SN|不適用於LENOVO機器)
命令2:wmic csproct get name,identifyingnumber(獲取SN和機型)
以下為一台LENOVO R510 G7 Windows方面的一些信息查詢
二、魯大師查詢伺服器的配置
通過魯大師查詢到的一些信息
看了“查看伺服器硬體信息方法”的內容的人還看:
1. linux看硬體信息方法
2. linux硬體信息查看命令
3. linux如何查看硬體信息
4. linux下查看硬體信息失敗解決方法
5. hp伺服器硬體診斷工具ProLiant是什麼
6. linux獲取硬體信息失敗解決方法
7. linux伺服器硬體需求是多少
8. linux伺服器硬體配置要求是多少
9. 怎麼檢測電腦配置好壞
10. 怎麼檢測電腦硬體兼容性
㈤ 怎麼查看伺服器日誌 如何查看伺服器日誌
1、相信經常進行編程的朋友都知道,當程序出錯的時候可以查看伺服器日誌來了解解決錯誤。那麼,以Win2008為例,講述怎麼查看伺服器日誌。
2、方法/步驟:
(1)進Win2008伺服器,點擊開始,找到控制面板。
(2)點擊進入控制面板,找到管理工具。
(3)找到管理工具,點擊事件查看器。
(4)進入事件查看器,展開Windows日誌,點擊系統,右側會顯示出信息。
(5)查看事件查看器的右方,我們會看到屬性選項,紅框中已經圈出。
(6)點擊屬性後,我們會看到伺服器日誌的路徑。
(7)打開C:\Windows\System32\winevt,再打開Logs文件夾,就會看到伺服器日誌。
㈥ windows伺服器怎麼看硬體是否有故障
1、看系統日誌,主要是查看硬碟IO故障
2、看系統溫度,如果溫度過高,就有宕機的風險
3、看系統有無藍屏,如果頻繁藍屏,很可能是硬體有問題
㈦ 伺服器硬體故障要如何排查和判斷
常見伺服器硬體故障排查判斷:伺服器常見故障的診斷與解決:伺服器故障排除第一部分 伺服器故障排除的基本原則性問題伺服器故障排除一、伺服器開機黑屏故障排查1.檢查供電環境,零-火;零-地電壓?2.檢查電源指示燈,如果亮,正常嗎?3.按下電源開關時,鍵盤上指示燈亮嗎?風扇全部轉動嗎?4.是否更換過顯示器,更換另一台顯示器。5.去掉增加內存6.去掉增加的CPU7.去掉增加的第三方I/O卡8.檢查內存和CPU插的是否牢靠9. Clear CMOS10.更換主要備件,如系統板,內存和CPU伺服器故障排除二、伺服器故障排除的基本原則1.盡量恢復系統預設配置a:硬體配置:去除第三方廠商備件和非標配備件;b:資源配置:清除CMOS,恢復資源初始配置;c: BIOS,F/W,驅動程序:升級最新的BIOS,F/W和相關驅動程序;d: TPL:擴展的第三方的I/O卡屬於該機型的硬體兼容列表(TPL)嗎?2.從基本到復雜a:系統上從個體到網路:首先將存在故障的伺服器獨立運行,待測試正常後再接入網路運行,觀察故障現象變化並處理。b:硬體上從最小系統到現實系統:指從可以運行的硬體開始逐步到現實系統為止。c:軟體上從基本系統到現實系統:指從基本操作系統開始逐步到現實系統為止。3.交換對比a:在最大可能相同的條件下,交換操作簡單效果明顯的部件;b:交換NOS載體,既交換軟體環境;c:交換硬體,既交換硬體環境;d:交換整機,既交換整體環境;伺服器故障排除三、伺服器故障排除需要收集哪些信息?伺服器信息:1.機器型號2.機器序列號(S/N:如:NC00075534)3.Bios版本4.是否增加其它設備,如網卡,SCSI卡,內存,CPU5.硬碟如何配置,是否做陣列,陣列級別6.安裝什麼操作系統及版本(Windows Server, Netware, Sco, others)
故障信息1.在POST時,屏幕顯示的異常信息2.伺服器本身指示燈的狀態?3.報警聲和BEEP CODES4. NOS的事件記錄文件?5. Events Log文件
確定故障類型和故障現象:1.開機無顯示;2.上電自檢階段故障;3.安裝階段故障和現象;4.操作系統載入失敗;5.系統運行階段故障.
㈧ 富士通伺服器報警怎麼進去查看故障
1、首先連接伺服器COM口,進入系統層面,執行相關命令獲取LOG。
2、其次系統控制台與服務處理器之間切換。
3、然後要從系統控制台切換到服務處理器提示符,請鍵入 #.(井號加句點)。富士通Fujitsu(富士通)是世界領先的日本信息通信技術(ICT)企業,提供全方位的技術產品、解決方案和服務。
㈨ 聯想RD940伺服器告警,如何去看告警信息從而得知問題原因
伺服器系統都有系統日誌,看看報警的嘆號叉號具體內容,比如,系統故障或應用軟體不兼容等提示