『壹』 如何查找 linux 死機原因
某個程序內存泄露,造成內存不足,但是正在運行另一個耗CPU與內存的程序時,找出內存泄露程序,然後kill掉。
『貳』 linux伺服器死機了怎麼辦
伺服器死機的原因很多。如果確保在硬體沒問題的情況下。
可以先從/var/log下的日誌查起..通過iostat 或者 vmstat sar 等命令來檢查機器的整體性能狀態。
我不知道你是否做了相關的監控措施,比如通過某些監控軟體對伺服器進行監控。
通過監控數據分析伺服器的整體狀況。
也可以協調應用部門查看應用方面的日誌是否有異常。這個還得按照具體情況分析。
關於更多Linux的學習,請查閱書籍《linux就該這么學》。
『叄』 linux 宕機了 ssh也連接不上 怎麼辦
這個原因可能比較多,例如:被防火牆擋掉,ssh服務配置文件中的參數是否拒絕了連接等等。我說一種最可能出現的吧,清除/root/.ssh/known_hosts文件中和你所要連接的ip或者主機名有關的ssh加密Key。
『肆』 為什麼在linux系統下經常死機
死機的原因很多,有的是驅動問題,有的是硬體問題,有的是設置問題,有的是軟體問題,有的是 RPWT 。
這種問題不詳細檢查是沒辦法解決的。
『伍』 如何分析linux宕機原因
dmesg命令用來看硬體的啟動信息,
如果有硬體問題會提示 進到/var/log下,
用less命令查看messages,syslog等系統日誌,分析有問題的條目。但是分析的方法比較復雜,建議你先多看一些Linux方面的書在查看。
『陸』 linux內存佔用卡死分析
一、硬體問題
可以考慮分析以下幾點:
1、不要超頻CPU,如果已經超頻的先回復到原來的頻率
雖然平時運行沒有問題,但可能在高負載的使用中就會出現不可預料的故障了。特別是linux系統在某些應用上,是可以把硬體的性能發揮到極限的,但這樣的硬體運行Windows可能是沒有問題的。
2、確認電源供電充足
必須確保在高負載的狀態下,電源可以滿足負載。
3、使用memtest86檢查內存狀態
4、恢復BIOS到默認狀態
對於伺服器,可以使用自帶的監測工具進行測試,也是一個不錯的排錯方法。
二、軟體問題
如果已經基本排除硬體問題,那我們就必須考慮從軟體上去獲得死機狀態的系統信息了。
1、運氣足夠好的話,系統死機不一定是完全死掉(此時鍵盤可能還能響應),那我們就可以使用Sysrq大法。
前提是我們必須先打開sysrq功能:
#echo "1" > /proc/sys/kernel/sysrq
#setterm -blank
這樣,當系統出現問題的時候,我們可以使用:
引用
Alt+Sysrq-T 獲得進程系統堆棧信息
Alt+Sysrq-M 獲得內存分配信息
Alt+Sysrq-W 獲得當前寄存器信息
更多的熱鍵可以參考系統上的/usr/src/linux/Documentaion/sysrq.txt
其中,setterm -blank可以關閉字元下定時黑屏保護,方便記錄屏幕信息。
2、為了讓屏幕顯示更多的內核調試信息,可以修改控制台的顯示模式為80x25,在/boot/grub/menu.lst中對應的kernel一行最後,增加vga=0x305,如:
引用
kernel /boot/vmlinuz-2.4.21-9.30AXsmp ro root=/LABEL=/1 vga=0x305
3、萬一鍵盤也不幸死掉了,那我們只能採用串口方式,把系統信息發送到另一台系統上,方法:
修改/boot/grub/menu.lst文件,在kernel一行最後增加核心參數"console=ttyS0 console=tty1",如:
引用
kernel /boot/grub/vmlinuz-2.4.21-9.30AXsmp ro root=/LABEL=/1 console=ttyS0 console=tty1
然後,修改/etc/sysconfig/syslog,加入klogd選項"-c 7",如:
引用
KLOGD_OPTIONS="-x -c 7"
重啟伺服器;進行測試:
1)使用串口直連線連接客戶機和伺服器,在客戶機上運行:
cat /dev/ttyS0
伺服器上運行:
echo hi > /dev/ttyS0
如果客戶機有"hi"輸出即可。
2)伺服器上運行:
echo w > /proc/sysrq-trigger
看看客戶機上是否有相應的內核信息輸出
3)伺服器上運行:
modprobe loop
看看客戶機上是否有相應的內核信息輸出
如果測試都通過的話,那麼在客戶機上運行:
cat /dev/ttyS0 | tee /tmp/result
當死機出現的時候,我們就可以從客戶機上看到需要的內核信息了(查看/tmp/result)。
三、總結
一般造成Linux系統死機的原因有:
系統硬體問題(SCSI卡,主板,RAID卡,HBA卡,網卡,硬碟等)
外圍硬體問題(網路等)
軟體問題(系統、應用軟體)
驅動bug(找新的驅動)
核心系統bug(到LKML看看,或更換核心再試)
系統設置(恢復到預設狀態,關閉防火牆等)
『柒』 linux系統宕機怎麼查原因
這往往是由於內核崩潰導致,但可能性多種多樣。
首先查看系統日誌,分析不出原因的話,請搜索「coremp」 或 「linux系統宕機」。
『捌』 請教linux 死機問題,BUG:warning at kernel/softirq,c:120
你好,死機原因:
1、如果是電池損壞請及時更換。
2、手機cpu主板虛焊,只能送修了。
3、是因為運行內存不夠,系統反應不過來,而黑屏、白屏重啟或者死機。
4、另一原因是某些程序對系統有壓製作用而導致出現重啟死機或者運行緩慢.
5、電池供電不足也會導致黑、白屏、死機。檢查電池是否與手機接觸良好,用少量酒精或者其他易探發的溶劑清洗接觸部位。
首先需要查明原因,手機死機通常除了自身手機上安裝的軟體太多導致的外,還有一個可能是手機中毒。建議將手機恢復出廠設置,在恢復出廠設置之前,請提前備份手機上存儲的重要數據,例如:電話簿、簡訊息、照片、視頻文件等,因為手機恢復出廠設置後會丟失話機上存儲的所有內容。