⑴ Linux網路異常排查思路與方法
處理問題時必定不能盲狙,將所有解決辦法都試上一遍。這生產環境中,解決出現的問題是最優先的事情,當然前提是這問題會影響用戶的使用或即將影響到的。
處理每個問題必然可按具體問題進行分類,根據每一類按對應的解決思路來執行。
但像處理一個網路問題的時候,上至系統防火牆的配置、下至硬體故障。如果處理一個問題都按固定流程來進行的話,那必然效率將非常低下。下為處理網路故障的一般流程。
1、網路硬體問題檢查。 (機率較低)
2、檢查網卡能否正常工作。 (較高、主要表現為人為配置錯誤)
3、檢查區域網之間聯機是否正常。(非常高)
4、檢查DNS是否設定正確。 (較低)
5、服務是否正常打開。 (低)
6、檢查訪問許可權是否打開。 (較高)
假如從1至6是標準的處理網路問題的流程,這樣的處理方式效率低下。處理問題可以有整體的流程,但是實際操作中可先對出現機率更高的步驟進行檢查、或採取2分法縮小產生問題的范圍,雖然上述較的兩個方法不一定對所有問題都試用,但對於大多數的網路問題來說處理效率有者顯著的提升。
個人總結的情況如下。
1、lsmod | grep ip 查看相關的網卡模塊是否已載入
2、ifconfig -a 能使用該命令查找到對應網卡配置信息,則說明網卡驅動程序正常
3、使用ping命令、依次ping自己、ping區域網主機、ping網關
ping自己異常,問題:服務異常、網卡配置未生效
ping區域網主機異常,問題:配置文件有誤、網卡配置未生效、網線損壞
ping網關異常,問題:配置文件有誤、網卡配置未生效
4、當前3步還不能正常上外網的話。所有route查看默認路由表。
處理方法:刪除不必要的路由信息,並保證默認路由是從對應網關地址出去的。
5、臨時停止iptables服務、SELinux服務、NetworkManager服務
6、如能上網但訪問域名有異常時,那將需要檢查/etc/hosts、/etc/resolv.conf兩個配置
7、假如以上6步檢查完畢之後,還發現不能上網。有如下可能。
7.1、主機MAC地址被路由器禁止上網
7.2、外網服務異常。如寬頻賬號欠費、光纖被挖斷等物理攻擊。