㈠ 阿里雲伺服器 如何開啟25埠
在伺服器的防火牆開啟即可
㈡ 2020-08-25
Prometheus 實現郵件告警(Prometheus+Alertmanager+QQ郵箱或者網易163郵箱,目前測試過這兩種郵箱都可以發送告警郵件)
Prometheus實現郵件告警原理如下:
Prometheus官方有一個附帶的中間件:alertmanager,通過設置rules規則和路由轉發可以實現郵件告警,前提是你需要有一個可以發送郵件的郵件服務端(可以自建或者使用互聯網公司提供的免費郵箱)
告警原理圖
Prometheus完整架構圖
我之前得出的錯誤結論如下:
推薦直接在虛擬機操作系統上直接安裝Prometheus和Alertmanager,不推薦其中任何一方在容器中運行,因為測試過在容器中運行Prometheus和alertmanager,結果出現如下錯誤情況
第一種情況是:我的node-exporter掉線跌機了(手動關機,模擬突然掉線跌機),Prometheus卻提示節點依然在線?有時候卻能夠正常顯示節點掉線跌機,生成告警發送郵件
第二種情況是:我的node-exporter掉線跌機了(手動關機,模擬突然掉線跌機),Prometheus提示節點掉線,告警生成,但是沒有發送郵件,我手動恢復node-exporter後,告警解除,郵件能正常發送郵件提示告警已經解除。。。。
第三種情況是:我的node-exporter掉線跌機了(手動關機,模擬突然掉線跌機),Prometheus提示節點掉線,告警生成,正常成功發送郵件,我手動恢復node-exporter後,告警解除,郵件沒有發送出來。。。。
以上三種情況之前經常出現,當時第一步以為是自己設置的scrape_interval不合理導致的,結果調試幾次,問題沒有解決,第二步以為是自己的伺服器時間沒有做到精確同步,然後我去設置和阿里雲的ntp伺服器同步,結果問題依然沒有解決,第三步,換個方向,把alertmanager遷移到虛擬機操作系統上安裝運行,問題解決!
北京時間是GMT+8小時,有些同志的時間可能是UTC的,但是如果是在要求不太十分精確的情況下,UTC時間是剛剛好等於GMT時間
為了避免時區的混亂,prometheus所有的組件內部都強制使用Unix時間,對外展示使用GMT時間。
要改時區有兩個辦法
1 .修改源碼,重新編譯。
2. 使用 docker 運行 Prometheus,掛載本地時區文件
docker run --restart always -e TZ=Asia/Shanghai --hostname prometheus --name prometheus-server -d -p 9090:9090 -v /data/prometheus/server/data:/prometheus -v /data/prometheus/server/conf/prometheus.yml:/etc/prometheus/prometheus.yml -u root prom/prometheus:v2.5.0
正文開始
安裝alertmanager
容器安裝方式:
docker run -d --name alertmanager -p 9093:9093 -v /usr/local/Prometheus/alertmanager/alertmanager.yml:/etc/alertmanager/alertmanager.yml prom/alertmanager:latest
先在宿主機/usr/local/Prometheus下創建一個文件夾alertmanager,然後在文件夾里創建alertmanager.yml配置文件,待會才能映射到alertmanager容器里的/etc/alertmanager目錄下
global:全局配置
resolve_timeout: 問題解決的超時時間
smtp_from: 發送告警郵件的郵箱賬號
smtp_smarthost: 郵箱 SMTP 服務地址,這里是以QQ郵箱為例,也可以用網易163郵箱,這個和我之前設置zabbix郵件告警時的配置一樣
smtp_auth_username: 如果沒有設置郵箱別名,那就是賬戶名
smtp_auth_password: 郵箱的授權碼,不是 賬戶密碼,你可以在QQ郵箱或者網易163郵箱網頁端設置,開啟 POP3/SMTP 服務時會提示,和配置zabbix郵件告警的時候幾乎一樣
smtp_require_tls: 是否使用 tls,根據環境不同,來選擇開啟和關閉。如果提示報錯 email.loginAuth failed: 530 Must issue a STARTTLS command first,那麼就需要設置為 true。著重說明一下,如果開啟了 tls,提示報錯 starttls failed: x509: certificate signed by unknown authority,需要在 email_configs 下配置 insecure_skip_verify: true 來跳過 tls 驗證。
templates: 告警模板目錄,可以不編寫模板,有默認模板
Subject: '{{ template "email.default.subject" . }}'
html: '{{ template "email.default.html" . }}'
route:報警的分發設置
group_by:分組
group_wait: 分組等待時間
group_interval: 5m 每組時間間隔
repeat_interval: 10m 重復間隔
receiver: 接收方式,請注意!這里的名字要對應下面receivers中的任何一個名字,不然會報錯,這里其實就是選擇方式,有郵箱,企業微信,wehook,victorops等等
receivers:接受方式匯總,即告警方式匯總
例子:
receivers:
- name:'default-receiver'
email_configs:
- to:'[email protected]'
html: '{{ template "alert.html" . }}'
headers: { Subject: "[WARN] 報警郵件test"}
inhibit_rules: 抑制規則
當存在與另一組匹配的警報(源)時,抑制規則將禁用與一組匹配的警報(目標)。
包括源匹配和目標匹配
alertmanager官方是這樣說的
Inhibition
Inhibition is a concept of suppressing notifications for certain alerts if certain other alerts are already firing.
Example: An alert is firing that informs that an entire cluster is not reachable. Alertmanager can be configured to mute all other alerts concerning this cluster if that particular alert is firing. This prevents notifications for hundreds or thousands of firing alerts that are unrelated to the actual issue.
Inhibitions are configured through the Alertmanager's configuration file.
當存在與另一組匹配器匹配的警報(源)時,禁止規則會使與一組匹配器匹配的警報(目標)靜音。目標警報和源警報的equal列表中的標簽名稱都必須具有相同的標簽值。
在語義上,缺少標簽和帶有空值的標簽是同一件事。因此,如果equal源警報和目標警報都缺少列出的所有標簽名稱,則將應用禁止規則。
為了防止警報禁止自身,與規則的目標和源端 都 匹配的警報不能被警報(包括其本身)為真來禁止。但是,我們建議選擇目標匹配器和源匹配器,以使警報永遠不會同時匹配雙方。這很容易進行推理,並且不會觸發此特殊情況。
接著是規則rules
不解釋了,自己研究官方文檔
alertmanager的非容器安裝方式是
wget https://github.com/prometheus/alertmanager/releases/download/v0.20.0/alertmanager-0.20.0.linux-amd64.tar.gz
tar xf alertmanager-0.20.0.linux-amd64.tar.gz
mv alertmanager-0.20.0.linux-amd64 /usr/local/alertmanager
vim /usr/lib/systemd/system/alertmanager.service
[Unit]
Description=alertmanager
Documentation=https://github.com/prometheus/alertmanager
After=network.target
[Service]
Type=simple
User=root
ExecStart=/usr/local/alertmanager/alertmanager --config.file=/usr/local/alertmanager/alertmanager.yml
Restart=on-failure
[Install]
WantedBy=multi-user.target
Alertmanager 安裝目錄下默認有 alertmanager.yml 配置文件,可以創建新的配置文件,在啟動時指定即可。
其餘方式和上面一樣
接著是Prometheus,我之前的博客里有寫了容器安裝和非容器安裝的方法,自己去翻閱
然後是在prometheus.yml里修改相關配置
首先去掉alertmanager的注釋,改成IP加你設置的埠號,默認是9093
接著在rule_files: 下面寫下規則文件的絕對路徑,可以是具體文件名,也可以是*,也可以分幾級文件,*默認是全部匹配
接著是被監控項的設置,這里設置完成可以在Prometheus網頁里的targets里看得到
請注意,這里設置的參數名字要和rule規則中設置的參數名字一模一樣,否則你的prometheus服務會無法啟動,然後報錯
如果不在特定的job下設置scrape_interval(優先順序高於全局),則默認採用gobal下的scrape_interval
最後模擬節點掉線,手動關閉node-exporter或者Cadvisor
docker stop node-exporter 或者容器ID
docker stop cadvisor 或者容器ID
或者把up{{job='prometheus'}} == 1 設置成1,反向設置,不用關掉服務,就可以看看告警成不成功
說明一下 Prometheus Alert 告警狀態有三種狀態:Inactive、Pending、Firing。
Inactive:非活動狀態,表示正在監控,但是還未有任何警報觸發。
Pending:表示這個警報必須被觸發。由於警報可以被分組、壓抑/抑制或靜默/靜音,所以等待驗證,一旦所有的驗證都通過,則將轉到 Firing 狀態。
Firing:將警報發送到 AlertManager,它將按照配置將警報的發送給所有接收者。一旦警報解除,則將狀態轉到 Inactive,如此循環。
沒有配置告警模板時的默認告警格式是這樣的
節點恢復後郵件告知是這樣的
寫了模板後是這樣的
還要重新映射模板文件夾路徑到alertmanager容器里的相對路徑,然後重啟alertmanager,當然,如果目錄下沒有模板文件,則不顯示
告警模板
在alertmanager.yml中修改相關設置
重啟alertmanager
docker restart alertmanager
最終效果不是很好
㈢ 錄像機ntp伺服器地址和埠
錄像機設置IP地址方法:
1、手動設置IP地址
設置計算機的IP地址為192.168.1.xxx(xxx范圍是2~254),子網掩碼為255.255.225.0,默認網關為192.168.1.1。
2、利用路由器內置的DHCP伺服器自動設置IP地址
1)、 設置計算機的TCP/IP協議為「自動獲取IP地址」。
2)、關閉路由器和計算機電源。首先打開路由器,然後再啟動計算機,這樣路由器內置DHCP伺服器將自動為計算機設置IP地址。
錄像機網路設置的NTP,在網傳的時候不需要設置,只需設置IP與網關就行。
㈣ 請問NTP伺服器默認使用的是TCP還是UDP的多少埠
NTP是使用的UDP協議,埠號為123。
NTP伺服器【Network Time Protocol(NTP)】是用來使計算機時間同步化的一種協議,它可以使計算機對其伺服器或時鍾源(如石英鍾,GPS等等)做同步化,它可以提供高精準度的時間校正(LAN上與標准間差小於1毫秒,WAN上幾十毫秒)。
且可介由加密確認的方式來防止惡毒的協議攻擊。時間按NTP伺服器的等級傳播。按照離外部UTC源的遠近把所有伺服器歸入不同的Stratum(層)中。
(4)阿里雲ntp伺服器埠擴展閱讀
內容
UDP是OSI參考模型中一種無連接的傳輸層協議,它主要用於不要求分組順序到達的傳輸中,分組傳輸順序的檢查與排序由應用層完成,提供面向事務的簡單不可靠信息傳送服務。UDP 協議基本上是IP協議與上層協議的介面。UDP協議適用埠分別運行在同一台設備上的多個應用程序。
UDP提供了無連接通信,且不對傳送數據包進行可靠性保證,適合於一次傳輸少量數據,UDP傳輸的可靠性由應用層負責。常用的UDP埠號有:53(DNS)、69(TFTP)、161(SNMP),使用UDP協議包括:TFTP、SNMP、NFS、DNS、BOOTP。
UDP報文沒有可靠性保證、順序保證和流量控制欄位等,可靠性較差。但是正因為UDP協議的控制選項較少,在數據傳輸過程中延遲小、數據傳輸效率高,適合對可靠性要求不高的應用程序,或者可以保障可靠性的應用程序,如DNS、TFTP、SNMP等。
功能
為了在給定的主機上能識別多個目的地址,同時允許多個應用程序在同一台主機上工作並能獨立地進行數據包的發送和接收,設計用戶數據報協議UDP。
UDP使用底層的互聯網協議來傳送報文,同IP一樣提供不可靠的無連接數據包傳輸服務。它不提供報文到達確認、排序、及流量控制等功能。
UDP Helper可以實現對指定UDP埠廣播報文的中繼轉發,即將指定UDP埠的廣播報文轉換為單播報文發送給指定的伺服器,起到中繼的作用。
參考資料來源:網路-UDP
參考資料來源:網路-NTP伺服器
㈤ Linux裡面ntp埠是多少
NTP默認使用UDP埠號123; NTP在TCP中使用埠號123 NTP是用來使計算機時間同步化的一種協議。NTP默認使用UDP埠號123
==注意防火牆屏蔽ntp埠=== ntp伺服器默認埠是123,如果防火牆是開啟狀態,在一些操作可能會出現錯誤,所以要記住關閉防火牆。 ===同步硬體時鍾=== ntp服務,默認只會同步系..
㈥ 阿里雲伺服器怎麼放行埠
阿里雲伺服器如何開放埠,這里我將開放8082埠,我們來看下吧
登錄阿里雲伺服器並進入控制台,點擊【雲伺服器ECS】。
編輯安全組規則,我里我將克隆信息的埠的范圍改成8082/8082後按確定按鈕。這樣就添加規則並開放了8082埠了。
㈦ 怎麼查阿里雲伺服器的埠
可以在注冊表裡查看,下面是注冊表詳細查詢地址:
HKEY_LOCAL_MACHINE\System\CurrentControlSet\Control\TerminalServer\WinStations\RDP-Tcp\PortNumber
HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Terminal Server\Wds\rdpwd\Tds\tcp\portnumber\
㈧ NTP默認使用的埠號是什麼
NTP默認使用的埠號是UDP123。
㈨ NTP的安裝與部署
背景我們有5台虛擬主機做時間同步,那就需要分別安裝NTP服務。
主機地址為:
192.168.3.1 master
192.168.3.2 客戶機1
192.168.3.3 客戶機2
192.168.3.4 客戶機3
192.168.3.5 客戶機4
1、安裝NTP
我們使用yum命令為每台機器安裝ntp軟體,命令如下:
yum install -y ntp
每台機器都需要安裝,所以要分別在對應的主機上分別執行該命令。如下圖
看到如下圖片提示內容,則代表安裝完成:
2、修改ntp的配置文件
vi /etc/ntp.conf
首先我們要編輯主機的ntp服務配置文件,
我們去編輯master的機器的文件/etc/ntp.conf
找到ntp時間同步的機器范圍配置項
restrict 192.168.3.0 mask 255.255.255.0 nomodify notrap
這里的意思代表,192.168.3的網段的機器都參與ntp的時間同步。
內容大致如下:
////存放ntp服務日誌的位置
logfile /var/log/ntpd.log
////ntp依賴的互聯網時間伺服器地址,我們這里選擇的是阿里雲的時間伺服器,當然還有很多其他時間伺服器可以選擇,看下這個地址 https://www.ntppool.org/zone/asia ,
////兜底時間伺服器,當以上三個時間伺服器不可用時,就是以本機時間作為集群機器的統一時間。
server 127.0.0.1
fudge 127.0.0.1 stratum 10
3、主機做時間同步操作:
這里需要使用如下命令:
ntpdate -u ntp2.aliyun.com(取用時間伺服器的任意一台即可),出現如下提示內容,即代表我們的時間伺服器是可以同步時間的。如果沒有出現相應的內容,可能是由於自己的機器網路防火牆或者埠沒有打開導致的。
5、查看ntpd的狀態
systemctl status ntpd
如下圖,則代表ntp服務運行中
代表沒有做完時間同步,因為第一次時間同步需要5-10分鍾時間,所以需要等待。直到看到如下提示,即可:
8、我們去完成NTP客戶機的配置
vi /etc/ntp.conf
我們客戶機的配置的時間伺服器,就不需要直接指向阿里雲的機器了,直接使用我們的master主機即可。可以是主機名,也可以是ip地址。
server 192.168.3.1
同理,其他幾個客戶機也按照這種方式配置,保存。配置完成後,也要做服務啟動,系統重啟後隨機自動啟動,這里就不贅述了。
這樣,我們就把ntp服務安裝完畢了,謝謝。
㈩ 阿里雲伺服器如何打開埠
1、首先登陸阿里雲網站,進入控制台,點擊雲伺服器ECS,進入伺服器控制台,點擊要選擇的伺服器。