Ⅰ 在linux部署進程守護腳本遇到的坑
昨天在Linux做個進程守護腳本時發生了幾個小問題,實屬不該。先總結如下,在以後的實踐中一個避免這樣的問題。同時針對cron,再次深入學習實踐。
1、換行符問題
腳本與運行報錯「:badinterpreter:Nosuchfileordirectory」。
腳本在windows下編輯,有幾條命令是直接復制過來使用的,雖然vs code可以在右下角選擇行尾序列,但是在實際運行時還是提示無法識別/r,每一行都多了個^M 。
\r\n: Dos和Windows採用回車+換行(CR+LF)表示下一行,即^M$
\n: 而UNIX/Linux採用換行符(LF)表示下一行
\r: 蘋果機(MAC OS系統)則採用回車符(CR)表示下一行
2、= 賦值問題
筆者在使用if條件表達式時,知道條件要放在方括弧之間,並且要有空格。誤以為變數賦值=也要空格,運行時發現變數無法識=識別,後來才知道變數賦值=不能有空格。
3、cron定時任務的環境變數問題
用戶的crontab定時任務不會使用默認的變數, 需要寫全路徑,包括crontab調用的腳本裡面 。而系統cron定時任務是由定義環境變數的。MAILTO是表示例行性命令發生錯誤時,會將錯誤訊息郵件傳給root,伺服器中關閉postfix,導致郵件發送不成功,全部小文件堆積在/var/spool/postfix/maildrop/裡面。
4、cron中執行的程序有輸出內容,輸出內容會以郵件形式發給cron的用戶,而sendmail沒有啟動所以就產生了/var/spool/mail目錄下的那些文件,日積月累可能撐破磁碟。在cron中命令後面加上 >/dev/null 2>&1 來不輸出。
5、crontab中的指令需要root,配置/etc/sudoers文件來保證sudo可用,其實可用使用系統任務計劃,指定root來執行即可。
最後,筆者專注於使用cron,現在在以前的文章(樹莓派上測試)- Linux crontab定時任務詳細分解 的基礎上,在騰訊雲伺服器centos上補充以下cron的知識。
用戶計劃任務 :
1、crond時cron的守護進程,crond是由多個配置文件和系統范圍內的文件控制的,每個用戶對應一個配置文件。crond守護進程是cronie軟體的一部分。用戶的配置文件在/var/spool/cron/username。
2、crontab命令
crontab -e 編輯當前用戶的定時計劃
crontab -l 列出當前用戶的定時計劃
crontab -r 刪除當前用戶的所有定時計劃
crontab filename 刪除當前用戶的所有定時計劃,並從filename中讀取作業,如果未指定任何文件,則使用stdin 。
3、格式,另外*/x表示間隔x個周期。 用戶計劃任務沒有user-name欄位!
*/7 9-16 * jul 5 command表示7月的每周五的上午9到下午5點 間,每七分鍾執行一次。
系統計劃任務:
1、系統cron不是由crontab來執行的,而是在一組配置文件中定義的,配置文件多了一個欄位-用戶欄位,指定作業在那個用戶下運行。
2、系統計劃任務儲存在/etc/crontab、 /etc/cron.d/* 以及/etc/cron.* ,/etc/crontab的語法規則參照上面的圖。 /etc/cron.d/時軟體產生的一些更新任務,一般不在裡面做操作。
3、預定義作業,cron.daily、cron.hourly、cron.monthly、cron.weekly下面儲存的是可執行腳本。
/etc/cron.hourly/*腳本是使用runparts命令從/etc/cron.d/0hourly中定義的,表示每小時的第一分鍾將 /etc/cron.hourly/下面的腳本全部執行。
/etc/cron.daily、 /etc/cron.monthly、 /etc/cron.weekly也是使用runparts命令,但是是從/etc/anacrontab中執行的。
4、/etc/anacrontab語法規則
START_HOURS_RANGE=3-22,表示Anacron jobs will start between 3am and 10pm.
RANDOM_DELAY=45,The RANDOM_DELAY variable denotes the maximum number of minutes that will be added to the delay in minutes variable which is specified for each job.
上圖中,對於 /etc/cron.daily,那麼delay 會是 5 minutes + RANDOM_DELAY 。
接下來就是4個重要的參數:
period in days ,delay in minutes ,job-identifier, command
The period in days variable表示執行周期,每多少天運行一次該作業。
delay in minutes:上面提到的執行的延時,啟動作業前,crond等待的時間。
job-identifier:標識作業的唯一名稱,用做日誌記錄。是/var/spool/anacron中文件的名稱,檢查該作業是否已運行,/etc/anacrontab啟動作業時,會更新此文件的時間戳,檢查作業上次運行的時間。anacron 會分析現在的時間與時間記錄文件所記載的上次執行 anacron 的時間,將兩者進行比較,如果兩個時間的差值超過 anacron 的指定時間差值(一般是 1 天、7 天和一個月),就說明有定時任務沒有執行,這時 anacron 會介入並執行這個漏掉的定時任務,從而保證在關機時沒有執行的定時任務不會被漏掉。這也是為什麼/etc/cron.{daily,weekly,monthly} 目錄中的定時任務只會被 anacron 調用,而 /etc/cron.hourly/被cron調用 。
command:執行命令可以是普通命令或者腳本。
5、cron的訪問控制
/etc/cron.allow、 /etc/cron.deny ,以決定哪些用戶可以使用調度服務。
如果只有cron.deny文件,而cron.allow文件不存在,則除了黑名單之外的所有用戶都可以使用;
如果只有cron.allow文件存在,而cron.deny文件不存在時,則只有白名單用戶才可以使用,,包括root。
如果兩個文件都存在,則忽略cron.allow文件。
如果兩個文件都不存在,每個用戶都可以訪問。
Ⅱ LINUX進程監控保護
幾種辦法,
1, 最簡單的,寫一個腳本,比如
#!/bin/sh
while true
do
./1234 xx bb
done
執行這個腳本,就不用擔心 1234 退出後出問題了。
2, 用上面的方法,你可能會提出,如果腳本本身被殺了怎麼辦…… 可以用定時任務,比如 通過 crontab 可以每分鍾去檢查一下1234進程是否還在
比如下面的腳本可以檢查 1234 是否存在,如果不存在就會自動啟動 1234
#!/bin/sh
ps -A | awk '{print $4}' | grep -q '^1234$'
if [ $? -ne 0]; then
/PATH/TO/1234 xx bb
fi
假定這個腳本叫 a.sh
然後用crontab -e增加定時任務
* * * * * /path/to/a.sh
即可。
Ⅲ Linux下怎麼查看某個守護進程或者所有的守護進程
查看守候進程的命令可以使用ps完成。
進程一般分為交互進程、批處理進程和守護進程(daemons)三類。值得一提的是守護進程總是活躍的,一般在後台運行,守護進程一般由系統在開機時通過腳本自動激活啟動或由超級管理用戶root來啟動。比如在Fedora或Redhat中,我們可以定義httpd伺服器的啟動腳本的運行級別,此文件位於/etc/init.d目錄下,文件名是httpd,/etc/init.d/httpd 就是httpd伺服器的守護程序,當把它的運行級別設置為3和5時,當系統啟動時,它會跟著啟動。
[root@localhost~]#chkconfig--level35httpdon
由於守護進程是一直運行著的,所以它所處的狀態是等待請求處理任務。例如通常大網站的Apache伺服器都在運行,等待著用戶來訪問,也就是等待著任務處理。
Linux伺服器在啟動時需要啟動很多系統服務,它們向本地和網路用戶提供了Linux的系統功能介面,直接面向應用程序和用戶。提供這些服務的程序是由運行在後台的守護進程來執行的。守護進程是生存期長的一種進程。它們獨立於控制終端並且周期性地執行某種任務或等待處理某些發生的事件。它們常常在系統引導裝入時啟動,在系統關閉時終止。Linux系統有很多守護進程,大多數伺服器都是用守護進程實現的。同時,守護進程完成許多系統任務,比如,作業規劃進程crond、列印進程lqd等。有些書籍和資料也把守護進程稱為"服務"。選擇運行哪些守護進程,要根據具體需求決定。查看系統可以提供的守護進程對應的服務,打開一個終端以root許可權運行ntsysv命令。
Ⅳ Linux下的守護進程的概念daemon.py是什麼意思
守護進程一般是伺服器類程序中用來無限循環等待事件發生的一個進程或線程,也就是說,它的作用是等待一個事件發生,事件發生後調用另外的進程區完成相應的工作,自己再回去等事件發生。
用ps aux查看進程的進程號,然後用kill殺掉
py是後綴名,意思是用python語言寫的。
至於如何重啟,這個沒有統一的方法。你可以查看相關的文檔,或者在google上搜索,或者man一下。。
守護進程一個或者多個都是可能的。
Ⅳ 如何以守護進程在linux系統下執行
編寫守護進程程序的要點:
(1)讓程序在後台執行。方法是調用fork()產生一個子進程,然後使父進程退出。
(2)調用setsid()創建一個新對話期。控制終端、登錄會話和進程組通常是從父進程繼承下來的,守護進程要擺脫它們,不受它們的影響,方法是調用setsid()使進程成為一個會話組長。setsid()調用成功後,進程成為新的會話組長和進程組長,並與原來的登錄會話、進程組和控制終端脫離。
(3)禁止進程重新打開控制終端。經過以上步驟,進程已經成為一個無終端的會話組長,但是它可以重新申請打開一個終端。為了避免這種情況發生,可以通過使進程不再是會話組長來實現。再一次通過fork()創建新的子進程,使調用fork的進程退出。
(4)關閉不再需要的文件描述符。子進程從父進程繼承打開的文件描述符。如不關閉,將會浪費系統資源,造成進程所在的文件系統無法卸下以及引起無法預料的錯誤。首先獲得最高文件描述符值,然後用一個循環程序,關閉0到最高文件描述符值的所有文件描述符。
(5)將當前目錄更改為根目錄。
(6)子進程從父進程繼承的文件創建屏蔽字可能會拒絕某些許可權。為防止這一點,使用unmask(0)將屏蔽字清零。
(7)處理SIGCHLD信號。對於伺服器進程,在請求到來時往往生成子進程處理請求。如果父進程不等待子進程結束,子進程將成為僵屍進程(zombie),從而佔用系統資源。如果父進程等待子進程結束,將增加父進程的負擔,影響伺服器進程的並發性能。在Linux下可以簡單地將SIGCHLD信號的操作設為SIG_IGN。這樣,子進程結束時不會產生僵屍進程。
Ⅵ Linux系統中的守護進程講解
守護進程daemon,是生存期較長的一種進程。它們常常在系統自舉時啟動,僅在系統關閉時才終止。因為它們沒有控制終端,所以說它們是在後台運行的。UNIX系統有很多守護進程,它們執行日常事務活動。
1、系統自舉
自舉(bootstrapping)一詞來自於人都是靠自身的自舉機構站立起來的這一思想。計算機必須具備自舉能力將自己所有的元件激活,以便能完成載入操作系統這一目的,然後再由操作系統承擔起那些單靠自舉代碼無法完成的更復雜的任務。
自舉只有兩個功能:加電自檢和磁碟引導。
加電自檢:當我們按下計算機電源開關時,頭幾秒鍾機器似乎什麼反應也沒有,其實,這時的計算機正在進行加電自檢,以斷定它的所有元件都在正確地工作。如果某個元件有故障,顯示器上就會出現報警提示信息(如果顯示器也不能正常工作,則以一串嘟嘟聲來報警)。由於大多數計算機工作非常可靠,加電自檢報警非常罕見。
磁碟引導:查找裝有操作系統的磁碟驅動器。從磁碟載入操作系統的原因有二,一是操作系統升級簡單容易,二是使用戶擁有選擇操作系統的自由。
當加電自檢和磁碟引導完成時,自舉操作就啟動一個讀寫操作系統文件和將它們復制到隨機存儲器中的過程,此時的機器才是真正意義上的計算機。計算機的啟動可以有冷啟動和熱啟動兩種方式 ,它們之間的差別是熱啟動不進行機器的自檢(機器本身配置的檢查與測試),當計算機在使用過程中由於某些原因造成死機時,可以對計算機進行熱啟動處理。
2、守護進程的概念
通過ps axj命令可以查看到守護進程:
參數a表示不僅列當前用戶的進程,也列出所有其他用戶的進程,參數x表示不僅列有控制終端的進程,也列出所有無控制終端的進程,參數j表示列出與作業控制相關的信息。
代碼如下:PPID PID PGID SID TTY TPGID STAT UID TIME COMMAND 0 1 1 1 ? -1 Ss 0 0:01 /sbin/init 0 2 0 0 ? -1 S< 0 0:00 [kthreadd] 2 3 0 0 ? -1 S< 0 0:00 [migration/0] 2 4 0 0 ? -1 S< 0 0:00 [ksoftirqd/0]... 1 2373 2373 2373 ? -1 S<s 0 0:00 /sbin/udevd --daemon... 1 4680 4680 4680 ? -1 Ss 0 0:00 /usr/sbin/acpid -c /etc... 1 4808 4808 4808 ? -1 Ss 102 0:00 /sbin/syslogd -u syslog...
凡是TPGID一欄寫著-1的都是沒有控制終端的進程,也就是守護進程。在COMMAND一列用[]括起來的名字表示內核線程,這些線程在內核里創建,沒有用戶空間代碼,因此沒有程序文件名和命令行,通常採用以k開頭的名字,表示Kernel。init進程我們已經很熟悉了,udevd負責維護/dev目錄下的設備文件,acpid負責電源管理,syslogd負責維護/var/log下的日誌文件,可以看出,守護進程通常採用以d結尾的`名字,表示Daemon。 創建守護進程最關鍵的一步是調用setsid函數創建一個新的Session,並成為Session Leader。 例子: C/C++ Code復制內容到剪貼板 void daemonize(void) { pid_t pid; printf("into deamonizen"); if (pid=fork() < 0) { perror("fork"); exit(1); } else if (pid !=0) { exit(0); } setsid(); if (chdir("/") < 0) { perror("chdir"); exit(1); } close(0); open("/dev/null", O_RDWR); p2(0, 1); p2(0, 2); printf("out deamonizen"); }
3、編寫守護進程 在編寫守護進程程序時,需遵循一些基本規則:
(1)首先要做的是調用umask將文件模式創建屏蔽字設置為0。
(2)調用fork,然後使父進程退出。
(3)調用setsid以創建一個新會話。
(4)將當前工作目錄更改為根目錄。
(5)關閉不再需要的文件描述符。
(6)某些守護進程打開/dev/null使其具有文件描述符0、1和2,任何一個試圖讀標准輸入、寫標准輸出或標准出錯的庫常式都不會產生任何效果。 與守護進程有關的一個問題是如何處理出錯消息,需要有一個集中的守護進程出錯記錄設施,這就是syslogd進程。
4、守護進程慣例 為了正常運作,某些守護進程實現為單實例的,有就是在任一時刻只運行該守護進程的一個副本。文件鎖和記錄鎖機制是一種方法的基礎,該方法用來保證一個守護進程只有一個副本在運行。
在UNIX系統中,守護進程遵循下列公共慣例:
(1)若守護進程使用鎖文件,那麼該文件通常存放在/var/run目錄中。鎖文件的名字通常是name.pid,name是該守護進程或服務的名字。
(2)若守護進程支持配置選項,那麼配置文件通常存放在/etc目錄中。配置文件的名字通常是name.conf。
(3)守護進程可用命令行啟動,但通常它們是由系統初始化腳本啟動的。
(4)若一守護進程有一配置文件,那麼當該守護進程啟動時,它讀該文件,但在此之後一般就不會再查看它。
Ⅶ Linux守護進程詳解
在Linux伺服器實際應用中,經常會有需要長時間執行的任務。這類任務若在前台運行,用戶無法進行其他操作或者斷開與伺服器的連接,否則任務將被中止。此時適合使用守護進程。為了使用守護進程,需要了解Linux前台、後台、守護進程的概念與使用,本文將對此進行講解。
可以看出,」後台任務」與」前台任務」的重要區別: 是否繼承標准輸入 。所以,執行後台任務的同時,用戶還可以輸入其他命令。
為了理解守護任務為何在結束session時也不退出,需要先了解Linux下退出session時發生的操作。
Session退出時,linux系統設計如下:
前台任務會隨著session的退出而退出是因為它收到了 SIGHUP信號 。
後台任務是否會受到SIGNUP信號,取決於shell的 huponexit 參數。可以通過 $ shopt | grep huponexit 查看該參數的值。大多數Linux系統,這個參數默認關閉(off)。因此,session退出的時候,不會把SIGHUP信號發給」後台任務」,即此時的後台任務是守護進程,但這顯然不夠安全。並不保險,因為有的系統的 huponexit 參數可能是打開的(on)狀態。
更保險的方法是使用 disown命令。它可以將指定任務從」後台任務」列表(jobs命令的返回結果)之中移除 。一個」後台任務」只要不在這個列表之中,session 就肯定不會向它發出SIGHUP信號。
執行上面的命令以後, server.js 進程就被移出了」後台任務」列表。你可以執行 jobs 命令驗證,輸出結果裡面,不會有這個進程。
但是,這樣還存在問題。因為 」後台任務」的標准 I/O 繼承自當前 session, disown 命令並沒有改變這一點 。一旦」後台任務」讀寫標准 I/O,就會發現它已經不存在了,所以就 報錯終止執行 。 為了解決這個問題,需要對」後台任務」的 標准 I/O 進行重定向 。
這樣基本上就沒有問題了。
註:
/dev/null 文件的作用
這是一個無底洞,任何東西都可以定向到這里,但是卻無法打開。
所以一般很大的stdou和stderr當你不關心的時候可以利用stdout和stderr定向到這里
nohup命令對server.js進程做了三件事。
阻止SIGHUP信號發到這個進程。
關閉標准輸入。該進程不再能夠接收任何輸入,即使運行在前台。
重定向標准輸出和標准錯誤到文件nohup.out。
也就是說,nohup命令實際上將子進程與它所在的 session 分離了。 注意,nohup命令不會自動把進程變為」後台任務」,所以必須加上&符號
守護進程創建方法:
方法一:
方法二:
方法三:
fg、bg、jobs、&、nohup、ctrl+z、ctrl+c 命令
一、&
加在一個命令的最後,可以把這個命令放到後台執行,如:
二、ctrl + z
可以將一個正在前台執行的命令放到後台,並且處於暫停狀態。
CTRL+Z 和 CTRL+C的對比
CTRL+Z 和 CTRL+C 都是中斷命令,但是他們的作用卻不一樣.
CTRL+C 是強制中斷程序的執行,而 CTRL+Z 的是將任務中斷,但是此任務並沒有結束,仍然在進程中,只是維持掛起的狀態,用戶可以使用 fg/bg 操作繼續前台或後台的任務。
三、jobs
查看當前有多少在後台運行的進程
jobs -l選項可顯示所有任務的PID,jobs的狀態可以是running, stopped, Terminated。但是如果任務被終止了(kill),shell 從當前的shell環境已知的列表中刪除任務的進程標識。
四、fg
將後台中的命令調至前台繼續運行。如果後台中有多個命令,可以用 fg %jobnumber (jobnumber是命令編號,不是進程號)將選中的命令調出。
五、bg
將一個在後台暫停的命令,變成在後台繼續執行。
如果後台中有多個命令,可以用 bg %jobnumber 將選中的命令調出。
六、kill
方法1:通過jobs命令查看job號(假設為num),然後執行
方法2:通過ps命令查看job的進程號(PID,假設為pid),然後執行
前台進程的終止:Ctrl+c
七、nohup
如果想讓程序即使在關閉當前的終端後也始終在後台執行(之前的&做不到),需要使用nohup命令。
nohup命令可以在你退出帳戶/關閉終端之後繼續運行相應的進程。
關閉終端後,在另一個終端jobs已經無法看到後台跑的程序了,此時利用ps(進程查看命令)查看進程。
http://m.2cto.com/os/201301/185701.html
http://www.cnblogs.com/kaituorensheng/p/3980334.html
http://m.blog.csdn.net/article/details?id=50766752