① shell awk命令詳解
awk命令
awk是一種編程語言,用於在linux/unix下對文本和數據進行處理。數據可以來自標准輸入(stdin)、一個或多個文件,或其它命令的輸出。它支持用戶自定義函數和動態正則表達式等先進功能,是linux/unix下的一個強大編程工具。它在命令行中使用,但更多是作為腳本來使用。awk有很多內建的功能,比如數組、函數等,這是它和C語言的相同之處,靈活性是awk最大的優勢。
awk命令格式和選項
語法格式
awk [options] 'script' var=value file(s)
awk [options] -f scriptfile var=value file(s)
常用命令選項
-F fs fs 指定輸入分隔符,fs可以時字元串或正則表達式
-v var=value 賦值一個用戶定義變數,將外部變數傳遞給awk
-f scriptfile 從腳本文件中讀取awk命令
awk腳本
awk腳本是由模式和操作組成的。
模式與操作
模式
模式可以是以下任意一種:
正則表達式:使用通配符的擴展集
關系表達式:使用運算符進行操作,可以是字元串或數字的比較測試
模式匹配表達式:用運算符~(匹配)和~!不匹配
BEGIN 語句塊, pattern語句塊, END語句塊
操作
操作由一個或多個命令、函數、表達式組成,之間由換行符或分號隔開,並位於大刮號內,主要部分是:變數或數組賦值、輸出命令、內置函數、控制流語句。
awk腳本基本格式
awk 'BEGIN{ commands } pattern{ commands } END{ commands }' file
一個awk腳本通常由BEGIN, 通用語句塊,END語句塊組成,三部分都是可選的。 腳本通常是被單引號或雙引號包住。
awk 'BEGIN{ i=0 } { i++ } END{ print i }' filename
awk "BEGIN{ i=0 } { i++ } END{ print i }" filename
awk執行過程分析
第一步: 執行BEGIN { commands } pattern 語句塊中的語句
BEGIN語句塊:在awk開始從輸入輸出流中讀取行之前執行,在BEGIN語句塊中執行如變數初始化,列印輸出表頭等操作。
第二步:從文件或標准輸入中讀取一行,然後執行pattern{ commands }語句塊。它逐行掃描文件,從第一行到最後一行重復這個過程,直到全部文件都被讀取完畢。
pattern語句塊:pattern語句塊中的通用命令是最重要的部分,它也是可選的。如果沒有提供pattern語句塊,則默認執行{ print },即列印每一個讀取到的行。{ }類似一個循環體,會對文件中的每一行進行迭代,通常將變數初始化語句放在BEGIN語句塊中,將列印結果等語句放在END語句塊中。
第三步:當讀至輸入流末尾時,執行END { command }語句塊
END語句塊:在awk從輸入流中讀取完所有的行之後即被執行,比如列印所有行的分析結果這類信息匯總都是在END語句塊中完成,它也是一個可選語句塊。
AWK內置變數
$n : 當前記錄的第n個欄位,比如n為1表示第一個欄位,n為2表示第二個欄位。
$0 : 這個變數包含執行過程中當前行的文本內容。
ARGC : 命令行參數的數目。
ARGIND : 命令行中當前文件的位置(從0開始算)。
ARGV : 包含命令行參數的數組。
CONVFMT : 數字轉換格式(默認值為%.6g)。
ENVIRON : 環境變數關聯數組。
ERRNO : 最後一個系統錯誤的描述。
FIELDWIDTHS : 欄位寬度列表(用空格鍵分隔)。
FILENAME : 當前輸入文件的名。
NR : 表示記錄數,在執行過程中對應於當前的行號
FNR : 同NR :,但相對於當前文件。
FS : 欄位分隔符(默認是任何空格)。
IGNORECASE : 如果為真,則進行忽略大小寫的匹配。
NF : 表示欄位數,在執行過程中對應於當前的欄位數。 print $NF答應一行中最後一個欄位
OFMT : 數字的輸出格式(默認值是%.6g)。
OFS : 輸出欄位分隔符(默認值是一個空格)。
ORS : 輸出記錄分隔符(默認值是一個換行符)。
RS : 記錄分隔符(默認是一個換行符)。
RSTART : 由match函數所匹配的字元串的第一個位置。
RLENGTH : 由match函數所匹配的字元串的長度。
SUBSEP : 數組下標分隔符(默認值是34)。
將外部變數值傳遞給awk
藉助 -v 選項,可以將來自外部值(非stdin)傳遞給awk
VAR=10000
echo | awk -v VARIABLE=$VAR '{ print VARIABLE }'
定義內部變數接收外部變數
var1="aaa"
var2="bbb"
echo | awk '{ print v1,v2 }' v1=$var1 v2=$var2
當輸入來自文件時
awk '{ print v1,v2 }' v1=$var1 v2=$var2 filename
awk運算
算術運算:(+,-,*,/,&,!,……,++,--)
所有用作算術運算符進行操作時,操作數自動轉為數值,所有非數值都變為0
賦值運算:(=, +=, -=,*=,/=,%=,……=,**=)
邏輯運算符: (||, &&)
關系運算符:(<, <=, >,>=,!=, ==)
正則運算符:(~,~!)(匹配正則表達式,與不匹配正則表達式)
awk 'BEGIN{a="100testa";if(a ~ /^100*/){print "ok";}}'
ok
awk高級輸入輸出
讀取下一條記錄:next 語句
awk中next語句使用:在循環逐行匹配,如果遇到next,就會跳過當前行,直接忽略下面語句。而進行下一行匹配。net語句一般用於多行合並:
awk 'NR%2==1{next}{print NR,$0;}' text.txt
說明: 當記錄行號除以2餘1,就跳過當前行。下面的print NR,$0也不會執行。下一行開始,程序有開始判斷NR%2值。這個時候記錄行號是:2 ,就會執行下面語句塊:print NR,$0
讀取一行記錄:getline 語句
awk getline用法:輸出重定向需用到getline函數。getline從標准輸入、管道或者當前正在處理的文件之外的其他輸入文件獲得輸入。它負責從輸入獲得下一行的內容,並給NF,NR和FNR等內建變數賦值。如果得到一條記錄,getline函數返回1,如果到達文件的末尾就返回0,如果出現錯誤,例如打開文件失敗,就返回-1。
語法格式:getline var 變數var包含了特定行的內容
用法說明:
當其左右無重定向符時|,<時:getline作用於當前文件,讀入當前文件的第一行給其後跟的變數var或$0(無變數),應該注意到,由於awk在處理getline之前已經讀入了一行,所以getline得到的返回結果是隔行的。
當其左右有重定向符時|,<時:getline則作用於定向輸入文件,由於該文件是剛打開,並沒有被awk讀入一行,只是getline讀入,那麼getline返回的是該文件的第一行,而不是隔行。
文件操作
打開文件 open("filename")
關閉文件 close("filename")
輸出到文件 重定向到文件,如echo | awk '{printf("hello word!n") > "datafile"}'
循環結構
for循環
for(變數 in 數組)
{語句}
for(變數;條件;表達式)
{語句}
while循環
while(表達式)
{語句}
do...while循環
do
{語句} while(條件)
其他相關語句
break:退出程序循環
continue: 進入下一次循環
next:讀取下一個輸入行
exit:退出主輸入循環,進入END,若沒有END或END中有exit語句,則退出腳本。
數組
在awk中數組叫做關聯數組(associative arrays)。awk 中的數組不必提前聲明,也不必聲明大小。數組元素用0或空字元串來初始化,這根據上下文而定。
awk 'BEGIN{
Array[1]="sun"
Array[2]="kai"
Array["first"]="www"
Array["last"]="name"
Array["birth"]="1987"
info = "it is a test";
lens = split(info,tA," ");
for(item in tA)
{print tA[item];}
for(i=1;i<=lens;i++)
{print tA[i];}
print length(tA[lens]);
} {
print "item in array";
for(item in Array) {print Array[item]};
print "print in i++";
for(i=1;i<=length(Array);i++) {print Array[i]};
}'
獲取數組長度
awk 'BEGIN{
info="it is a test";
lens=split(info,tA," "); #使用split函數獲取數組長度
print length(tA),lens; #使用length函數獲取數組長度(版本有要求)
}'
**說明:** **版本夠高**的awk當中,支持直接得到數組長度的方法length(),如果awk的版本過低,則不支持。另外,如果傳給length的變數是一個字元串,那麼length返回的則字元串的長度。
輸出數組內容
有序輸出 for...in
因為數組時關聯數組,默認是無序的
無序輸出 for(i=1;i<l=ens;i++)
數組下標從1開始
判斷鍵值是否存在
#錯誤的判斷方法,awk數組是關聯數組,只要通過數組引用它的KEY,就會自動創建。
awk 'BEGIN{
tB["a"]="a1";
tB["b"]="b1";
if(tB["c"]!="1"){ #tB["c"]沒有定義,但是循環的時候會輸出
print "no found";
};
for(k in tB){
print k,tB[k];
}}'
#正確的判定方法:使用 if ( key in array) 判斷數組中是否包含 鍵值
awk 'BEGIN{
tB["a"]="a1";
tB["b"]="b1";
if( "c" in tB){
print "ok";
};
for(k in tB){
print k,tB[k];
}}'
刪除鍵值
delete array[key]可以刪除,對應數組key的,序列值。
awk 'BEGIN{
tB["a"]="a1";
tB["b"]="b1";
delete tB["a"];
for(k in tB){
print k,tB[k];
}}'
二維,多維數組
awk的多維數組在本質上是一維數組,更確切一點,awk在存儲上並不支持多維數組。awk提供了邏輯上模擬二維數組的訪問方式。例如,array[2,4]=1這樣的訪問是允許的。awk使用一個特殊的字元串SUBSEP作為分割欄位。 類似一維數組的成員測試,多維數組可以使用if ( (i,j) in array)這樣的語法,但是下標必須放置在圓括弧中。類似一維數組的循環訪問,多維數組使用for ( item in array )這樣的語法遍歷數組。與一維數組不同的是,多維數組必須使用split()函數來訪問單獨的下標分量。
awk 'BEGIN{
for(i=1;i<=9;i++){
for(j=1;j<=9;j++){
tarr[i,j]=i*j;
print i,"*",j,"=",tarr[i,j];
}
}
}'
awk 'BEGIN{
for(i=1;i<=9;i++){
for(j=1;j<=9;j++){
tarr[i,j]=i*j; } }
for(m in tarr){
split(m,tarr2,SUBSEP);
print tarr2[1],"*",tarr2[2],"=",tarr[m]; } }'
內置函數
算術函數
格式 描述
atan2( y, x ) 返回 y/x 的反正切。
cos( x ) 返回 x 的餘弦;x 是弧度。
sin( x ) 返回 x 的正弦;x 是弧度。
exp( x ) 返回 x 冪函數。
log( x ) 返回 x 的自然對數。
sqrt( x ) 返回 x 平方根。
int( x ) 返回 x 的截斷至整數的值。
rand( ) 返回任意數字 n,其中 0 <= n < 1。
srand( [expr] ) 將 rand 函數的種子值設置為 Expr 參數的值,或如果省略 Expr 參數則使用某天的時間。返回先前的種子值。
awk 'BEGIN{
OFMT="%.3f"; #OFMT 設置輸出數據格式是保留3位小數。
fs=sin(1);
fe=exp(10);
fl=log(10);
fi=int(3.1415);
print fs,fe,fl,fi;
}'
輸出結果為:0.841 22026.466 2.303 3
awk 'BEGIN{
srand();
fr=int(100*rand());
print fr;
}'
輸出:78
字元串函數
格式 描述
gsub( Ere, Repl, [ In ] ) 除了正則表達式所有具體值被替代這點,它和 sub 函數完全一樣地執行。
sub( Ere, Repl, [ In ] ) 用 Repl 參數指定的字元串替換 In 參數指定的字元串中的由 Ere 參數指定的擴展正則表達式的第一個具體值。sub 函數返回替換的數量。出現在 Repl 參數指定的字元串中的 &(和符號)由 In 參數指定的與 Ere 參數的指定的擴展正則表達式匹配的字元串替換。如果未指定 In 參數,預設值是整個記錄($0 記錄變數)。
index( String1, String2 ) 在由 String1 參數指定的字元串(其中有出現 String2 指定的參數)中,返回位置,從 1 開始編號。如果 String2 參數不在 String1 參數中出現,則返回 0(零)。
length [(String)] 返回 String 參數指定的字元串的長度(字元形式)。如果未給出 String 參數,則返回整個記錄的長度($0 記錄變數)。
blength [(String)] 返回 String 參數指定的字元串的長度(以位元組為單位)。如果未給出 String 參數,則返回整個記錄的長度($0 記錄變數)。
substr( String, M, [ N ] ) 返回具有 N 參數指定的字元數量子串。子串從 String 參數指定的字元串取得,其字元以 M 參數指定的位置開始。M 參數指定為將 String 參數中的第一個字元作為編號 1。如果未指定 N 參數,則子串的長度將是 M 參數指定的位置到 String 參數的末尾 的長度。
match( String, Ere ) 在 String 參數指定的字元串(Ere 參數指定的擴展正則表達式出現在其中)中返回位置(字元形式),從 1 開始編號,或如果 Ere 參數不出現,則返回 0(零)。RSTART 特殊變數設置為返回值。RLENGTH 特殊變數設置為匹配的字元串的長度,或如果未找到任何匹配,則設置為 -1(負一)。
tolower( String ) 返回 String 參數指定的字元串,字元串中每個大寫字元將更改為小寫。大寫和小寫的映射由當前語言環境的 LC_CTYPE 范疇定義。
toupper( String ) 返回 String 參數指定的字元串,字元串中每個小寫字元將更改為大寫。大寫和小寫的映射由當前語言環境的 LC_CTYPE 范疇定義。
sprintf(Format, Expr, Expr, . . . ) 根據 Format 參數指定的 printf 子常式格式字元串來格式化 Expr 參數指定的表達式並返回最後生成的字元串。
說明: Ere都可以是正則表達式。
時間函數
格式 描述
mktime( YYYY MM dd HH MM ss[ DST]) 生成時間格式
strftime([format [, timestamp]]) 格式化時間輸出,將時間戳轉為時間字元串 具體格式,見下表.
systime() 得到時間戳,返回從1970年1月1日開始到當前時間(不計閏年)的整秒數
strftime日期和時間格式說明符 :
格式 描述
%a 星期幾的縮寫(Sun)
%A 星期幾的完整寫法(Sunday)
%b 月名的縮寫(Oct)
%B 月名的完整寫法(October)
%c 本地日期和時間
%d 十進制日期
%D 日期 08/20/99
%e 日期,如果只有一位會補上一個空格
%H 用十進製表示24小時格式的小時
%I 用十進製表示12小時格式的小時
%j 從1月1日起一年中的第幾天
%m 十進製表示的月份
%M 十進製表示的分鍾
%p 12小時表示法(AM/PM)
%S 十進製表示的秒
%U 十進製表示的一年中的第幾個星期(星期天作為一個星期的開始)
%w 十進製表示的星期幾(星期天是0)
%W 十進製表示的一年中的第幾個星期(星期一作為一個星期的開始)
%x 重新設置本地日期(08/20/99)
%X 重新設置本地時間(12:00:00)
%y 兩位數字表示的年(99)
%Y 當前月份
%Z 時區(PDT)
%% 百分號(%)
#mktime使用
awk 'BEGIN{tstamp=mktime("2001 01 01 12 12 12");print strftime("%c",tstamp);}'
輸出:2001年01月01日 星期一 12時12分12秒
awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=mktime("2001 02 01 0 0 0");print tstamp2-tstamp1;}'
輸出:2634468
#求2個時間段中間時間差,介紹了strftime使用方法
awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=systime();print tstamp2-tstamp1;}'
輸出:308201392
其他一般函數
格式 描述
close( Expression ) 用同一個帶字元串值的 Expression 參數來關閉由 print 或 printf 語句打開的或調用getline 函數打開的文件或管道。如果文件或管道成功關閉,則返回 0;其它情況下返回非零值。如果打算寫一個文件,並稍後在同一個程序中讀取文件,則 close 語句是必需的。
system(command ) 執行 Command 參數指定的命令,並返回退出狀態。等同於 system 子常式。
Expression | getline [ Variable ] 從來自 Expression 參數指定的命令的輸出中通過管道傳送的流中讀取一個輸入記錄,並將該記錄的值指定給 Variable 參數指定的變數。如果當前未打開將 Expression 參數的值作為其命令名稱的流,則創建流。創建的流等同於調用 popen 子常式,此時 Command 參數取 Expression 參數的值且 Mode 參數設置為一個是 r 的值。只要流保留打開且 Expression 參數求得同一個字元串,則對 getline 函數的每次後續調用讀取另一個記錄。如果未指定 Variable 參數,則 $0 記錄變數和 NF 特殊變數設置為從流讀取的記錄。
getline [ Variable ] < Expression 從 Expression 參數指定的文件讀取輸入的下一個記錄,並將 Variable 參數指定的變數設置為該記錄的值。只要流保留打開且 Expression 參數對同一個字元串求值,則對 getline 函數的每次後續調用讀取另一個記錄。如果未指定 Variable 參數,則 $0 記錄變數和 NF 特殊變數設置為從流讀取的記錄。
getline [ Variable ] 將 Variable 參數指定的變數設置為從當前輸入文件讀取的下一個輸入記錄。如果未指定 Variable 參數,則 $0 記錄變數設置為該記錄的值,還將設置 NF、NR 和 FNR 特殊變數。
#打開外部文件(close用法)
awk 'BEGIN{while("cat /etc/passwd"|getline){print $0;};close("/etc/passwd");}'
輸出: root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin
#逐行讀取外部文件(getline使用方法)
awk 'BEGIN{while(getline < "/etc/passwd"){print $0;};close("/etc/passwd");}'
輸出:root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin
awk 'BEGIN{print "Enter your name:";getline name;print name;}'
Enter your name:
chengmo
chengmo
#調用外部應用程序(system使用方法) b返回值,是執行結果。
awk 'BEGIN{b=system("ls -al");print b;}'
輸出: total 42092 drwxr-xr-x 14 chengmo chengmo 4096 09-30 17:47 . drwxr-xr-x 95 root root 4096 10-08 14:01 ..
② Shell基本腳本命令使用教程
1、本地變數:用戶私有變數,只有本用戶可以訪問,保存在家目錄的 .bash_profile、.bashrc文件中
2、全局變數:所有用戶都可以使用,保存在 /etc/profile 文件中
3、用戶自定義變數:用戶自定義,比如腳本中的變數
定義變數格式: 變數名=值 (=兩邊不能有空格)
字元串用單引號或者雙引號引起來
shell支持正則表達式的常見命令:grep、sed、awk。
sed 是一個行(流)編輯器,非互動式的對文件內容進行增刪改查操作
awk 能夠集過濾、提取、運算為一體,它的工作方式是讀取數據,將每一行數據視為一條記錄,每條記錄以欄位分隔符分成若干欄位,然後輸出各個欄位的值。平行命令還有 gawk、pgawk、dgawk。
③ shell基礎應用(五)
一,正則表達式
w匹配數字、字母、下劃線
egrep "roow" user //找roo後面是數字、字母、下劃線的字元串
s 匹配空格、tab鍵
egrep "roos" user //找roo後面是1個空格或者tab鍵打出來的空格的字元串,如果沒有
就不輸出
二,sed其他指令
a行下追加 i行上添加 c替換整行
sed 'a 666' user //所有行的下面追加666
sed Ƈa 666' user //第1行的下面追加666
sed '/^bin/a 666' user //在以bin開頭的行的下面追加666
sed 'i 666' user //所有行的上面添加666
sed Ƌi 666' user //第5行的上面添加666
sed '$i 666' user //最後1行的上面添加666
sed 'c 666' user //所有行都替換成666
sed Ƈc 666' user //替換第1行為666
---------------------------------------------------------
三,awk
可以實現精確搜索並輸出 ,逐行處理
1,前置指令 | awk 選項 條件 指令
2,awk 選項 條件 指令 被處理文檔
選項 -F 定義分隔符
指令 print
條件 /字元串/
內置變數 $1第一列 $2第二列 $3第三列 ...
$0 所有列 NR行號 NF 列號
[root@proxy opt]# cat abc.txt //准備素材
hello the world
welcome to beijing
awk '{print}' abc.txt //輸出所有
awk '/to/{print}' abc.txt //輸出有to的那行
awk '{print $2}' abc.txt //輸出所有行的第2列
awk '/to/{print $1}' abc.txt //輸出有to的那行的第1列
awk '{print $0}' abc.txt //輸出所有行所有列
awk '{print $0,$1}' abc.txt //輸出所有行所有列和第1列
awk '{print NR}' abc.txt //輸出所有行的行號
awk '{print NR,$0}' abc.txt //輸出所有行的行號,所有列
awk '{print NR,NF}' abc.txt //輸出所有行的行號,列號(有幾列)
awk '/^bin/{print NR}' user //找以bin開頭的行,顯示該行的行號
awk '/^bin/{print NR,$0}' user //找以bin開頭的行,顯示該行的
行號,所有列
awk '{print NF}' user //輸出所有行的列號(每行有幾列)
awk -F: '{print $1}' user //文檔中如果沒有空格,可以用F修改分
隔符
awk -F: '{print $1,$6}' user //使用冒號作為列的分隔符,顯示
第1、6列
awk -F: '{print $1" 的家目錄是 "$6}' user //還可以輸出常量,加
雙引號即可
awk -F: '{print $1" 的解釋器是 "$7}' user
收集根分區剩餘容量
df -h | awk '//$/{print $4}' //使用df -h 作為前置指令交給awk處理
找到以/結尾的行,並輸出第4列
df -h | awk '//$/{print "根分區剩餘容量是"$4}' //然後加常量輸出
收集網卡流量信息
ifconfig eth0 | awk '/RX p/{print "eth0網卡接收的數量量是"$5}'
ifconfig eth0 | awk '/TX p/{print "eth0網卡發送的數量量是"$5}'
------------------------------------------------------------
四,awk的條件
1,/字元串/ 還可以使用正則 ~ 包含 !~不包含
awk -F: '$6~/root/{print}' user //輸出第6列包含root的行
awk -F: '$6~/bin/{print}' user //輸出第6列包含bin的行
awk -F: '$6!~/bin/{print}' user //輸出第6列不包含bin的行
2,使用數字或者字元串
== != > >= < <=
awk -F: '$3<3{print}' user //輸出第3列小於3的行
awk -F: '$3<=3{print}' user //輸出第3列小於等於3的行
awk -F: 'NR==2{print}' user //輸出第2行
awk -F: 'NR>2{print}' user //輸出行號大於2的行
3,邏輯組合 &&並且 ||或者
awk -F: 'NR==2||NR==4{print}' user //找行號是2或者4的行
awk -F: 'NR==2||NR==40{print}' user //如果只有一個條件滿足就顯示一個
awk -F: '$7~/bash/&&$3<=500{print}' user //找第7列包含bash並且第3列
小於等於500的行
awk 'NR==2&&NR==4{print}' user //找行號既是2又是4的行,不存在,無輸出
awk -F: '$7~/bash/&&NR<=3{print}' user //找第7列包含bash並且行號是1~3的
awk -F: '$7~/bash/||NR<=3{print}' user //找第7列包含bash或者行號是1~3的
awk -F: '$1~/root/' user //找第1列包含root的行
如果有用戶叫root6,也會搜到,比較寬松的搜索方式,如果
任務就是{print}的話可以省略不寫
awk -F: '$1=="root"' user //找第1列完全等於root的行
多一個字元少一個字元都不行,比較嚴格的搜索方式
4,運算
awk 'NR%2==0{print NR,$0}' user //在條件中使用運算
,找到將行號除以2餘數等於0的行,然後輸出該行的
行號和所有列,相當於輸出偶數行
-----------------------------------------------------
五,awk處理時機,可以執行額外任務
BEGIN任務 執行1次,讀取文檔之前執行
逐行任務 執行n次,讀取文檔時執行
END任務 執行1次,讀取文檔之後執行
BEGIN{ 任務1 }{ 任務2 }END{ 任務3 }
awk -F: 'BEGIN{print "ok"}{print $1}END{print "ok"}' user
awk 'BEGIN{print NR}{print NR}END{print NR}' user
利用awk處理時機,輸出下列內容
awk 'BEGIN{print "User UID Home"}' //第1步輸出表頭信息
awk -F: '{print $1" "$3" "$6}' user //第2步輸出內容
awk 'END{print "總計"NR"行" }' user //第3步輸出結尾
awk -F: 'BEGIN{print "User UID Home"}{print $1" "$3" "$6}END{print "總計"NR"行"}' user //合在一起寫
---------------------------------------------------------------------------
使用awk統計網站訪問量
setenforce 0 //關閉selinux
systemctl stop firewalld //關閉防火牆
systemctl restart httpd //開啟網站服務
使用瀏覽器多訪問幾次網站,包括本機用curl
curl 192.168.4.7:82 //如果埠沒改過就不用敲
awk '{print $1}' /var/log/httpd/access_log //初步統計,不完美
六,使用awk數組+for循環實現高級搜索
數組 相當於可以存儲多個值的特殊變數
數組名[下標]=下標對應的值
awk 'BEGIN{a[1]=10;a[2]=20;print a[2],a[1]}' //使用awk測試數組,首先
創建數組a,下標1對應值是10,下標2對應值是20,然後輸出下標是2與
下標是1的值
awk 'BEGIN{a["abc"]="abcabc";a["xyz"]="xyzxyz";print a["xyz"]}' //數組的下標
和值都可以不是數字,測試時加雙引號即可
以上信息是手工輸入,實際情況中通常是從文檔收集
准備一個文檔,裡面有6行,每行分別是abc、xyz、abc、opq、xyz、abc 然後
按照awk逐行處理的工作特點使用awk '{a[$1]++}' shu.txt 走完每一行得到下列結果
但不會輸出到屏幕
a[$1]++ a[abc]++ a[abc]=1
a[$1]++ a[xyz]++ a[xyz]=1
a[$1]++ a[abc]++ a[abc]=2
a[$1]++ a[opq]++ a[opq]=1
a[$1]++ a[xyz]++ a[xyz]=2
a[$1]++ a[abc]++ a[abc]=3
如果要輸出到屏幕可以使用命令awk '{a[$1]++}END{print a[abc]}' shu.txt
----------------------
根據上述操作得知使用數組可以收集信息,但收集完了之後查看確不方便,可以用for循環實現。方法如下:
for(變數名 in 數組名){print 變數名} //這個格式可以查看數組的所有下標
awk '{a[$1]++}END{for(i in a){print i,a[i]}}' shu.txt //使用逐行任務與數組
收集文檔shu.txt中的信息,然後在END任務中使用for循環顯示所有
數組a的下標與值
awk '{ip[$1]++}END{for(i in ip){print i,ip[i]}}' /var/log/httpd/ac
cess_log //將上述的文件替換成網站的日誌,就可以
最終用來查看日誌得到可以得到哪個ip來訪以及來訪的次數
awk '{ip[$1]++}END{for(i in ip){print i,ip[i]}}' /var/log/httpd/ac
cess_log | sort -nr -k 2 //使用sort命令增加排序
功能,-n是以數字形式排序,-r是降序, -k是指定為
第幾列排序
----------------------------------------------------------------------------
/var/log/secure是安全日誌,如果有人登陸時輸入錯誤密碼的話
信息會記錄下來,這種信息可以用awk抓取出來,方法如下:
awk '/Failed password for root/{ip[$11]++}END{for(i in ip){print i,ip[i]}}'
/var/log/secure //統計安全日誌中訪問root賬戶密碼輸入錯誤
的ip地址與次數
-----------------------------------------------------------------------------
編寫腳本,可以查看系統的各種參數信息
#!/bin/bash
while :
do
clear
free -h | awk '/^Mem:/{print "剩餘內存容量是"$4}'
df -h | awk '//$/{print "根分區剩餘容量是"$4}'
awk 'END{print "用戶總數是"NR"個"}' /etc/passwd
who | awk 'END{print "登錄用戶數量是"NR"個"}'
uptime | awk '{print "cpu的15分鍾平均負載是"$NF}'
rpm -qa | awk 'END{print "安裝的軟體包數量是"NR"個"}'
sleep 3
done
④ awk 命令
AWK
command 讀前處理 行處理 讀後處理
1、讀前處理: BEGIN{awk_cmd1;awk_cmd2}
2、行處理:定址命令
定址方法:正則、變數、比較和關系運算
正則需要用//包圍起來
awk -F: '/root/{print}' gad
awk -F: '$1~/root/{print}' gad 第一列匹配
awk -F: '$1~/<root>/{print}' gad 第一列匹配,鎖定字元串匹配
awk -F: '$1!~/root/{print}' gad
. 除了換行符以外的任意單個字元
[] 字元組內的任一字元
[^]對字元組內的每個字元取反(不匹配字元組內的每個字元)
[ ] 非字元組內的字元開頭的行
3、讀後處理END{awk_cmd1;awk_cmd2}
awk -F "" '{for(i=1;i<=NF;i++) print $i}' gad.txt 逐字換行
NF代表每行的元素個數
NR 表示AWK讀入的行數 (一共處理多少行,無論多少個文件)
FNR表示讀入行所在文件中的行數 (每個文件中有多少個文件)
1 1 AAAA
2 2 aaaa
3 3 a
4 1 bb
5 2 bbbbbbbb
賦值 = ++ -- += 。。。
awk 'BEGIN{a=1;print a++;print a}' 先執行命令然後a+1
|| 邏輯或 && 邏輯與 ! 取反
匹配正則或不匹配,正則需要用/正則/ 包圍住
~ !~
關系比較字元串時要把字元串用雙引號引起來
< <= > >= != ==
轉義序列
自身 $ 轉義$ 製表符 退格符
回車符
換行符 c 取消換行
-v可以借用此方式從shell變數中引入
a=root
awk -v var=$a -F':' '$1==var{print $1}' passwd
a= whoami ; awk -v var=$a -F':' '$1==var{print $3,$6}' /etc/passwd
FS 定義欄位分隔符,默認為一個空格
OFS 輸出的欄位分隔符,默認為一個空格
root-0-root
bin-1-bin
root@@0##root
bin@@1##bin
RS 記錄分隔符,默認為一個換行符
head -2 /etc/passwd | awk 'BEGIN{ RS=":"}{print}' 把:號換成了換行符
ORS 輸出的記錄分隔符,默認為一個換行符
head -2 /etc/passwd | awk 'BEGIN{ ORS="-"}{print}' 把換行符換成了 - 號
FILENAME 文件名
ARGC 命令行參數個數
ARGV 命令行參數排列
ENVIRON 輸出系統環境變數
root
⑤ python,awk,shell格式化輸出內容全解
話不多說,直接開始
eg:
echo "Linux" | awk '{printf "|%-15s|\n",$1}'
|Linux |
說明:對於echo命令的輸出,Linux是經管道發給awk。printf函數包含一個控制串。百分號讓printf做好准備,它要列印一個佔15個格、向左對齊的字元串,這個字元串夾在兩個豎杠之間,並且以換行符結尾。百分號後的短劃線表示左對齊。控制串後面跟了一個逗號和$1。printf將根據控制串中的格式說明來格式化字元串Linux。
echo "Linux" | awk '{printf "|%15s|\n",$1}'
| Linux|
說明:字元串Linux被列印成一個佔15 格、向右對齊的字元串,夾在兩個豎杠之間,以
換行符結尾。
cat employees
Tom Jones 4424 5/12/66 543354
Mary Adams 5346 11/4/63 28765
Sally Chang 1654 7/22/54 650000
Billy Black 1683 9/23/44 336500
awk '{printf "The name is: %-15s ID is %8d\n", 3}' employees
The name is Tom ID is 4424
The name is Mary ID is 5346
The name is Sally ID is 1654
The name is Billy ID is 1683
說明:要列印的字元串放置在兩個雙引號之間。第一個格式說明符是%-15s,它對應的參數是$1,緊挨著控制串的右半邊引號後面的那個逗號。百分號引出格式說明:短劃線表示左對齊,15s表示佔15格的字元串。這條命令用來列印一個左對齊、佔15格的字元串,後面跟著字元串的ID和一個整數。
echo -e識別轉義和特殊意義的符號,如換行符、n、製表符\t、轉義符\等。
[root@xuexi tmp]# echo 'Hello World!\n';echo "Hello World"!
Hello World!\n
Hello World!
[root@xuexi tmp]# echo -e 'Hello World!\n';echo "Hello World"!
Hello World!
Hello World!
printf "%-10s %-8s %-4s\n" 姓名 性別 體重kg
printf "%-10s %-8s %-4.2f\n" 郭靖 男 66.1234
printf "%-10s %-8s %-4.2f\n" 楊過 男 48.6543
printf "%-10s %-8s %-4.2f\n" 郭芙 女 47.9876
運行
姓名 性別 體重kg
郭靖 男 66.12
楊過 男 48.65
郭芙 女 47.99
%s %c %d %f都是格式替代符
%-10s 指一個寬度為10個字元(-表示左對齊,沒有則表示右對齊),任何字元都會被顯示在10個字元寬的字元內,如果不足則自動以空格填充,超過也會將內容全部顯示出來。
%-4.2f 指格式化為小數,其中.2指保留2位小數。
eg:
printf "%d %s\n" 1 "abc"
printf %s abcdef
printf %s abc def
printf "%s %s %s\n" a b c d e f g h i j
等等等等
希望大家了解一下
⑥ shell中,awk命令的$0是什麼意思
awk默認是以行為單位處理文本的,對1.txt中的每一行都執行後面
"{
}"
中的語句。
awk中的兩個術語:
記錄(默認就是文本的每一行)
欄位
(默認就是每個記錄中由空格或TAB分隔的字元串)
$0就表示一個記錄,$1表示記錄中的第一個欄位。
一般
print
$0
就是列印整行內容($0前面不需要
反斜杠
),print
$1表示只列印每行第一個欄位。
⑦ shell中,awk命令的$0是什麼意思
shell命令awk '{print $0}' 1.txt 的意思是輸出1.txt文件的所有內容。
shell命令awk '{print $1}' 1.txt的意思是輸出1.txt文件的第一列內容。
Shell是系統的用戶界面,提供了用戶與內核進行交互操作的一種介面。它接收用戶輸入的命令並把它送入內核去執行。
實際上Shell是一個命令解釋器,它解釋由用戶輸入的命令並且把它們送到內核。不僅如此,Shell有自己的編程語言用於對命令的編輯,它允許用戶編寫由shell命令組成的程序。Shell編程語言具有普通編程語言的很多特點,比如它也有循環結構和分支控制結構等,用這種編程語言編寫的Shell程序與其他應用程序具有同樣的效果。
(7)awkshell命令擴展閱讀:
shell的種類:
Linux中的shell有多種類型,其中最常用的幾種是Bourne shell(sh)、C shell(csh)和Korn shell(ksh)。
1、Bourne shell是UNⅨ最初使用的shell,並且在每種UNⅨ上都可以使用。Bourne shell在shell編程方面相當優秀,但在處理與用戶的交互方面做得不如其他幾種shell。
Linux操作系統預設的shell是Bourne Again shell,它是Bourne shell的擴展,簡稱Bash,與Bourne shell完全向後兼容,並且在Bourne shell的基礎上增加、增強了很多特性。
Bash放在/bin/bash中,它有許多特色,可以提供如命令補全、命令編輯和命令歷史表等功能,它還包含了很多C shell和Korn shell中的優點,有靈活和強大的編程介面,同時又有很友好的用戶界面。
2、C shell是一種比Bourne shell更適於編程的shell,它的語法與C語言很相似。Linux為喜歡使用C shell的人提供了Tcsh。Tcsh是C shell的一個擴展版本。Tcsh包括命令行編輯、可編程單詞補全、拼寫校正、歷史命令替換、作業控制和類似C語言的語法,它不僅和Bash shell是提示符兼容,而且還提供比Bash shell更多的提示符參數。
3、Korn shell集合了C shell和Bourne shell的優點並且和Bourne shell完全兼容。Linux系統提供了pdksh(ksh的擴展),它支持任務控制,可以在命令行上掛起、後台執行、喚醒或終止程序。
參考資料來源:網路-Linux Shell
⑧ shell中最強大,實用的命令awk
awk是一個文本處理工具,通常用於處理數據並生成結果報告
語法格式
第一種形式
語法格式解釋
BEGIN正式處理數據之前
pattern匹配模式
{commands}匹配命令,可能多行
END處理完所有匹配數據後執行
第二種形式
內置變數含義
$0整行內容
n當前行的第1-n個欄位(按照指定分隔符分割後)
NF(Number Field)當前行的欄位個數,也就是多少列
NR(Number Row)當前行的行號,從1開始計數
FNR(File Number Row)多文件處理時,每個文件行號單獨計數,都是從0開始
FS(Field Separator)輸入欄位分割符。不指定默認以空格或者Tab鍵分割
RS(Row Separator)輸入行分割符。默認回車\n
OFS(Output Field Sepatator)輸出欄位分割符。默認為空格
ORS(Output Row)輸出行分隔符。默認為回車
FILENAME當前輸入的文件名字
ARGC命令行參數個數
ARGV命令行參數數組
需要指定分隔符:
不需要指定分割符,默認空格,tab鍵,多個也可以分隔(如一個空格+一個tab鍵)
show.txt文件內容如下
輸出如下:
輸出如下
可以用這個輸出每一行的最後一列的值
輸出如下(沒有混合使用,例子比較簡單)
show.txt的文件內容如下
先輸出每一行數據
輸入如下
輸出每一行的第二列
輸出如下
在上面基礎上指定行分隔符
輸出如下
再次指定列分隔符
輸出如下
show.txt的文件內容如下
輸入如下,因為是對行進行處理,所以有幾行,輸出幾次文件名
jps -l輸入如下,運行的服務如下
想關閉mbase-spider-1.0.jar這個jar包的服務,可以寫一個如下腳本,非常方便,更高階用法另開一篇文章好好寫寫
⑨ awk命令詳解是什麼
awk命令是linux下的一個文件管理命令,具體語法格式為awk [參數] [文件],通常是用於文本和數據進行處理的編程語言,awk命令主要有兩個功能;awk命令可以在linux/unix下對文本和數據進行處理;awk命令支持用戶自定義函數和動態正則表達式。
相關介紹:
AWK是一種優良的文本處理工具。它不僅是Linux中也是任何環境中現有的功能最強大的數據處理引擎之一。這種編程及數據操作語言(其名稱得自於它的創始人AlfredAho、PeterWeinberger和BrianKernighan姓氏的首個字母)的最大功能取決於一個人所擁有的知識。
AWK提供了極其強大的功能:可以進行樣式裝入、流控制、數學運算符、進程式控制制語句甚至於內置的變數和函數。它具備了一個完整的語言所應具有的幾乎所有精美特性。
實際上AWK的確擁有自己的語言:AWK程序設計語言,三位創建者已將它正式定義為「樣式掃描和處理語言」。它允許您創建簡短的程序,這些程序讀取輸入文件、為數據排序、處理數據、對輸入執行計算以及生成報表,還有無數其他的功能。
最簡單地說,AWK是一種用於處理文本的編程語言工具。AWK在很多方面類似於shell編程語言,盡管AWK具有完全屬於其本身的語法。它的設計思想來源於SNOBOL4、sed、MarcRochkind設計的有效性語言、語言工具yacc和lex,當然還從C語言中獲取了一些優秀的思想。
在最初創造AWK時,其目的是用於文本處理,並且這種語言的基礎是,只要在輸入數據中有模式匹配,就執行一系列指令。
⑩ shell腳本中awk命令內置參數與腳本參數沖突,如何使用內置參數
題主你好,
先聲明一下,我的腳本不是太好,供參考.
首先IFS不是awk的內置變數, 而是shell內置變數.
另外awk內部的變數和awk外部語句的變數是兩套機制,也就是說假設有個變數a=1,你使用awk '{print a}' 並不會輸出1 //當然我的awk語句寫的不完整,只是為了表達意思.
你想要在awk中使用外部變數,要使用-v參數或是在最後追加參數的方式將想要使用的變數導到awk空間中, 才能使用,也就是說:
awk -v var="$a" '{print var}' 文件名 //此時你可以使用變數var間接輸出變數a的值.
或者寫為:
awk '{print var}' var="$a"文件名
====
寫在最後: 因為我的腳本不太好,所以調試信息也看不大明白,不過感覺應該不難,題主可以舉一個簡單具體一點的例子說明一下你想執行哪條語句,輸出什麼結果,我幫你看一下.