awk高級源碼_linux awk命令

A. 請問linux下的系統命令是不是開源的比如sort，awk等等，如果是的話，在哪可以找到源代碼

Linux是開源的，它自帶的功能強大的命令也是開源的，也就是說，我們可以獲得這些命令的源代碼並研究它。那究竟如何獲得系統的命令的源代碼呢？
命令的源代碼是一個軟體包為單元的，放在一個軟體包的源代碼中，若要下載一個命令的源代碼，就要把這個命令所屬的軟體包的源代碼都下載下來。命令的源代碼就在下載的源代碼的相關目錄內，通常是src目錄，相應的主文件名為cmd.c，其中cmd為具體的命令，如ls命令的主程序文件為ls.c。可查閱「Linux命令大全」了解Linux命令。

B. linux awk命令

一、awk是一個強大的文本分析工具，相對於grep的查找，sed的編輯，awk在其對數據分析並生成報告時，顯得尤為強大。簡單來說awk就是把文件逐行的讀入，以空格為默認分隔符將每行切片，切開的部分再進行各種分析處理。

二. awk命令格式和選項
2.1 awk的語法有兩種形式
1. 命令行方式
awk [-F field-separator] 'commands' input-file(s)
其中，commands是真正awk命令，[-F域分隔符]是可選的。input-file(s)是待處理的文件。
在awk中，文件的每一行中，由域分隔符分開的每一項稱為一個域。通常，在不指名-F域分隔符的情況下，默認的域分隔符是空格。
2. 將所有的awk命令插入一個單獨文件，然後調用:
awk -f awk-script-file input-file(s)
其中，-f選項載入awk-script-file中的awk腳本，input-file(s)跟上面的是一樣的。
2.2 命令選項
（1）-F fs or --field-separator fs ：指定輸入文件折分隔符，fs是一個字元串或者是一個正則表達式，如-F:。
（2）-v var=value or --asign var=value ：賦值一個用戶定義變數。
（3）-f scripfile or --file scriptfile ：從腳本文件中讀取awk命令。
（4）-mf nnn and -mr nnn ：對nnn值設置內在限制，-mf選項限制分配給nnn的最大塊數目；-mr選項限制記錄的最大數目。這兩個功能是Bell實驗室版awk的擴展功能，在標准awk中不適用。
（5）-W compact or --compat, -W traditional or --traditional ：在兼容模式下運行awk。所以gawk的行為和標準的awk完全一樣，所有的awk擴展都被忽略。
（6）-W left or --left, -W right or --right ：列印簡短的版權信息。
（7）-W help or --help, -W usage or --usage ：列印全部awk選項和每個選項的簡短說明。
（8）-W lint or --lint ：列印不能向傳統unix平台移植的結構的警告。
（9）-W lint-old or --lint-old ：列印關於不能向傳統unix平台移植的結構的警告。
（10）-W posix ：打開兼容模式。但有以下限制，不識別：/x、函數關鍵字、func、換碼序列以及當fs是一個空格時，將新行作為一個域分隔符；操作符**和**=不能代替^和^=；fflush無效。
（11）-W re-interval or --re-inerval ：允許間隔正則表達式的使用，參考(grep中的Posix字元類)，如括弧表達式[[:alpha:]]。
（12）-W source program-text or --source program-text ：使用program-text作為源代碼，可與-f命令混用。
（13）-W version or --version ：列印bug報告信息的版本。
三. 使用方法
#awk '{pattern + action}' {filenames}
盡管操作可能會很復雜，但語法總是這樣，其中 pattern 表示 AWK 在數據中查找的內容，而 action 是在找到匹配內容時所執行的一系列命令。花括弧（{}）不需要在程序中始終出現，但它們用於根據特定的模式對一系列指令進行分組。 pattern就是要表示的正則表達式，用斜杠括起來。
awk語言的最基本功能是在文件或者字元串中基於指定規則瀏覽和抽取信息，awk抽取信息後，才能進行其他文本操作。完整的awk腳本通常用來格式化文本文件中的信息。
通常，awk是以文件的一行為處理單位的。awk每接收文件的一行，然後執行相應的命令，來處理文本。
四. 模式和操作
awk腳本是由模式和操作組成的：
pattern {action} 如$ awk '/root/' test，或$ awk '$3 < 100' test。
兩者是可選的，如果沒有模式，則action應用到全部記錄，如果沒有action，則輸出匹配全部記錄。默認情況下，每一個輸入行都是一條記錄，但用戶可通過RS變數指定不同的分隔符進行分隔。
4.1. 模式
模式可以是以下任意一個：
（1）正則表達式：使用通配符的擴展集。
（2）關系表達式：可以用下面運算符表中的關系運算符進行操作，可以是字元（3）串或數字的比較，如$2>%1選擇第二個欄位比第一個欄位長的行。
（4）模式匹配表達式：用運算符~(匹配)和~!(不匹配)。
（5）模式，模式：指定一個行的范圍。該語法不能包括BEGIN和END模式。
（6）BEGIN：讓用戶指定在第一條輸入記錄被處理之前所發生的動作，通常可在這里設置全局變數。
（7）END：讓用戶在最後一條輸入記錄被讀取之後發生的動作。
4.2. 操作
操作由一人或多個命令、函數、表達式組成，之間由換行符或分號隔開，並位於大括弧內。主要有四部份：
（1）變數或數組賦值
（2）輸出命令
（3）內置函數
（4）控制流命令

五. awk的環境變數

七. 記錄和域
7.1. 記錄
awk把每一個以換行符結束的行稱為一個記錄。
記錄分隔符：默認的輸入和輸出的分隔符都是回車，保存在內建變數ORS和RS中。
$0變數：它指的是整條記錄。如$ awk '{print $0}' test將輸出test文件中的所有記錄。
變數NR：一個計數器，每處理完一條記錄，NR的值就增加1。
如$ awk '{print NR,$0}' test將輸出test文件中所有記錄，並在記錄前顯示記錄號。
7.2. 域
記錄中每個單詞稱做「域」，默認情況下以空格或tab分隔。awk可跟蹤域的個數，並在內建變數NF中保存該值。如$ awk '{print $1,$3}' test將列印test文件中第一和第三個以空格分開的列(域)。
7.3. 域分隔符
內建變數FS保存輸入域分隔符的值，默認是空格或tab。我們可以通過-F命令行選項修改FS的值。如$ awk -F: '{print $1,$5}' test將列印以冒號為分隔符的第一，第五列的內容。
可以同時使用多個域分隔符，這時應該把分隔符寫成放到方括弧中，如$awk -F'[:/t]' '{print $1,$3}' test，表示以空格、冒號和tab作為分隔符。
輸出域的分隔符默認是一個空格，保存在OFS中。如$ awk -F: '{print $1,$5}' test，$1和$5間的逗號就是OFS的值。
八. 匹配操作符(~)
用來在記錄或者域內匹配正則表達式。如$ awk '$1 ~/^root/' test將顯示test文件第一列中以root開頭的行。
九. 比較表達式
conditional expression1 ? expression2: expression3，
例如：
$ awk '{max = {$1 > $3} ? $1: $3: print max}' test。如果第一個域大於第三個域，$1就賦值給max，否則$3就賦值給max。
$ awk '$1 + $2 < 100' test。如果第一和第二個域相加大於100，則列印這些行。
$ awk '$1 > 5 && $2 < 10' test,如果第一個域大於5，並且第二個域小於10，則列印這些行。
十. 范圍模板
范圍模板匹配從第一個模板的第一次出現到第二個模板的第一次出現之間所有行。如果有一個模板沒出現，則匹配到開頭或末尾。如$ awk '/root/,/mysql/' test將顯示root第一次出現到mysql第一次出現之間的所有行。

C. 代碼語言有哪些

編程語言現在都有哪些？
機器語言：純做雀岩粹的機器代碼

匯編語言：8086匯編、Win32匯編、.NET的匯編

高級語言：

Basic、Pascal、Object Pascal、C、C++、C#、java、ASP、ASP.NET、Perl、PHP、SQL、FoRTRAN 等等

Visual Basic、Visual Basic.NET、Delphi、Visual C++、C++ Builder、C# Builder、Visual Foxpro 等
代碼是什麼
代碼（Source code），也稱源程序，是指一系列人類可讀的計算機語言指令。在現代程序語言中，源代碼可以是以書籍或者磁帶的形式出現，但最為常用的格式是文本文件，這種典型純御格式的目的是為了編譯出計算機程序。計算機源代碼的最終目的是將人類可讀的文本翻譯成為計算機可以執行的二進制指令，這種過程叫做編譯，通過編譯器完成。
說明語言有哪些？
腳本語言

腳本語言（Script language，scripting language，scripting programming language）是為了縮短傳統的編寫-編譯-鏈接-運行（edit-pile-link-run）過程而創建的計算機編程語言。此命名起源於一個腳本「screenplay」，每次運行都會使對話框逐字重復。

機器語言

由於計算機內部只能接受二進制代碼，因此，用二進制代碼0和1描述的指令稱為機器指令，全部機器指令的 *** 構成計算機的機器語言，用機器語言編程的程序稱為目標程序。只有目標程序才能被計算機直接識別和執行。但是機器語言編寫的程序無明顯特徵，難以記憶，不便閱讀和書寫，且依賴於具體機種，局限性很大，機器語言屬於低級語言。

高級語言

高級語言是大多數編程者的選擇。和匯編語言相比，它不但將許多相關的機器指令合成為單條指令，並且去掉了與具體操作有關但與完成工作無關的細節，例如使用堆棧、寄存器等，這樣就大大簡化了程序中的指令。同時，由於省略了很多細節，編程者也就不需要有太多的專業知識。

高級語言主要是相對於匯編語言而言，它並不是特指某一種具體的語言，而是包括了很多編程語言，像最簡單的編程語言PASCAL語言也屬於高級語言。

高級語言所編制的程序不能直接被計算機識別，必須經過轉換才能被執行，按轉換方式可將它們分為兩類：

解釋類：執行方式類似於我們日常生活中的「歲悶同聲翻譯」，應用程序源代碼一邊由相應語言的解釋器「翻譯」成目標代碼（機器語言），一邊執行，因此效率比較低，而且不能生成可獨立執行的可執行文件，應用程序不能脫離其解釋器，但這種方式比較靈活，可以動態地調整、修改應用程序。如較早時期的Qbasic語言。

編譯類：編譯是指在應用源程序執行之前，就將程序源代碼「翻譯」成目標代碼（機器語言），因此其目標程序可以脫離其語言環境獨立執行，使用比較方便、效率較高。但應用程序一旦需要修改，必須先修改源代碼，再重新編譯生成新的目標文件（* .obj，也就是OBJ文件）才能執行，只有目標文件而沒有源代碼，修改很不方便。
編寫程序的語言有哪些？
你這問題也太大了……摘抄網路

常見的程序設計語言

ActionScript

APL、A＋和J

Ada

匯編語言

AWK

Basic、Fortran

VBScript

Brain ***

C、C++

C＃

Clipper

COBOL

dBase

PASCAL、Delphi

Forth

FoxPro

F＃

Fava

IDL

Java

JavaScript

J#

LISP

Lua

LOGO

Mola

Nuva

Perl

PHP

PL/I

Prolog

Python

R

Ruby

Scheme

Smalltalk

SQL

Tcl/Tk

Visual Basic

Visual FoxPro

XML

概念什麼的……語言也就是分低級語言，高級語言，這個界限是很模糊的，越容易被機器理解的語言就是越低級的語言（機器語言只有0和1），越容易被人理解的語言就是越高級的語言，當然不學是什麼都理解不了的……

然後在高級語言的范疇當中，又分為面向過程的語言（最大眾化的C語言），這些語言是需要描述執行的過程按順序編寫，還有另外一種面向對象的語言（比如說JAVA），這類語言把一切事物看成是一個對象，描述這個對象和它能夠產生的動作，這樣就可以靈活的安排程序順序。另外面向過程的一個重大的缺點就是修改起來麻煩，牽一發而動全身，面向對象的程序在修改的時候只需要修改部分內容就可以起到效果。（這有點像活字印刷對普通印刷……）其他比較的東西太多了……

這些編程思想都是不斷更新的，也不斷誘人在設計新的語言，同樣你也可以設計語言，但是幾乎每一門語言基本都會遵循以上的規律，目前更新的編程思想還沒有實際應用。
計算機語言有哪些
計算機語言的種類非常的多，總的來說可以分成機器語言、匯編語言、高級語言三大類。機器語言和匯編語言是面向機器的低級語言。當計算機語言發展到第三代時，就進入了「面向人類」的語言階段，被人們稱之為「高級語言」。

機器語言

是用二進制代碼表示的計算機（CPU）能直接識別和執行的一種機器指令的 *** ，具有靈活、直接執行和速度快等特點。

用機器語言編寫程序，編程人員要首先熟記所用計算機的全部指令代碼和代碼的涵義（編出的程序全是些0和1的指令代碼）。

不同廠商生產的計算機，其指令代碼不一樣，一台計算機可能有成百上千條指令。?

匯編語言

是面向機器的程序設計語言，是利用計算機所有硬體特性並能直接控制硬體的低級語言。

匯編語言的實質和機器語言是相同的，都是直接對硬體操作，只不過指令採用了英文縮寫的標識符（指令助記符）。

使用匯編語言編寫的源代碼，需要通過使用相應的匯編程序將它們轉換成可執行的機器代碼。這一過程被稱為匯編過程。

匯編語言通常被應用在底層硬體操作和高要求的程序優化的場合。驅動程序、嵌入式操作系統和實時運行程序都需要匯編語言。

高級語言

目前通用的編程語言有匯編語言和高級語言兩種形式，高級語言是目前絕大多數編程者的選擇。

高級語言較接近自然語言的語法和數學公式的結構，是一種貼近於人們使用習慣的程序設計語言。

高級語言源程序可以用解釋、編譯兩種方式執行，通常用後一種。

高級語言包括很多編程語言，如目前流行的C，C++，BASIC、COBOL、Pascal，Python，Lisp，Prolog，FoxPro，Delphi，VC，易語言（其中C/C++屬於中低級語言）等等，這些語言的語法、命令格式都不相同。

在過去的幾十年間，大量的編程語言被發明、被取代、被修改或組合在一起。之所以有那麼多種不同的編程語言存在的原因是，編寫程序的初衷其實也各不相同。有許多用於特殊用途的語言，只在特殊情況下使用。
HTML語言代碼程序以什麼開頭？
<./html>其實很簡單，我們來分析一下上面的代碼，首先，要寫一個網頁文件，那麼，網頁文件的一般類型就是 html文件。那麼，我們就先寫一個。注意，必須是成對出現的，後面一個多一個「/」。然後，我們所要寫的其他東西就要在 ....與.... 的中間，因為是一個網頁的整體部分！接下來就就更簡單了，我們在可以想像整個網頁整體為一個人！是人就必須有頭是不？於是就有了head，呵呵，就是頭啦，看代碼: 有了頭就要有眼睛啊，我們可以把網頁的標題看做是眼睛，title。那麼，眼睛長在哪呢?當然是在頭上了，於是：網頁標題頭有了，眼睛有了，還缺一個身體，body。身體在頭的下面在對！於是: 網頁標題這就是html語言的基本格式！網頁的所有內容基本上都在中！！！
現在網頁設計一般都用哪些語言啊?
網頁本身的HTML語言是非常簡單的描述語言，甚至可以不叫做語言，一看就會

如果要讓網頁有一些動態效果，你可能需要學習JavaScript和CSS等東西

如果希望整個網站的內容都是變化的，不同的人打開有不同的內容，甚至不同時間也不同，那你需川學習ASP、PHP、JSP或者CGI之中的一種
編程有幾種語言?語言是作用不同還是代碼概念不同?
VB、VC、FoxPro、Delphi這都是目前比較流行的… 如果你學編程是為了做游戲外掛或用於黑客建議你使用易語言
計算機語言都包括什麼語言？及其各個應用領域？
1、web page script languages

就是網頁代碼，比如Html、javascript、Css、Asp、Php、Xml都應該屬於此類（照蔡的意思，Html不應該屬於anguages的，可能他覺得太簡單了吧，不過我覺得Html也應該算的，大家愛聽誰的就聽誰的好了，這個不重要）

2、Interpreted Languages（解釋型語言）

包括Perl、Python、REBOL、Ruby等（後面三個聽豆沒聽過），也常被稱作Script語言，通常被用於和底下的操作系統溝通。照蔡的意思，每個人至少應該學會一套這類的語言。這類語言的缺點是效率差、源代碼外露——所以不適合用來開發軟體產品，一般用於網頁伺服器。

3、Hybrid Laguages（混合型語言）

代表是JAVA和C#。介於解釋型和編譯型之間。蔡認為C#是.NET最重要的語言，值得期待其後續發展；至於JAVA，蔡叫看他的《Sleepless in Java》——我倒！

4、PILING Languages（編譯型語言）

C/C++，JAVA都是編譯型語言。蔡說C++很復雜，要成為高手沒三五年是不行的（就憑這句話，我決定向JAVA投降），雖然如此，但真正要成為高手的都應該懂C/C++。

關於Delphi，蔡說如果想要跨Linux和Windows平台的語言，則Delphi似乎是最好的選擇。

5、Assembly Languages（匯編語言）

匯編語言是最接近於硬體的語言，不過現在幾乎沒多少人用了。

程序語言學習順序建議

如果完全沒有程序經驗，可照這個順序：javascript——解釋型語言——混合型語言——編譯型語言——匯編（如果需要的話）

用業界流行一句話做結尾「真正的程序員用C++,聰明的程序員用Delphi」，那麼，什麼樣的程序員用JAVA呢？

虛懷若谷題外話

看在我這么晚了還這么辛苦的敲字的面子上，看到這篇帖子的朋友給點掌聲吧，雖然沒什麼自己的思想。

另外，本文完全據蔡學鏞先生同名文章精簡，所以如果這篇文章給你的程序員生涯有什麼不好的作用，那我不介意你去扁他。當然如果這篇文章對你有什麼積極影響，我很高興你能請我吃大餐。

如果您想學習編程，卻又不知從何入手，那麼您不妨看看下面的幾種學習方案，可能會給您一些啟示吧！

方案一Basic語言 & Visual Basic

優點

（1）Basic 簡單易學，很容易上手。

（2）Visual Basic 提供了強大的可視化編程能力，可以讓你輕松地做出漂亮的程序。

（3）眾多的控制項讓編程變得象壘積木一樣簡單。

（4）Visual Basic 的全部漢化讓我們這些見了English就頭大的人喜不自禁。

缺點

（1）Visual Basic 不是真正的面向對象的開發文具。

（2）Visual Basic 的數據類型太少，而且不支持指針，這使得它的表達能力很有限。

（3）Visual Basic 不是真正的編譯型語言，它產生的最終代碼不是可執行的，是一種偽代碼。它需要一個動態鏈接庫去解釋執行，這使得Visual Basic 的編譯速度大大變慢。

綜述：方案一適合初涉編程的朋友，它對學習者的要求不高，幾乎每個人都可以在一個比較短的時間里學會vB編程，並用VB......

D. 淺談如何學習linux（強烈推薦）

隨著互聯網的迅猛發展，Linux得到了廣發的應用，目前市場是百分之八十伺服器端都在使用Linux操作系統，小至私人企業，大至世界百強企業，均有Linux操作系統使用者，因此，Linux就業前景很不錯，很多人想學習Linux，那麼Linux好學嗎？一般多長時間能學會？
Linux的學習說難不難，說容易也不容易，這就要看你是否掌握了合適的學習資源和方法，以及持之以恆的學習精神，如果這些都具備了，恭喜你，Linux運維工程師的大門已經向你敞開了！
對於想學好Linux的人員，可以參考一下大綱進行學習：
第一階段：linux基礎入門
Linux基礎入門主要包括： Linux硬體基礎、Linux發展歷史、Linux系統安裝、xshell連接、xshell優化、SSH遠程連接故障問題排查、L inux基礎優化、Linux目錄結構知識、Linux文件屬性、Linux通配符、正則表達式、Linux系統許可權等
第二階段：linux系統管理進階
linux系統管理進階包括：Linux定時任務、Linux用戶管理、Linux磁碟與文件系統、Linux三劍客之sed命令等。
第三階段：Linux Shell基礎
Linux Shell基礎包括：Shell編程基礎、Linux三劍客之awk命令等。
第四階段：Linux網路基礎
第五階段：Linux網路服務
Linux網路服務包括：集群實戰架構開始及環境准備、rsync數據同步服務、Linux全網備份項目、nfs網路存儲服務精講、inotify/sersync實時數據同步/nfs存儲實時備份項目等。
第六階段：Linux重要網路服務
Linux重要網路服務包括：http協議/www服務基礎、nginx web介紹及基礎實踐、nginx web、lnmp環境部署/資料庫異機遷移/共享數據異機遷移到NFS系統、nginx負載均衡、keepalived高可用等。
第七階段：Ansible自動化運維與Zabbix監控
Ansible自動化運維與Zabbix監控包括： SSH服務秘鑰認證、ansible批量自動化管理集群、 zabbix監控等。
第九階段：大規模集群高可用服務(Lvs、Keepalived)
第十階段：Java Tomcat服務及防火牆Iptables
第十一階段：MySQL DBA高級應用實踐
MySQL DBA高級應用實踐包括：MySQL資料庫入門基礎命令、MySQL資料庫進階備份恢復、MySQL資料庫深入事務引擎、MySQL資料庫優化SQL語句優化、MySQL資料庫集群主從復制/讀寫分離、MySQL資料庫高可用/mha/keepalved等。
第十二階段：高性能資料庫Redis和Memcached課程
第十三階段：Linux大規模集群架構構建（200台）
第十四階段：Linux Shell編程企業案例實戰
第十五階段：企業級代碼發布上線方案（SVN和Git）
第十六階段企業級Kvm虛擬化與OpenStack雲計算
第十七階段公有雲阿里雲8大組件構建集群實戰
第十八階段：Docker技術企業應用實踐
第十九階段：Python自動化入門及進階
第二十階段：職業規劃與高薪就業指導

E. shell awk命令詳解

awk命令
awk是一種編程語言，用於在linux/unix下對文本和數據進行處理。數據可以來自標准輸入(stdin)、一個或多個文件，或其它命令的輸出。它支持用戶自定義函數和動態正則表達式等先進功能，是linux/unix下的一個強大編程工具。它在命令行中使用，但更多是作為腳本來使用。awk有很多內建的功能，比如數組、函數等，這是它和C語言的相同之處，靈活性是awk最大的優勢。

awk命令格式和選項
語法格式
awk [options] 'script' var=value file(s)
awk [options] -f scriptfile var=value file(s)
常用命令選項
-F fs fs 指定輸入分隔符，fs可以時字元串或正則表達式

-v var=value 賦值一個用戶定義變數，將外部變數傳遞給awk

-f scriptfile 從腳本文件中讀取awk命令

awk腳本
awk腳本是由模式和操作組成的。

模式與操作
模式
模式可以是以下任意一種：

正則表達式：使用通配符的擴展集

關系表達式：使用運算符進行操作，可以是字元串或數字的比較測試

模式匹配表達式：用運算符～（匹配）和~!不匹配

BEGIN 語句塊， pattern語句塊， END語句塊

操作
操作由一個或多個命令、函數、表達式組成，之間由換行符或分號隔開，並位於大刮號內，主要部分是：變數或數組賦值、輸出命令、內置函數、控制流語句。

awk腳本基本格式
awk 'BEGIN{ commands } pattern{ commands } END{ commands }' file
一個awk腳本通常由BEGIN，通用語句塊，END語句塊組成，三部分都是可選的。腳本通常是被單引號或雙引號包住。

awk 'BEGIN{ i=0 } { i++ } END{ print i }' filename
awk "BEGIN{ i=0 } { i++ } END{ print i }" filename
awk執行過程分析
第一步：執行BEGIN { commands } pattern 語句塊中的語句

BEGIN語句塊：在awk開始從輸入輸出流中讀取行之前執行，在BEGIN語句塊中執行如變數初始化，列印輸出表頭等操作。

第二步：從文件或標准輸入中讀取一行，然後執行pattern{ commands }語句塊。它逐行掃描文件，從第一行到最後一行重復這個過程，直到全部文件都被讀取完畢。

pattern語句塊：pattern語句塊中的通用命令是最重要的部分，它也是可選的。如果沒有提供pattern語句塊，則默認執行{ print }，即列印每一個讀取到的行。{ }類似一個循環體，會對文件中的每一行進行迭代，通常將變數初始化語句放在BEGIN語句塊中，將列印結果等語句放在END語句塊中。

第三步：當讀至輸入流末尾時，執行END { command }語句塊

END語句塊:在awk從輸入流中讀取完所有的行之後即被執行，比如列印所有行的分析結果這類信息匯總都是在END語句塊中完成，它也是一個可選語句塊。

AWK內置變數
$n : 當前記錄的第n個欄位，比如n為1表示第一個欄位，n為2表示第二個欄位。

$0 : 這個變數包含執行過程中當前行的文本內容。

ARGC : 命令行參數的數目。

ARGIND : 命令行中當前文件的位置（從0開始算）。

ARGV : 包含命令行參數的數組。

CONVFMT : 數字轉換格式（默認值為%.6g）。

ENVIRON : 環境變數關聯數組。

ERRNO : 最後一個系統錯誤的描述。

FIELDWIDTHS : 欄位寬度列表（用空格鍵分隔）。

FILENAME : 當前輸入文件的名。

NR : 表示記錄數，在執行過程中對應於當前的行號

FNR : 同NR :，但相對於當前文件。

FS : 欄位分隔符（默認是任何空格）。

IGNORECASE : 如果為真，則進行忽略大小寫的匹配。

NF : 表示欄位數，在執行過程中對應於當前的欄位數。 print $NF答應一行中最後一個欄位

OFMT : 數字的輸出格式（默認值是%.6g）。

OFS : 輸出欄位分隔符（默認值是一個空格）。

ORS : 輸出記錄分隔符（默認值是一個換行符）。

RS : 記錄分隔符（默認是一個換行符）。

RSTART : 由match函數所匹配的字元串的第一個位置。

RLENGTH : 由match函數所匹配的字元串的長度。

SUBSEP : 數組下標分隔符（默認值是34）。

將外部變數值傳遞給awk
藉助 -v 選項，可以將來自外部值（非stdin）傳遞給awk

VAR=10000
echo | awk -v VARIABLE=$VAR '{ print VARIABLE }'

定義內部變數接收外部變數

var1="aaa"
var2="bbb"
echo | awk '{ print v1,v2 }' v1=$var1 v2=$var2

當輸入來自文件時

awk '{ print v1,v2 }' v1=$var1 v2=$var2 filename

awk運算
算術運算：（+，-，*，/，&，！，……，++，--）

所有用作算術運算符進行操作時，操作數自動轉為數值，所有非數值都變為0

賦值運算：（=， +=， -=，*=，/=，%=，……=，**=）

邏輯運算符: (||, &&)

關系運算符：（<, <=, >,>=,!=, ==）

正則運算符：（～，～!）(匹配正則表達式，與不匹配正則表達式)

awk 'BEGIN{a="100testa";if(a ~ /^100*/){print "ok";}}'
ok

awk高級輸入輸出
讀取下一條記錄：next 語句
awk中next語句使用：在循環逐行匹配，如果遇到next，就會跳過當前行，直接忽略下面語句。而進行下一行匹配。net語句一般用於多行合並：

awk 'NR%2==1{next}{print NR,$0;}' text.txt
說明：當記錄行號除以2餘1，就跳過當前行。下面的print NR,$0也不會執行。下一行開始，程序有開始判斷NR%2值。這個時候記錄行號是：2 ，就會執行下面語句塊：print NR,$0

讀取一行記錄：getline 語句
awk getline用法：輸出重定向需用到getline函數。getline從標准輸入、管道或者當前正在處理的文件之外的其他輸入文件獲得輸入。它負責從輸入獲得下一行的內容，並給NF,NR和FNR等內建變數賦值。如果得到一條記錄，getline函數返回1，如果到達文件的末尾就返回0，如果出現錯誤，例如打開文件失敗，就返回-1。
語法格式：getline var 變數var包含了特定行的內容
用法說明：

當其左右無重定向符時|，<時：getline作用於當前文件，讀入當前文件的第一行給其後跟的變數var或$0（無變數），應該注意到，由於awk在處理getline之前已經讀入了一行，所以getline得到的返回結果是隔行的。

當其左右有重定向符時|，<時：getline則作用於定向輸入文件，由於該文件是剛打開，並沒有被awk讀入一行，只是getline讀入，那麼getline返回的是該文件的第一行，而不是隔行。

文件操作
打開文件 open("filename")

關閉文件 close("filename")

輸出到文件重定向到文件，如echo | awk '{printf("hello word!n") > "datafile"}'

循環結構
for循環
for(變數 in 數組)
{語句}

for(變數;條件;表達式)
{語句}
while循環
while(表達式)
{語句}
do...while循環
do
{語句} while(條件)
其他相關語句
break：退出程序循環

continue: 進入下一次循環

next：讀取下一個輸入行

exit：退出主輸入循環，進入END，若沒有END或END中有exit語句，則退出腳本。

數組
在awk中數組叫做關聯數組(associative arrays)。awk 中的數組不必提前聲明，也不必聲明大小。數組元素用0或空字元串來初始化，這根據上下文而定。

awk 'BEGIN{
Array[1]="sun"
Array[2]="kai"
Array["first"]="www"
Array["last"]="name"
Array["birth"]="1987"

info = "it is a test";
lens = split(info,tA," ");
for(item in tA)
{print tA[item];}
for(i=1;i<=lens;i++)
{print tA[i];}
print length(tA[lens]);
} {
print "item in array";
for(item in Array) {print Array[item]};
print "print in i++";
for(i=1;i<=length(Array);i++) {print Array[i]};
}'
獲取數組長度

awk 'BEGIN{
info="it is a test";
lens=split(info,tA," "); #使用split函數獲取數組長度
print length(tA),lens; #使用length函數獲取數組長度（版本有要求）
}'
**說明：** **版本夠高**的awk當中，支持直接得到數組長度的方法length()，如果awk的版本過低，則不支持。另外，如果傳給length的變數是一個字元串，那麼length返回的則字元串的長度。
輸出數組內容

有序輸出 for...in

因為數組時關聯數組，默認是無序的

無序輸出 for(i=1;i<l=ens;i++)

數組下標從1開始

判斷鍵值是否存在

#錯誤的判斷方法，awk數組是關聯數組，只要通過數組引用它的KEY，就會自動創建。
awk 'BEGIN{
tB["a"]="a1";
tB["b"]="b1";
if(tB["c"]!="1"){ #tB["c"]沒有定義，但是循環的時候會輸出
print "no found";
};
for(k in tB){
print k,tB[k];
}}'

#正確的判定方法：使用 if ( key in array) 判斷數組中是否包含鍵值
awk 'BEGIN{
tB["a"]="a1";
tB["b"]="b1";
if( "c" in tB){
print "ok";
};
for(k in tB){
print k,tB[k];
}}'
刪除鍵值
delete array[key]可以刪除，對應數組key的，序列值。

awk 'BEGIN{
tB["a"]="a1";
tB["b"]="b1";
delete tB["a"];
for(k in tB){
print k,tB[k];
}}'
二維，多維數組
awk的多維數組在本質上是一維數組，更確切一點，awk在存儲上並不支持多維數組。awk提供了邏輯上模擬二維數組的訪問方式。例如，array[2,4]=1這樣的訪問是允許的。awk使用一個特殊的字元串SUBSEP作為分割欄位。類似一維數組的成員測試，多維數組可以使用if ( (i,j) in array)這樣的語法，但是下標必須放置在圓括弧中。類似一維數組的循環訪問，多維數組使用for ( item in array )這樣的語法遍歷數組。與一維數組不同的是，多維數組必須使用split()函數來訪問單獨的下標分量。

awk 'BEGIN{
for(i=1;i<=9;i++){
for(j=1;j<=9;j++){
tarr[i,j]=i*j;
print i,"*",j,"=",tarr[i,j];
}
}
}'

awk 'BEGIN{
for(i=1;i<=9;i++){
for(j=1;j<=9;j++){
tarr[i,j]=i*j; } }
for(m in tarr){
split(m,tarr2,SUBSEP);
print tarr2[1],"*",tarr2[2],"=",tarr[m]; } }'
內置函數
算術函數
格式描述
atan2( y, x ) 返回 y/x 的反正切。
cos( x ) 返回 x 的餘弦；x 是弧度。
sin( x ) 返回 x 的正弦；x 是弧度。
exp( x ) 返回 x 冪函數。
log( x ) 返回 x 的自然對數。
sqrt( x ) 返回 x 平方根。
int( x ) 返回 x 的截斷至整數的值。
rand( ) 返回任意數字 n，其中 0 <= n < 1。
srand( [expr] ) 將 rand 函數的種子值設置為 Expr 參數的值，或如果省略 Expr 參數則使用某天的時間。返回先前的種子值。
awk 'BEGIN{
OFMT="%.3f"; #OFMT 設置輸出數據格式是保留3位小數。
fs=sin(1);
fe=exp(10);
fl=log(10);
fi=int(3.1415);
print fs,fe,fl,fi;
}'
輸出結果為：0.841 22026.466 2.303 3

awk 'BEGIN{
srand();
fr=int(100*rand());
print fr;
}'
輸出：78
字元串函數
格式描述
gsub( Ere, Repl, [ In ] ) 除了正則表達式所有具體值被替代這點，它和 sub 函數完全一樣地執行。
sub( Ere, Repl, [ In ] ) 用 Repl 參數指定的字元串替換 In 參數指定的字元串中的由 Ere 參數指定的擴展正則表達式的第一個具體值。sub 函數返回替換的數量。出現在 Repl 參數指定的字元串中的 &（和符號）由 In 參數指定的與 Ere 參數的指定的擴展正則表達式匹配的字元串替換。如果未指定 In 參數，預設值是整個記錄（$0 記錄變數）。
index( String1, String2 ) 在由 String1 參數指定的字元串（其中有出現 String2 指定的參數）中，返回位置，從 1 開始編號。如果 String2 參數不在 String1 參數中出現，則返回 0（零）。
length [(String)] 返回 String 參數指定的字元串的長度（字元形式）。如果未給出 String 參數，則返回整個記錄的長度（$0 記錄變數）。
blength [(String)] 返回 String 參數指定的字元串的長度（以位元組為單位）。如果未給出 String 參數，則返回整個記錄的長度（$0 記錄變數）。
substr( String, M, [ N ] ) 返回具有 N 參數指定的字元數量子串。子串從 String 參數指定的字元串取得，其字元以 M 參數指定的位置開始。M 參數指定為將 String 參數中的第一個字元作為編號 1。如果未指定 N 參數，則子串的長度將是 M 參數指定的位置到 String 參數的末尾的長度。
match( String, Ere ) 在 String 參數指定的字元串（Ere 參數指定的擴展正則表達式出現在其中）中返回位置（字元形式），從 1 開始編號，或如果 Ere 參數不出現，則返回 0（零）。RSTART 特殊變數設置為返回值。RLENGTH 特殊變數設置為匹配的字元串的長度，或如果未找到任何匹配，則設置為 -1（負一）。
tolower( String ) 返回 String 參數指定的字元串，字元串中每個大寫字元將更改為小寫。大寫和小寫的映射由當前語言環境的 LC_CTYPE 范疇定義。
toupper( String ) 返回 String 參數指定的字元串，字元串中每個小寫字元將更改為大寫。大寫和小寫的映射由當前語言環境的 LC_CTYPE 范疇定義。
sprintf(Format, Expr, Expr, . . . ) 根據 Format 參數指定的 printf 子常式格式字元串來格式化 Expr 參數指定的表達式並返回最後生成的字元串。
說明： Ere都可以是正則表達式。

時間函數
格式描述
mktime( YYYY MM dd HH MM ss[ DST]) 生成時間格式
strftime([format [, timestamp]]) 格式化時間輸出，將時間戳轉為時間字元串具體格式，見下表.
systime() 得到時間戳,返回從1970年1月1日開始到當前時間(不計閏年)的整秒數
strftime日期和時間格式說明符 :

格式描述
%a 星期幾的縮寫(Sun)
%A 星期幾的完整寫法(Sunday)
%b 月名的縮寫(Oct)
%B 月名的完整寫法(October)
%c 本地日期和時間
%d 十進制日期
%D 日期 08/20/99
%e 日期，如果只有一位會補上一個空格
%H 用十進製表示24小時格式的小時
%I 用十進製表示12小時格式的小時
%j 從1月1日起一年中的第幾天
%m 十進製表示的月份
%M 十進製表示的分鍾
%p 12小時表示法(AM/PM)
%S 十進製表示的秒
%U 十進製表示的一年中的第幾個星期(星期天作為一個星期的開始)
%w 十進製表示的星期幾(星期天是0)
%W 十進製表示的一年中的第幾個星期(星期一作為一個星期的開始)
%x 重新設置本地日期(08/20/99)
%X 重新設置本地時間(12：00：00)
%y 兩位數字表示的年(99)
%Y 當前月份
%Z 時區(PDT)
%% 百分號(%)
#mktime使用
awk 'BEGIN{tstamp=mktime("2001 01 01 12 12 12");print strftime("%c",tstamp);}'
輸出：2001年01月01日星期一 12時12分12秒

awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=mktime("2001 02 01 0 0 0");print tstamp2-tstamp1;}'
輸出：2634468

#求2個時間段中間時間差，介紹了strftime使用方法
awk 'BEGIN{tstamp1=mktime("2001 01 01 12 12 12");tstamp2=systime();print tstamp2-tstamp1;}'
輸出：308201392

其他一般函數
格式描述
close( Expression ) 用同一個帶字元串值的 Expression 參數來關閉由 print 或 printf 語句打開的或調用getline 函數打開的文件或管道。如果文件或管道成功關閉，則返回 0；其它情況下返回非零值。如果打算寫一個文件，並稍後在同一個程序中讀取文件，則 close 語句是必需的。
system(command ) 執行 Command 參數指定的命令，並返回退出狀態。等同於 system 子常式。
Expression | getline [ Variable ] 從來自 Expression 參數指定的命令的輸出中通過管道傳送的流中讀取一個輸入記錄，並將該記錄的值指定給 Variable 參數指定的變數。如果當前未打開將 Expression 參數的值作為其命令名稱的流，則創建流。創建的流等同於調用 popen 子常式，此時 Command 參數取 Expression 參數的值且 Mode 參數設置為一個是 r 的值。只要流保留打開且 Expression 參數求得同一個字元串，則對 getline 函數的每次後續調用讀取另一個記錄。如果未指定 Variable 參數，則 $0 記錄變數和 NF 特殊變數設置為從流讀取的記錄。
getline [ Variable ] < Expression 從 Expression 參數指定的文件讀取輸入的下一個記錄，並將 Variable 參數指定的變數設置為該記錄的值。只要流保留打開且 Expression 參數對同一個字元串求值，則對 getline 函數的每次後續調用讀取另一個記錄。如果未指定 Variable 參數，則 $0 記錄變數和 NF 特殊變數設置為從流讀取的記錄。
getline [ Variable ] 將 Variable 參數指定的變數設置為從當前輸入文件讀取的下一個輸入記錄。如果未指定 Variable 參數，則 $0 記錄變數設置為該記錄的值，還將設置 NF、NR 和 FNR 特殊變數。
#打開外部文件（close用法）
awk 'BEGIN{while("cat /etc/passwd"|getline){print $0;};close("/etc/passwd");}'
輸出: root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin

#逐行讀取外部文件(getline使用方法）
awk 'BEGIN{while(getline < "/etc/passwd"){print $0;};close("/etc/passwd");}'
輸出：root:x:0:0:root:/root:/bin/bash bin:x:1:1:bin:/bin:/sbin/nologin daemon:x:2:2:daemon:/sbin:/sbin/nologin

awk 'BEGIN{print "Enter your name:";getline name;print name;}'
Enter your name:
chengmo
chengmo

#調用外部應用程序(system使用方法） b返回值，是執行結果。
awk 'BEGIN{b=system("ls -al");print b;}'
輸出： total 42092 drwxr-xr-x 14 chengmo chengmo 4096 09-30 17:47 . drwxr-xr-x 95 root root 4096 10-08 14:01 ..

F. awk '{print $2}' 這個命令是什麼意思

linux中shell命令段awk '{print $2}'的意思是選取並輸出第二列的數據。

AWK是一個優良的文本處理工具，Linux及Unix環境中現有的功能最強大的數據處理引擎之一。這種編程及數據操作語言的最大功能取決於一個人所擁有的知識。awk經過改進生成的新的版本nawk,gawk，現在默認linux系統下日常使用的是gawk，用命令可以查看正在應用的awk的來源（ls -l /bin/awk ）

linux命令是對Linux系統進行管理的命令。對於Linux系統來說，無論是中央處理器、內存、磁碟驅動器、鍵盤、滑鼠，還是用戶等都是文件，Linux系統管理的命令是它正常運行的核心，與之前的DOS命令類似。linux命令在系統中有兩種類型：內置Shell命令和Linux命令。

(6)awk高級源碼擴展閱讀：

linux優點：

1、Linux由眾多微內核組成，其源代碼完全開源；

2、Linux繼承了Unix的特性，具有非常強大的網路功能，其支持所有的網際網路協議，包括TCP/IPv4、TCP/IPv6和鏈路層拓撲程序等，且可以利用Unix的網路特性開發成出新的協議棧；

3、Linux系統工具鏈完整，簡單操作就可以配置出合適的開發環境，可以簡化開發過程，減少開發中模擬工具的障礙，使系統具有較強的移植性；

參考資料來源：

網路-Awk

網路-linux命令

導航:首頁 > 源碼編譯 > awk高級源碼

awk高級源碼

與awk高級源碼相關的資料