便於與編譯_簡單描述編譯的幾個處理步驟

① 編譯程序有編譯和翻譯兩種方式分別對其說明並比較急在線等

編譯程序編譯程序
compiler
把用高級程序設計語言書寫的源程序，翻譯成等價的計算機匯編語言或機器語言的目標程序的翻譯程序。編譯程序屬於採用生成性實現途徑實現的翻譯程序。它以高級程序設計語言書寫的源程序作為輸入，而以匯編語言或機器語言表示的目標程序作為輸出。編譯出的目標程序通常還要經歷運行階段，以便在運行程序的支持下運行，加工初始數據，算出所需的計算結果。編譯程序的實現演算法較為復雜。這是因為它所翻譯的語句與目標語言的指令不是一一對應關系,而是一多對應關系;同時也因為它要處理遞歸調用、動態存儲分配、多種數據類型，以及語句間的緊密依賴關系。但是，由於高級程序設計語言書寫的程序具有易讀、易移植和表達能力強等特點，編譯程序廣泛地用於翻譯規模較大、復雜性較高、且需要高效運行的高級語言書寫的源程序。
功能編譯程序的基本功能是把源程序翻譯成目標程序。但是,作為一個具有實際應用價值的編譯系統,除了基本功能之外，還應具備語法檢查、調試措施、修改手段、覆蓋處理、目標程序優化、不同語言合用以及人-機聯系等重要功能。①語法檢查:檢查源程序是否合乎語法。如果不符合語法，編譯程序要指出語法錯誤的部位、性質和有關信息。編譯程序應使用戶一次上機，能夠盡可能多地查出錯誤。②調試措施：檢查源程序是否合乎設計者的意圖。為此，要求編譯程序在編譯出的目標程序中安置一些輸出指令，以便在目標程序運行時能輸出程序動態執行情況的信息，如變數值的更改、程序執行時所經歷的線路等。這些信息有助於用戶核實和驗證源程序是否表達了演算法要求。③修改手段：為用戶提供簡便的修改源程序的手段。編譯程序通常要提供批量修改手段（用於修改數量較大或臨時不易修改的錯誤）和現場修改手段（用於運行時修改數量較少、臨時易改的錯誤）。④覆蓋處理：主要是為處理程序長、數據量大的大型問題程序而設置的。基本思想是讓一些程序段和數據公用某些存儲區，其中只存放當前要用的程序或數據;其餘暫時不用的程序和數據,先存放在磁碟等輔助存儲器中，待需要時動態地調入。⑤目標程序優化：提高目標程序的質量,即佔用的存儲空間少,程序的運行時間短。依據優化目標的不同，編譯程序可選擇實現表達式優化、循環優化或程序全局優化。目標程序優化有的在源程序級上進行，有的在目標程序級上進行。⑥不同語言合用：其功能有助於用戶利用多種程序設計語言編寫應用程序或套用已有的不同語言書寫的程序模塊。最為常見的是高級語言和匯編語言的合用。這不但可以彌補高級語言難於表達某些非數值加工操作或直接控制、訪問外圍設備和硬體寄存器之不足，而且還有利於用匯編語言編寫核心部分程序,以提高運行效率。⑦人-機聯系：確定編譯程序實現方案時達到精心設計的功能。目的是便於用戶在編譯和運行階段及時了解內部工作情況，有效地監督、控制系統的運行。
早期編譯程序的實現方案，是把上述各項功能完全收納在編譯程序之中。然而，習慣做法是在操作系統的支持下，配置調試程序、編輯程序和連接裝配程序，用以協助實現程序的調試、修改、覆蓋處理，以及不同語言合用功能。但在設計編譯程序時，仍須精心考慮如何與這些子系統銜接等問題。
工作過程編譯程序必須分析源程序，然後綜合成目標程序。首先，檢查源程序的正確性，並把它分解成若干基本成分；其次，再根據這些基本成分建立相應等價的目標程序部分。為了完成這些工作，編譯程序要在分析階段建立一些表格,改造源程序為中間語言形式,以便在分析和綜合時易於引用和加工（圖1）。
數據結構分析和綜合時所用的主要數據結構，包括符號表、常數表和中間語言程序。符號表由源程序中所用的標識符連同它們的屬性組成，其中屬性包括種類（如變數、數組、結構、函數、過程等）、類型（如整型、實型、字元串、復型、標號等），以及目標程序所需的其他信息。常數表由源程序中用的常數組成，其中包括常數的機內表示，以及分配給它們的目標程序地址。中間語言程序是將源程序翻譯為目標程序前引入的一種中間形式的程序，其表示形式的選擇取決於編譯程序以後如何使用和加工它。常用的中間語言形式有波蘭表示、三元組、四元組以及間接三元組等。
分析部分源程序的分析是經過詞法分析、語法分析和語義分析三個步驟實現的。詞法分析由詞法分析程序（又稱為掃描程序）完成，其任務是識別單詞（即標識符、常數、保留字，以及各種運算符、標點符號等）、造符號表和常數表，以及將源程序換碼為編譯程序易於分析和加工的內部形式。語法分析程序是編譯程序的核心部分，其主要任務是根據語言的語法規則，檢查源程序是否合乎語法。如不合乎語法，則輸出語法出錯信息；如合乎語法，則分解源程序的語法結構，構造中間語言形式的內部程序。語法分析的目的是掌握單詞是怎樣組成語句的，以及語句又是如何組成程序的。語義分析程序是進一步檢查合法程序結構的語義正確性，其目的是保證標識符和常數的正確使用，把必要的信息收集和保存到符號表或中間語言程序中，並進行相應的語義處理。
綜合部分綜合階段必須根據符號表和中間語言程序產生出目標程序，其主要工作包括代碼優化、存儲分配和代碼生成。代碼優化是通過重排和改變程序中的某些操作，以產生更加有效的目標程序。存儲分配的任務是為程序和數據分配運行時的存儲單元。代碼生成的主要任務是產生與中間語言程序符等價的目標程序，順序加工中間語言程序，並利用符號表和常數表中的信息生成一系列的匯編語言或機器語言指令。
結構編譯過程分為分析和綜合兩個部分，並進一步劃分為詞法分析、語法分析、語義分析、代碼優化、存儲分配和代碼生成等六個相繼的邏輯步驟。這六個步驟只表示編譯程序各部分之間的邏輯聯系，而不是時間關系。編譯過程既可以按照這六個邏輯步驟順序地執行，也可以按照平行互鎖方式去執行。在確定編譯程序的具體結構時，常常分若干遍實現。對於源程序或中間語言程序，從頭到尾掃視一次並實現所規定的工作稱作一遍。每一遍可以完成一個或相連幾個邏輯步驟的工作。例如，可以把詞法分析作為第一遍；語法分析和語義分析作為第二遍；代碼優化和存儲分配作為第三遍；代碼生成作為第四遍。反之，為了適應較小的存儲空間或提高目標程序質量，也可以把一個邏輯步驟的工作分為幾遍去執行。例如，代碼優化可劃分為代碼優化准備工作和實際代碼優化兩遍進行。
一個編譯程序是否分遍,以及如何分遍,根據具體情況而定。其判別標准可以是存儲容量的大小、源語言的繁簡、解題范圍的寬窄，以及設計、編制人員的多少等。分遍的好處是各遍功能獨立單純、相互聯系簡單、邏輯結構清晰、優化准備工作充分。缺點是各遍之中不可避免地要有些重復的部分，而且遍和遍之間要有交接工作，因之增加了編譯程序的長度和編譯時間。
一遍編譯程序是一種極端情況，整個編譯程序同時駐留在內存,彼此之間採用調用轉接方式連接在一起(圖2)。當語法分析程序需要新符號時，它就調用詞法分析程序；當它識別出某一語法結構時，它就調用語義分析程序。語義分析程序對識別出的結構進行語義檢查，並調用「存儲分配」和「代碼生成」程序生成相應的目標語言指令。
隨著程序設計語言在形式化、結構化、直觀化和智能化等方面的發展，作為實現相應語言功能的編譯程序，也正向自動程序設計的目標發展，以便提供理想的程序設計工具。
參考書目
陳火旺、錢家驊、孫永強編：《編譯原理》，國防工業出版社，北京，1980。
A.V.Aho, Principles of Compiler Design,Addison Wes-ley, Reading, Massachusetts, 1977.
--------------------------------------------------------------------------------
編譯程序 (compiler)
將用高級程序設計語言書寫的源程序，翻譯成等價的用計算機匯編語言、機器語言或某種中間語言表示的目標程序的翻譯程序。用戶利用編譯程序實現數據處理任務時，先要經歷編譯階段，再經歷運行階段。編譯階段以源程序作為輸入，以目標程序作為輸出，其主要任務是將源程序翻譯成目標程序。運行階段的任務是運行所編譯出的目標程序，實現源程序中指定的數據處理任務，其工作通常包括：輸入初始數據，對數據或文件進行數據加工，輸出必要信息和加工結果等。編譯程序的實現演算法較為復雜。這是因為它所翻譯的語句與目標語言的指令不是一一對應關系，而是一多對應關系；同時因為它要在編譯階段處理遞歸調用、動態存儲分配、多種數據類型實現、代碼生成與代碼優化等繁雜技術問題；還要在運行階段提供良好、有效的運行環境。由於高級程序設計語言書寫的程序具有易讀、易移植和表達能力強等特點，所以編譯程序廣泛地用於翻譯規模較大、復雜性較高、且需要高效運行的高級語言書寫的源程序。
功能編譯程序的基本功能是把源程序翻譯成目標程序。此外，還要具備語法檢查、調試措施、修改手段、覆蓋處理、目標程序優化、不同語言合用以及人機聯系等具有實際應用價值的重要功能。①語法檢查。檢查源程序是否合乎語法。②調試措施。檢查源程序是否合乎用戶的設計意圖。③修改手段。為用戶提供簡便的修改源程序的手段。④覆蓋處理。主要為處理程序較長、數據量較大的大型問題程序而設置。基本思想是讓一些程序段和數據公用某些存儲區，其中只存放當前要用的程序段或數據，其餘暫時不用的程序段和數據均存放在磁碟等輔助存儲器中，待需要時動態地調入存儲區中運行。⑤目標程序優化。提高目標程序的質量，即使編譯出的目標程序運行時間短、佔用存儲少。⑥不同語言合用。便於用戶利用多種程序設計語言編寫應用程序或套用已有的不同語言書寫的程序模塊。最為常見的是高級語言和匯編語言的合用。⑦人機聯系。便於用戶在編譯和運行階段及時了解系統內部工作情況，有效地監督、控制系統的運行。
早期編譯程序的實現方案，是把上述各項功能完全收納在編譯程序之中。後來的習慣方法是在操作系統的支持下，配置編輯程序、調試程序、連接裝配程序等實用程序或工具軟體，目的是創造一個良好的開發環境和運行環境，便於應用軟體的編程、修改、調試、集成以及報表生成、界面設計等工作。但編譯程序設計者設計編譯方案時，仍需精心考慮上述各項功能，較好地解決目標程序與這些實用程序或軟體工具之間的配合與銜接等問題。
工作過程編譯程序必須分析源程序，然後綜合成目標程序。為達到這個目的，編譯程序要在分析階段建立一些表格，改造源程序為中間語言形式，以便在分析和綜合時易於引用和加工。
數據結構分析和綜合時所用的主要數據結構，包括符號表、常數表和中間語言程序。符號表由源程序中所用的標識符連同它們的屬性組成，其中屬性包括種類（如變數、數組、結構、函數、過程等）、類型（如整型、實型、字元串、復型、標號等），以及目標程序所需的其他信息。常數表由源程序中用的常數組成，其中包括常數的機內表示以及分配給它們的目標程序地址。中間語言程序是將源程序翻譯成目標程序前引入的一種中間形式的程序，其表示形式的選擇取決於編譯程序以後如何使用它和如何加工它。常用的中間語言形式有波蘭表示、三元組、四元組以及間接三元組等。
分析部分源程序的分析是經過詞法分析、語法分析和語義分析三個步驟實現的。詞法分析由詞法分析程序（又稱為掃描程序）完成，其任務是識別單詞（即標識符、常數、保留字，以及各種運算符、標點符號等）、造符號表和常數表，以及將源程序換碼為編譯程序易於分析和加工的內部形式。語法分析程序是編譯程序的核心部分，其主要任務是根據語言的語法規則，檢查源程序是否合乎語法，並分解源程序。如果不合乎語法，則輸出語法出錯信息；如果合乎語法，則分解源程序的語法結構，構造中間語言形式的內部程序。語法分析的目的是掌握單詞是怎樣組成語句的，以及語句又是如何組成程序的。語義分析程序進一步檢查合法程序結構的語義正確性，其目的是保證標識符和常數的正確使用，把必要的信息收集和保存到符號表或中間語言程序中，並進行相應的語義處理。
綜合部分綜合階段根據符號表和中間語言程序產生出目標程序，其主要工作包括代碼優化、存儲分配和代碼生成。代碼優化是通過重排和改變程序中的某些操作，以產生更加有效的目標程序。存儲分配是為程序和數據分配運行時的存儲單元。代碼生成是產生與中間語言程序等價的目標程序，亦即，順序加工中間語言程序，利用符號表和常數表中的信息生成一系列的匯編語言或機器語言指令。
動態 20世紀80年代以後，程序設計語言在形式化、結構化、直觀化和智能化等方面有了長足的進步和發展，主要表現在兩個方面：①隨著程序設計理論和方法的發展，相繼推出了一系列新型程序設計語言，如結構化程序設計語言、並發程序設計語言、分布式程序設計語言、函數式程序設計語言、智能化程序設計語言、面向對象程序設計語言等；②基於語法、語義和語用方面的研究成果，從不同的角度和層次上深刻地揭示了程序設計語言的內在規律和外在表現形式。與此相應地，作為實現程序設計語言重要手段之一的編譯程序，在體系結構、設計思想、實現技術和處理內容等方面均有不同程度的發展、變化和擴充。另外，編譯程序已作為實現編程的重要軟體工具，被納入到軟體支援環境的基本層軟體工具之中。因此，規劃編譯程序實現方案時，應從所處的具體軟體支援環境出發，既要遵循整個環境的全局性要求和規定，又要精心考慮與其他諸層軟體工具之間的相互支援、配合和銜接關系。

② 簡述將源程序編譯成可執行程序的過程

一個源程序到一個可執行程序的過程：預編譯、編譯、匯編、鏈接。其中，編譯是主要部分，其中又分為六個部分：詞法分析、語法分析、語義分析、中間代碼生成、目標代碼生成和優化。

預編譯：主要處理源代碼文件中的以「#」開頭的預編譯指令。處理規則如下：

1、刪除所有的#define，展開所有的宏定義。

2、處理所有的條件預編譯指令，如「#if」、「#endif」、「#ifdef」、「#elif」和「#else」。

3、處理「#include」預編譯指令，將文件內容替換到它的位置，這個過程是遞歸進行的，文件中包含其他文件。

4、刪除所有的注釋，「//」和「/**/」。

5、保留所有的#pragma 編譯器指令，編譯器需要用到他們，如：#pragma once 是為了防止有文件被重復引用。

6、添加行號和文件標識，便於編譯時編譯器產生調試用的行號信息，和編譯時產生編譯錯誤或警告是能夠顯示行號。

(2)便於與編譯擴展閱讀：

編譯過程中語法分析器只是完成了對表達式語法層面的分析，語義分析器則對表達式是否有意義進行判斷，其分析的語義是靜態語義——在編譯期能分期的語義，相對應的動態語義是在運行期才能確定的語義。

其中，靜態語義通常包括：聲明和類型的匹配，類型的轉換，那麼語義分析就會對這些方面進行檢查，例如將一個int型賦值給int*型時，語義分析程序會發現這個類型不匹配，編譯器就會報錯。

③ 簡單描述編譯的幾個處理步驟

編譯過程分為分析和綜合兩個部分，並進一步劃分為詞法分析、語法分析、語義分析、代碼優化、存儲分配和代碼生成等六個相繼的邏輯步驟。這六個步驟只表示編譯程序各部分之間的邏輯聯系，而不是時間關系。

編譯過程既可以按照這六個邏輯步驟順序地執行，也可以按照平行互鎖方式去執行。在確定編譯程序的具體結構時，常常分若干遍實現。對於源程序或中間語言程序，從頭到尾掃視一次並實現所規定的工作稱作一遍。每一遍可以完成一個或相連幾個邏輯步驟的工作。

(3)便於與編譯擴展閱讀：

對於c編譯程序來說，其語言的特點如下：

1、c語言是一種結構化語言。它層次清晰，便於按模塊化方式組織程序，易於調試和維護，而且表現能力和處理能力極強。

2、c語言具有豐富的運算符和數據類型，便於實現各類復雜的數據結構。它還可以直接訪問內存的物理地址，進行位(bit)一級的操作。

3、由於c語言實現了對硬體的編程操作，因此集高級語言和低級語言的功能於一體。它既可用於系統軟體的開發，也適合於應用軟體的開發。

4、此外，c語言還具有效率高、可移植性強等特點。因此它廣泛地移植到了各類各型計算機上，從而形成了多種版本。

④ 編譯程序是什麼意思編譯是什麼意思

編譯程序（Compiler，compiling program）也稱為編譯器，是指把用高級程序設計語言書寫的源程序，翻譯成等價的機器語言格式目標程序的翻譯程序。

解釋程序是一種語言處理程序，在詞法、語法和語義分析方面與編譯程序的工作原理基本相同，但在運行用戶程序時，它直接執行源程序或源程序的內部形式(中間代碼)。

(4)便於與編譯擴展閱讀：

結構：

可以把詞法分析作為第一遍；語法分析和語義分析作為第二遍；代碼優化和存儲分配作為第三遍；代碼生成作為第四遍。反之，為了適應較小的存儲空間或提高目標程序質量，也可以把一個邏輯步驟的工作分為幾遍去執行。

⑤ c語言程序,預編譯的作用

我們在用c做開發的時候，有時候項目很大，所寫的程序會很長。這樣我們如果還是寫在一個文件中，會出現管理上的問題和查看上的不方便，因此我們可以分多個文件寫我們的程序，這樣把一個功能的程序寫到一個文件里，便於查看也便於管理。但是把他們合起來的時候。頭文件會多次包含預編譯，預編譯的處理就可以用來防止頭文件的重復包含和編譯。
第二，使用宏定義可以提高程序的通用性和易讀性，減少不一致性，減少輸入錯誤便於修改。展開宏也是預編譯處理中的一項功能。
還有條件編譯處理也是預處理中的一項功能。

⑥ 如何更好的掌握編譯器的設計與實現

1. 閱讀相關書籍：編譯原理、編譯器設計、編譯器實現等；
2. 自學相關編程語言：C、C++、Java等；
3. 實踐：可以使用開源的編譯器框架，例如ANTLR，搭建自己的編譯器；
4. 了解編譯器的各個組成部分，並學習它們的工作原理；
5. 閱讀技術文章，了解編譯器的設計和實現的最新進展；
6. 加入開源項目，編寫和維護編譯器；
7. 在論壇上交流，和更多的編譯器開發者分享心得體會；
8. 參加學術會議，接觸到最新的研究成果；
9. 嘗試著自己設計一個編譯器，用實踐來加深理解。

⑦ 「編譯」與「編譯器」是什麼意思

編譯是動詞
編譯器是名詞
編譯(compilation , compile)
1、利用編譯程序從源語言編寫的源程序產生目標程序的過程。
2、用編譯程序產生目標程序的動作。

編譯就是把高級語言變成計算機可以識別的2進制語言，計算機只認識1和0，編譯程序把人們熟悉的語言換成2進制的。
編譯程序把一個源程序翻譯成目標程序的工作過程分為五個階段：詞法分析；語法分析；中間代碼生成；代碼優化；目標代碼生成。主要是進行詞法分析和語法分析，又稱為源程序分析，分析過程中發現有語法錯誤，給出提示信息。
（1）詞法分析
詞法分析的任務是對由字元組成的單詞進行處理，從左至右逐個字元地對源程序進行掃描，產生一個個的單詞符號，把作為字元串的源程序改造成為單詞符號串的中間程序。執行詞法分析的程序稱為詞法分析程序或掃描器。
源程序中的單詞符號經掃描器分析，一般產生二元式：單詞種別；單詞自身的值。單詞種別通常用整數編碼，如果一個種別只含一個單詞符號，那麼對這個單詞符號，種別編碼就完全代表它自身的值了。若一個種別含有許多個單詞符號，那麼，對於它的每個單詞符號，除了給出種別編碼以外，還應給出自身的值。
詞法分析器一般來說有兩種方法構造：手工構造和自動生成。手工構造可使用狀態圖進行工作，自動生成使用確定的有限自動機來實現。
（2）語法分析
編譯程序的語法分析器以單詞符號作為輸入，分析單詞符號串是否形成符合語法規則的語法單位，如表達式、賦值、循環等，最後看是否構成一個符合要求的程序，按該語言使用的語法規則分析檢查每條語句是否有正確的邏輯結構，程序是最終的一個語法單位。編譯程序的語法規則可用上下文無關文法來刻畫。
語法分析的方法分為兩種：自上而下分析法和自下而上分析法。自上而下就是從文法的開始符號出發，向下推導，推出句子。而自下而上分析法採用的是移進歸約法，基本思想是：用一個寄存符號的先進後出棧，把輸入符號一個一個地移進棧里，當棧頂形成某個產生式的一個候選式時，即把棧頂的這一部分歸約成該產生式的左鄰符號。
（3）中間代碼生成
中間代碼是源程序的一種內部表示，或稱中間語言。中間代碼的作用是可使編譯程序的結構在邏輯上更為簡單明確，特別是可使目標代碼的優化比較容易實現。中間代碼即為中間語言程序，中間語言的復雜性介於源程序語言和機器語言之間。中間語言有多種形式，常見的有逆波蘭記號、四元式、三元式和樹。
（4）代碼優化
代碼優化是指對程序進行多種等價變換，使得從變換後的程序出發，能生成更有效的目標代碼。所謂等價，是指不改變程序的運行結果。所謂有效，主要指目標代碼運行時間較短，以及佔用的存儲空間較小。這種變換稱為優化。
有兩類優化：一類是對語法分析後的中間代碼進行優化，它不依賴於具體的計算機；另一類是在生成目標代碼時進行的，它在很大程度上依賴於具體的計算機。對於前一類優化，根據它所涉及的程序范圍可分為局部優化、循環優化和全局優化三個不同的級別。
（5）目標代碼生成
目標代碼生成是編譯的最後一個階段。目標代碼生成器把語法分析後或優化後的中間代碼變換成目標代碼。目標代碼有三種形式：
① 可以立即執行的機器語言代碼，所有地址都重定位；
② 待裝配的機器語言模塊，當需要執行時，由連接裝入程序把它們和某些運行程序連接起來，轉換成能執行的機器語言代碼；
③ 匯編語言代碼，須經過匯編程序匯編後，成為可執行的機器語言代碼。
目標代碼生成階段應考慮直接影響到目標代碼速度的三個問題：一是如何生成較短的目標代碼；二是如何充分利用計算機中的寄存器，減少目標代碼訪問存儲單元的次數；三是如何充分利用計算機指令系統的特點，以提高目標代碼的質量。
編譯器，是將便於人編寫，閱讀，維護的高級計算機語言翻譯為計算機能解讀、運行的低階機器語言的程序。編譯器將原始程序（Source program）作為輸入，翻譯產生使用目標語言（Target language）的等價程序。源代碼一般為高階語言 (High-level language), 如 Pascal、C++、Java 等，而目標語言則是匯編語言或目標機器的目標代碼（Object code），有時也稱作機器代碼（Machine code）。
一個現代編譯器的主要工作流程如下：
源代碼 (source code) → 預處理器 (preprocessor) → 編譯器 (compiler) → 匯編程序 (assembler) → 目標代碼 (object code) → 連接器 (Linker) → 可執行程序 (executables)

工作原理
[編輯本段]

編譯是從源代碼（通常為高階語言）到能直接被計算機或虛擬機執行的目標代碼（通常為低階語言或機器語言）的翻譯過程。然而，也存在從低階語言到高階語言的編譯器，這類編譯器中用來從由高階語言生成的低階語言代碼重新生成高階語言代碼的又被叫做反編譯器。也有從一種高階語言生成另一種高階語言的編譯器，或者生成一種需要進一步處理的的中間代碼的編譯器（又叫級聯）。
典型的編譯器輸出是由包含入口點的名字和地址, 以及外部調用（到不在這個目標文件中的函數調用）的機器代碼所組成的目標文件。一組目標文件，不必是同一編譯器產生，但使用的編譯器必需採用同樣的輸出格式，可以鏈接在一起並生成可以由用戶直接執行的可執行程序。

編譯器種類
[編輯本段]

編譯器可以生成用來在與編譯器本身所在的計算機和操作系統（平台）相同的環境下運行的目標代碼，這種編譯器又叫做「本地」編譯器。另外，編譯器也可以生成用來在其它平台上運行的目標代碼，這種編譯器又叫做交叉編譯器。交叉編譯器在生成新的硬體平台時非常有用。「源碼到源碼編譯器」是指用一種高階語言作為輸入，輸出也是高階語言的編譯器。例如: 自動並行化編譯器經常採用一種高階語言作為輸入，轉換其中的代碼，並用並行代碼注釋對它進行注釋（如OpenMP）或者用語言構造進行注釋（如FORTRAN的DOALL指令）。

預處理器（preprocessor）

作用是通過代入預定義等程序段將源程序補充完整。

編譯器前端（frontend）

前端主要負責解析（parse）輸入的源代碼，由語法分析器和語意分析器協同工作。語法分析器負責把源代碼中的『單詞』（Token）找出來,語意分析器把這些分散的單詞按預先定義好的語法組裝成有意義的表達式，語句，函數等等。例如「a = b + c;」前端語法分析器看到的是「a, =, b , +, c;」，語意分析器按定義的語法，先把他們組裝成表達式「b + c」，再組裝成「a = b + c」的語句。前端還負責語義（semantic checking）的檢查，例如檢測參與運算的變數是否是同一類型的，簡單的錯誤處理。最終的結果常常是一個抽象的語法樹（abstract syntax tree，或 AST），這樣後端可以在此基礎上進一步優化，處理。

編譯器後端（backend）

編譯器後端主要負責分析，優化中間代碼（Intermediate representation）以及生成機器代碼（Code Generation）。

一般說來所有的編譯器分析，優化，變型都可以分成兩大類：函數內（intraproceral）還是函數之間（interproceral）進行。很明顯，函數間的分析，優化更准確，但需要更長的時間來完成。

編譯器分析（compiler analysis）的對象是前端生成並傳遞過來的中間代碼，現代的優化型編譯器（optimizing compiler）常常用好幾種層次的中間代碼來表示程序，高層的中間代碼（high level IR）接近輸入的源代碼的格式，與輸入語言相關（language dependent），包含更多的全局性的信息，和源代碼的結構；中層的中間代碼（middle level IR）與輸入語言無關，低層的中間代碼(Low level IR)與機器語言類似。不同的分析，優化發生在最適合的那一層中間代碼上。

常見的編譯分析有函數調用樹（call tree），控制流程圖（Control flow graph），以及在此基礎上的變數定義－使用，使用－定義鏈（define-use/use-define or u-d/d-u chain），變數別名分析（alias analysis），指針分析（pointer analysis），數據依賴分析（data dependence analysis）等等。

上述的程序分析結果是編譯器優化（compiler optimization）和程序變形（compiler transformation）的前提條件。常見的優化和變新有：函數內嵌（inlining），無用代碼刪除（Dead code elimination），標准化循環結構（loop normalization），循環體展開（loop unrolling），循環體合並，分裂（loop fusion，loop fission），數組填充（array padding），等等。優化和變形的目標是減少代碼的長度，提高內存（memory），緩存（cache）的使用率，減少讀寫磁碟，訪問網路數據的頻率。更高級的優化甚至可以把序列化的代碼（serial code）變成並行運算，多線程的代碼（parallelized，multi-threaded code）。

機器代碼的生成是優化變型後的中間代碼轉換成機器指令的過程。現代編譯器主要採用生成匯編代碼（assembly code）的策略，而不直接生成二進制的目標代碼（binary object code）。即使在代碼生成階段，高級編譯器仍然要做很多分析，優化，變形的工作。例如如何分配寄存器（register allocatioin），如何選擇合適的機器指令（instruction selection），如何合並幾句代碼成一句等等。

編譯語言與直譯語言對比
[編輯本段]

許多人將高階程序語言分為兩類: 編譯型語言和直譯型語言。然而，實際上，這些語言中的大多數既可用編譯型實現也可用直譯型實現，分類實際上反映的是那種語言常見的實現方式。（但是，某些直譯型語言，很難用編譯型實現。比如那些允許在線代碼更改的直譯型語言。）

歷史
[編輯本段]

上世紀50年代，IBM的John Backus帶領一個研究小組對FORTRAN語言及其編譯器進行開發。但由於當時人們對編譯理論了解不多，開發工作變得既復雜又艱苦。與此同時，Noam Chomsky開始了他對自然語言結構的研究。他的發現最終使得編譯器的結構異常簡單，甚至還帶有了一些自動化。Chomsky的研究導致了根據語言文法的難易程度以及識別它們所需要的演算法來對語言分類。正如現在所稱的Chomsky架構（Chomsky Hierarchy），它包括了文法的四個層次：0型文法、1型文法、2型文法和3型文法，且其中的每一個都是其前者的特殊情況。2型文法（或上下文無關文法）被證明是程序設計語言中最有用的，而且今天它已代表著程序設計語言結構的標准方式。分析問題（parsing problem，用於上下文無關文法識別的有效演算法）的研究是在60年代和70年代，它相當完善的解決了這個問題。現在它已是編譯原理中的一個標准部分。

有限狀態自動機（Finite Automaton）和正則表達式（Regular Expression）同上下文無關文法緊密相關，它們與Chomsky的3型文法相對應。對它們的研究與Chomsky的研究幾乎同時開始，並且引出了表示程序設計語言的單詞的符號方式。

人們接著又深化了生成有效目標代碼的方法，這就是最初的編譯器，它們被一直使用至今。人們通常將其稱為優化技術（Optimization Technique），但因其從未真正地得到過被優化了的目標代碼而僅僅改進了它的有效性，因此實際上應稱作代碼改進技術（Code Improvement Technique）。

當分析問題變得好懂起來時，人們就在開發程序上花費了很大的功夫來研究這一部分的編譯器自動構造。這些程序最初被稱為編譯器的編譯器（Compiler-compiler），但更確切地應稱為分析程序生成器（Parser Generator），這是因為它們僅僅能夠自動處理編譯的一部分。這些程序中最著名的是Yacc（Yet Another Compiler-compiler），它是由Steve Johnson在1975年為Unix系統編寫的。類似的，有限狀態自動機的研究也發展了一種稱為掃描程序生成器（Scanner Generator）的工具，Lex（與Yacc同時，由Mike Lesk為Unix系統開發）是這其中的佼佼者。

在70年代後期和80年代早期，大量的項目都貫注於編譯器其它部分的生成自動化，這其中就包括了代碼生成。這些嘗試並未取得多少成功，這大概是因為操作太復雜而人們又對其不甚了解。

編譯器設計最近的發展包括：首先，編譯器包括了更加復雜演算法的應用程序它用於推斷或簡化程序中的信息；這又與更為復雜的程序設計語言的發展結合在一起。其中典型的有用於函數語言編譯的Hindley-Milner類型檢查的統一演算法。其次，編譯器已越來越成為基於窗口的交互開發環境（Interactive Development Environment，IDE）的一部分，它包括了編輯器、連接程序、調試程序以及項目管理程序。這樣的IDE標准並沒有多少，但是對標準的窗口環境進行開發已成為方向。另一方面，盡管近年來在編譯原理領域進行了大量的研究，但是基本的編譯器設計原理在近20年中都沒有多大的改變，它現在正迅速地成為計算機科學課程中的中心環節。

在九十年代，作為GNU項目或其它開放源代碼項目標一部分，許多免費編譯器和編譯器開發工具被開發出來。這些工具可用來編譯所有的計算機程序語言。它們中的一些項目被認為是高質量的，而且對現代編譯理論感興趣的人可以很容易的得到它們的免費源代碼。

大約在1999年，SGI公布了他們的一個工業化的並行化優化編譯器Pro64的源代碼，後被全世界多個編譯器研究小組用來做研究平台，並命名為Open64。Open64的設計結構好，分析優化全面，是編譯器高級研究的理想平台。

⑧ 編譯過程中,源程序為什麼要通過中間代碼生成目標程序

源程序是指程序員編寫的代碼，可以被編譯程序編譯為目標程序。
如果是c++，那麼後綴為.cpp
目標程序是編譯程序將源程序編譯後的結果，如果是c++，那麼後綴是.o
編譯程序一般是編譯器公司（比如微軟
intel他們都生產編譯器）做的，它將源代碼轉化為機器可識別的文件，經過鏈接，生成可執行程序。
解釋程序即解釋器，它不需要經過編譯階段即可根據用戶源程序執行。
程序語言分編譯類和解釋類語言。

⑨ 程序的編譯與解釋有什麼區別

程序的編譯和解釋不是那麼容易解釋清楚的，建議先了解一下基本的知識，如果想要詳細了解的話，建議去查一下，專業的書籍。

解釋型語言的實現中，翻譯器並不產生目標機器代碼，而是產生易於執行的中間代碼，這種中間代碼與機器代碼是不同的，中間代碼的解釋是由軟體支持的，不能直接使用硬體，軟體解釋器通常會導致執行效率較低。對於解釋型Basic語言，需要一個專門的解釋器解釋執行Basic程序，每條語言只有在執行才被翻譯。這種解釋型語言每執行一次就翻譯一次，因而效率低下。

⑩ 編譯原理全部的名詞解釋

書上有別那麼懶!.
編譯過程的六個階段：詞法分析,語法分析,語義分析,中間代碼生成,代碼優化,目標代碼生成
解釋程序：把某種語言的源程序轉換成等價的另一種語言程序——目標語言程序,然後再執行目標程序.解釋方式是接受某高級語言的一個語句輸入,進行解釋並控制計算機執行,馬上得到這句的執行結果,然後再接受下一句.
編譯程序：就是指這樣一種程序,通過它能夠將用高級語言編寫的源程序轉換成與之在邏輯上等價的低級語言形式的目標程序(機器語言程序或匯編語言程序).
解釋程序和編譯程序的根本區別：是否生成目標代碼
句子的二義性（這里的二義性是指語法結構上的.）:文法G[S]的一個句子如果能找到兩種不同的最左推導(或最右推導),或者存在兩棵不同的語法樹,則稱這個句子是二義性的.
文法的二義性:一個文法如果包含二義性的句子,則這個文法是二義文法,否則是無二義文法.
LL(1)的含義：(LL(1)文法是無二義的； LL(1)文法不含左遞歸)
第1個L：從左到右掃描輸入串第2個L：生成的是最左推導
1 ：向右看1個輸入符號便可決定選擇哪個產生式
某些非LL(1)文法到LL(1)文法的等價變換: 1. 提取公因子 2. 消除左遞歸
文法符號的屬性:單詞的含義,即與文法符號相關的一些信息.如,類型、值、存儲地址等.
一個屬性文法(attribute grammar)是一個三元組A=(G, V, F)
G：上下文無關文法.
V：屬性的有窮集.每個屬性與文法的一個終結符或非終結符相連.屬性與變數一樣,可以進行計算和傳遞.
F：關於屬性的斷言或謂詞(一組屬性的計算規則)的有窮集.斷言或語義規則與一個產生式相聯,只引用該產生式左端或右端的終結符或非終結符相聯的屬性.
綜合屬性:若產生式左部的單非終結符A的屬性值由右部各非終結符的屬性值決定,則A的屬性稱為綜合屬
繼承屬性:若產生式右部符號B的屬性值是根據左部非終結符的屬性值或者右部其它符號的屬性值決定的,則B的屬性為繼承屬性.
(1)非終結符既可有綜合屬性也可有繼承屬性,但文法開始符號沒有繼承屬性.
(2) 終結符只有綜合屬性,沒有繼承屬性,它們由詞法程序提供.
在計算時：綜合屬性沿屬性語法樹向上傳遞；繼承屬性沿屬性語法樹向下傳遞.
語法制導翻譯：是指在語法分析過程中,完成附加在所使用的產生式上的語義規則描述的動作.
語法制導翻譯實現：對單詞符號串進行語法分析,構造語法分析樹,然後根據需要構造屬性依賴圖,遍歷語法樹並在語法樹的各結點處按語義規則進行計算.
中間代碼（中間語言）
1、是復雜性介於源程序語言和機器語言的一種表示形式.
2、一般,快速編譯程序直接生成目標代碼.
3、為了使編譯程序結構在邏輯上更為簡單明確,常採用中間代碼,這樣可以將與機器相關的某些實現細節置於代碼生成階段仔細處理,並且可以在中間代碼一級進行優化工作,使得代碼優化比較容易實現.
何謂中間代碼：源程序的一種內部表示,不依賴目標機的結構,易於代碼的機械生成.
為何要轉換成中間代碼:(1)邏輯結構清楚；利於不同目標機上實現同一種語言.
(2)便於移植,便於修改,便於進行與機器無關的優化.
中間代碼的幾種形式：逆波蘭記號 ,三元式和樹形表示 ,四元式
符號表的一般形式：一張符號表的的組成包括兩項,即名字欄和信息欄.
信息欄包含許多子欄和標志位,用來記錄相應名字和種種不同屬性,名字欄也稱主欄.主欄的內容稱為關鍵字（key word）.
符號表的功能：（1）收集符號屬性 (2) 上下文語義的合法性檢查的依據：檢查標識符屬性在上下文中的一致性和合法性.(3)作為目標代碼生成階段地址分配的依據
符號的主要屬性及作用：
1. 符號名 2. 符號的類型（整型、實型、字元串型等））3. 符號的存儲類別（公共、私有）
4. 符號的作用域及可視性（全局、局部） 5. 符號變數的存儲分配信息（靜態存儲區、動態存儲區）
存儲分配方案策略：靜態存儲分配；動態存儲分配：棧式、堆式.
靜態存儲分配
1、基本策略
在編譯時就安排好目標程序運行時的全部數據空間,並能確定每個數據項的單元地址.
2、適用的分配對象：子程序的目標代碼段；全局數據目標（全局變數）
3、靜態存儲分配的要求：不允許遞歸調用,不含有可變數組.
FORTRAN程序是段結構,不允許遞歸,數據名大小、性質固定. 是典型的靜態分配
動態存儲分配
1、如果一個程序設計語言允許遞歸過程、可變數組或允許用戶自由申請和釋放空間,那麼,就需要採用動態存儲管理技術.
2、兩種動態存儲分配方式：棧式,堆式
棧式動態存儲分配
分配策略：將整個程序的數據空間設計為一個棧.
【例】在具有遞歸結構的語言程序中,每當調用一個過程時,它所需的數據空間就分配在棧頂,每當過程工作結束時就釋放這部分空間.
過程所需的數據空間包括兩部分
一部分是生存期在本過程這次活動中的數據對象.如局部變數、參數單元、臨時變數等；
另一部分則是用以管理過程活動的記錄信息(連接數據).
活動記錄（AR）
一個過程的一次執行所需要的信息使用一個連續的存儲區來管理,這個區 (塊)叫做一個活動記錄.
構成
1、臨時工作單元；2、局部變數；3、機器狀態信息；4、存取鏈；
5、控制鏈；6、實參；7、返回地址
什麼是代碼優化
所謂優化,就是對代碼進行等價變換,使得變換後的代碼運行結果與變換前代碼運行結果相同,而運行速度加快或佔用存儲空間減少.
優化原則：等價原則：經過優化後不應改變程序運行的結果.
有效原則：使優化後所產生的目標代碼運行時間較短,佔用的存儲空間較小.
合算原則：以盡可能低的代價取得較好的優化效果.
常見的優化技術
(1) 刪除多餘運算(刪除公共子表達式) (2) 代碼外提 +刪除歸納變數+ (3)強度削弱; (4)變換循環控制條件 (5)合並已知量與復寫傳播 (6)刪除無用賦值
基本塊定義
程序中只有一個入口和一個出口的一段順序執行的語句序列,稱為程序的一個基本塊.
給我分數啊.

導航:首頁 > 源碼編譯 > 便於與編譯

便於與編譯

與便於與編譯相關的資料