關於編譯器後端_什麼是編譯器

㈠連接編譯器的前端和後端的介面是

中間語言。連接編譯器的前端和後端的介面是中間語言。編譯器的整體實現分成前端和後端，連接前端和後端的是一個代表SDK的中間表示。

㈡編譯前端和後端各有什麼特點,各自包含編譯過程的哪幾個部分

編譯前端主要包括詞法分析、語法分析、語義分析、中間代碼生成這幾個部分，後端則包含代碼優化和目標代碼生成部分。前端的特點是僅與編譯的源語言有關，而後端則僅與編譯的目標語言及運行環境有關。

將編譯過程劃分成前端和後端，主要目的是在多種源語言和多種目標語言的開發過程中，可以靈活搭配組合，消除重復開發的工作量，提高編譯系統的開發效率。

㈢什麼是編譯器里的前端和後端

參考答案快樂不是因為得到的多而是因為計較的少！

㈣什麼是編譯器

編譯器

編譯器是一種特殊的程序，它可以把以特定編程語言寫成的程序變為機器可以運行的機器碼。我們把一個程序寫好，這時我們利用的環境是文本編輯器。這時我程序把程序稱為源程序。在此以後程序員可以運行相應的編譯器，通過指定需要編譯的文件的名稱就可以把相應的源文件（通過一個復雜的過程）轉化為機器碼了。

[編輯]編譯器工作方法
首先編譯器進行語法分析，也就是要把那些字元串分離出來。然後進行語義分析，就是把各個由語法分析分析出的語法單元的意義搞清楚。最後生成的是目標文件，我們也稱為obj文件。再經過鏈接器的鏈接就可以生成最後的可執行代碼了。有些時候我們需要把多個文件產生的目標文件進行鏈接，產生最後的代碼。我們把一過程稱為交叉鏈接。

一個現代編譯器的主要工作流程如下：

* 源程序（source code）→預處理器（preprocessor）→編譯器（compiler）→匯編程序（assembler）→目標程序（object code）→連接器（鏈接器，Linker）→可執行程序（executables）

工作原理

編譯是從源代碼（通常為高級語言）到能直接被計算機或虛擬機執行的目標代碼（通常為低級語言或機器言）。然而，也存在從低級語言到高級語言的編譯器，這類編譯器中用來從由高級語言生成的低級語言代碼重新生成高級語言代碼的又被叫做反編譯器。也有從一種高級語言生成另一種高級語言的編譯器，或者生成一種需要進一步處理的的中間代碼的編譯器（又叫級聯）。

典型的編譯器輸出是由包含入口點的名字和地址以及外部調用（到不在這個目標文件中的函數調用）的機器代碼所組成的目標文件。一組目標文件，不必是同一編譯器產生，但使用的編譯器必需採用同樣的輸出格式，可以鏈接在一起並生成可以由用戶直接執行的可執行程序。

編譯器種類

編譯器可以生成用來在與編譯器本身所在的計算機和操作系統（平台）相同的環境下運行的目標代碼，這種編譯器又叫做「本地」編譯器。另外，編譯器也可以生成用來在其它平台上運行的目標代碼，這種編譯器又叫做交叉編譯器。交叉編譯器在生成新的硬體平台時非常有用。「源碼到源碼編譯器」是指用一種高級語言作為輸入，輸出也是高級語言的編譯器。例如: 自動並行化編譯器經常採用一種高級語言作為輸入，轉換其中的代碼，並用並行代碼注釋對它進行注釋（如OpenMP）或者用語言構造進行注釋（如FORTRAN的DOALL指令）。

預處理器（preprocessor）

作用是通過代入預定義等程序段將源程序補充完整。

編譯器前端（frontend）

前端主要負責解析（parse）輸入的源程序，由詞法分析器和語法分析器協同工作。詞法分析器負責把源程序中的『單詞』（Token）找出來,語法分析器把這些分散的單詞按預先定義好的語法組裝成有意義的表達式，語句，函數等等。例如「a = b + c;」前端詞法分析器看到的是「a, =, b , +, c;」，語法分析器按定義的語法，先把他們組裝成表達式「b + c」，再組裝成「a = b + c」的語句。前端還負責語義（semantic checking）的檢查，例如檢測參與運算的變數是否是同一類型的，簡單的錯誤處理。最終的結果常常是一個抽象的語法樹（abstract syntax tree，或 AST），這樣後端可以在此基礎上進一步優化，處理。

編譯器後端（backend）

編譯器後端主要負責分析，優化中間代碼（Intermediate representation）以及生成機器代碼（Code Generation）。

一般說來所有的編譯器分析，優化，變型都可以分成兩大類：函數內（intraproceral）還是函數之間（interproceral）進行。很明顯，函數間的分析，優化更准確，但需要更長的時間來完成。

編譯器分析（compiler analysis）的對象是前端生成並傳遞過來的中間代碼，現代的優化型編譯器（optimizing compiler）常常用好幾種層次的中間代碼來表示程序，高層的中間代碼（high level IR）接近輸入的源程序的格式，與輸入語言相關（language dependent），包含更多的全局性的信息，和源程序的結構；中層的中間代碼（middle level IR）與輸入語言無關，低層的中間代碼(Low level IR)與機器語言類似。不同的分析，優化發生在最適合的那一層中間代碼上。

常見的編譯分析有函數調用樹（call tree），控制流程圖（Control flow graph），以及在此基礎上的變數定義－使用，使用－定義鏈（define-use/use-define or u-d/d-u chain），變數別名分析（alias analysis），指針分析（pointer analysis），數據依賴分析（data dependence analysis）等等。

上述的程序分析結果是編譯器優化（compiler optimization）和程序變形（compiler transformation）的前提條件。常見的優化和變新有：函數內嵌（inlining），無用代碼刪除（Dead code elimination），標准化循環結構（loop normalization），循環體展開（loop unrolling），循環體合並，分裂（loop fusion，loop fission），數組填充（array padding），等等。優化和變形的目的是減少代碼的長度，提高內存（memory），緩存（cache）的使用率，減少讀寫磁碟，訪問網路數據的頻率。更高級的優化甚至可以把序列化的代碼（serial code）變成並行運算，多線程的代碼（parallelized，multi-threaded code）。

機器代碼的生成是優化變型後的中間代碼轉換成機器指令的過程。現代編譯器主要採用生成匯編代碼（assembly code）的策略，而不直接生成二進制的目標代碼（binary object code）。即使在代碼生成階段，高級編譯器仍然要做很多分析，優化，變形的工作。例如如何分配寄存器（register allocatioin），如何選擇合適的機器指令（instruction selection），如何合並幾句代碼成一句等等。

㈤編譯程序中間代碼的生成對編譯器的前端和後端有什麼作用

編譯器粗略分為詞法分析，語法分析，類型檢查，中間代碼生成，代碼優化，目標代碼生成，目標代碼優化。把中間代碼生成及之前階段劃分問編譯器的前端，那麼後端與前端是獨立的。後端只需要一種中間代碼表示，可以是三地址代碼或四元式等，而這些都與前端生成的方式無關。也就是不論你前端是用fortran還是c/c++,只要生成了中間代碼表示就可以了，後端是不管你是用哪種語言生成的。

㈥編譯程序為什麼有分前端和後端

隨著大家對瀏覽器頁面的視覺和交互要求越來越高，「套模板」的方式漸漸無法滿足要求，這個所謂的表示層慢慢地遷移到瀏覽器當中去了，一大批像Angular, ReactJS之類的框架崛起，前後端分離。

後端的工程師只負責提供介面和數據，專注於業務邏輯的實現，前端取到數據後在瀏覽器中展示，各司其職，這種分工能夠更好地節省時間，使產品的質量更好。

(6)關於編譯器後端擴展閱讀：

GCC編譯的前端將不同的高級編程語言經過詞法分析、語法分析轉化為與前端語言無關的統一的中間表示。有了與前端無關的中間表示，GCC的前端將不同的高級編程語言轉換成這種中間表示，這就是GCC處理器支持多種編程語言的根本原因。

前端編譯的主要作用，是將編寫的 .java 文件編譯成 .class 文件，也就是我們常說的位元組碼文件；位元組碼文件，裡麵包含了我們編寫的 .java 代碼中的運行邏輯，參數以及這些參數在內存中的分配。

㈦為什麼編譯器後端生成的是匯編而不是c語言

編譯器後端生成的應該是機器語言，也就是二進制語言。
匯編語言和機器語言一一對應，所以有時調試顯示的是匯編而已。
至於為什麼是機器語言而不是C，是因為編譯的目標是給機器運行用的，機器只能"看懂"機器語言。

㈧在c語言中「可執行程序」是什麼意思

C語言中的可執行程序就是將用文本信息表示的程序翻譯成計算機認識的二進制代碼串。

首先，我們先用C語言把源代碼寫好，然後交給C語言編譯器。C語言編譯器內部分為前端和後端。

（1）編譯器前端

前端負責將C語言代碼進行詞法和語法上的解析，然後可以生成中間代碼。

中間代碼這部分不是必須的，但是它能夠為程序的跨平台移植帶來諸多好處。比如，同樣的一份C語言源代碼在一台計算機上編譯完之後，生成一套中間代碼。

然後針對不同的目標平台（比如要將這一套代碼分別編譯成 ARM 處理器的二進制機器碼、MIPS 處理器的二進制機器碼以及 x86 處理器的二進制機器碼），只需要編寫相應目標平台的編譯器後端即可。

所以，這么做就可以把編譯器的前端與後端剝離開來（這在軟體工程上又可稱為解耦合），不同處理器廠商可以針對自家的處理器特性，對中間代碼生成到目標二進制代碼的過程再度進行優化。

（2）編譯器後端

接下來，由C語言編譯器後端生成源文件相應的目標文件。

目標文件在 Windows 系統上往往是.obj文件，而在 Unix/Linux 系統上往往是.o文件，C語言的源文件在所有平台上都統一用.c文件表示。

（3）鏈接器

最後，對於各個獨立的目標文件，通過連接器將它們合並成一個最終可執行文件。

(8)關於編譯器後端擴展閱讀:

起初，C語言沒有官方標准。1978年由美國電話電報公司(AT&T）貝爾實驗室正式發表了C語言。布萊恩·柯林漢（Brian Kernighan）和丹尼斯·里奇（Dennis Ritchie）出版了一本書，名叫《The C Programming Language》。

這本書被 C語言開發者們稱為K&R，很多年來被當作 C語言的非正式的標准說明。人們稱這個版本的 C語言為K&R C。

K&R C主要介紹了以下特色：

結構體（struct）類型

長整數（long int）類型

無符號整數（unsigned int）類型

把運算符=+和=-改為+=和-=。因為=+和=-會使得編譯器不知道使用者要處理i = -10還是i =- 10，使得處理上產生混淆。

即使在後來ANSI C標准被提出的許多年後，K&R C仍然是許多編譯器的最准要求，許多老舊的編譯器仍然運行K&R C的標准。

1970到80年代，C語言被廣泛應用，從大型主機到小型微機，也衍生了C語言的很多不同版本。

1983年，美國國家標准協會（ANSI）成立了一個委員會X3J11，來制定 C語言標准。

1989年，美國國家標准協會（ANSI）通過了C語言標准，被稱為ANSI X3.159-1989 "Programming Language C"。因為這個標準是1989年通過的，所以一般簡稱C89標准。有些人也簡稱ANSI C，因為這個標準是美國國家標准協會（ANSI）發布的。

1990年，國際標准化組織（ISO）和國際電工委員會（IEC）把C89標準定為C語言的國際標准，命名為ISO/IEC 9899:1990 - Programming languages -- C 。因為此標準是在1990年發布的，所以有些人把簡稱作C90標准。不過大多數人依然稱之為C89標准，因為此標准與ANSI C89標准完全等同。

1994年，國際標准化組織（ISO）和國際電工委員會（IEC）發布了C89標准修訂版，名叫ISO/IEC 9899:1990/Cor 1:1994 ，有些人簡稱為C94標准。

1995年，國際標准化組織（ISO）和國際電工委員會（IEC）再次發布了C89標准修訂版，名叫ISO/IEC 9899:1990/Amd 1:1995 - C Integrity ，有些人簡稱為C95標准。

C99標准

1999年1月，國際標准化組織（ISO）和國際電工委員會（IEC）發布了C語言的新標准，名叫ISO/IEC 9899:1999 - Programming languages -- C ，簡稱C99標准。這是C語言的第二個官方標准。

參考資料:網路-c語言

導航:首頁 > 源碼編譯 > 關於編譯器後端

關於編譯器後端

與關於編譯器後端相關的資料