聊一聊匯編的誕生與編譯器_編譯器的發展史

㈠匯編出現在操作系統之前最早的匯編編譯器應該是匯編寫的吧、（滿意答案多加分）

你講的那個時候就沒有操作系統。計算機最早的情況是利用插線孔的形式來選擇的計算電路。cpu執行二進製程序，這個時候還就是用機器語言來進行編程的，機器語言就是cpu的指令集。匯編語言的編譯器開始就是用機器語言來進行寫的。那時是復雜指令系統，每條指令都比較簡單，不像精簡指令集，一條指令可以表示多重意思。

㈡編譯器的發展史

編譯器
編譯器，是將便於人編寫，閱讀，維護的高級計算機語言翻譯為計算機能識別，運行的低級機器語言的程序。編譯器將源程序（Source program）作為輸入，翻譯產生使用目標語言（Target language）的等價程序。源程序一般為高級語言（High-level language），如Pascal，C++等，而目標語言則是匯編語言或目標機器的目標代碼（Object code），有時也稱作機器代碼（Machine code）。

一個現代編譯器的主要工作流程如下：

源程序（source code）→預處理器（preprocessor）→編譯器（compiler）→匯編程序（assembler）→目標程序（object code）→連接器（鏈接器，Linker）→可執行程序（executables）
目錄 [隱藏]
1 工作原理
2 編譯器種類
3 預處理器（preprocessor）
4 編譯器前端（frontend）
5 編譯器後端（backend）
6 編譯語言與解釋語言對比
7 歷史
8 參見

工作原理
翻譯是從源代碼（通常為高級語言）到能直接被計算機或虛擬機執行的目標代碼（通常為低級語言或機器言）。然而，也存在從低級語言到高級語言的編譯器，這類編譯器中用來從由高級語言生成的低級語言代碼重新生成高級語言代碼的又被叫做反編譯器。也有從一種高級語言生成另一種高級語言的編譯器，或者生成一種需要進一步處理的的中間代碼的編譯器（又叫級聯）。

典型的編譯器輸出是由包含入口點的名字和地址以及外部調用（到不在這個目標文件中的函數調用）的機器代碼所組成的目標文件。一組目標文件，不必是同一編譯器產生，但使用的編譯器必需採用同樣的輸出格式，可以鏈接在一起並生成可以由用戶直接執行的可執行程序。

編譯器種類
編譯器可以生成用來在與編譯器本身所在的計算機和操作系統（平台）相同的環境下運行的目標代碼，這種編譯器又叫做「本地」編譯器。另外，編譯器也可以生成用來在其它平台上運行的目標代碼，這種編譯器又叫做交叉編譯器。交叉編譯器在生成新的硬體平台時非常有用。「源碼到源碼編譯器」是指用一種高級語言作為輸入，輸出也是高級語言的編譯器。例如: 自動並行化編譯器經常採用一種高級語言作為輸入，轉換其中的代碼，並用並行代碼注釋對它進行注釋（如OpenMP）或者用語言構造進行注釋（如FORTRAN的DOALL指令）。

預處理器（preprocessor）
作用是通過代入預定義等程序段將源程序補充完整。

編譯器前端（frontend）
前端主要負責解析（parse）輸入的源程序，由詞法分析器和語法分析器協同工作。詞法分析器負責把源程序中的『單詞』（Token）找出來,語法分析器把這些分散的單詞按預先定義好的語法組裝成有意義的表達式，語句，函數等等。例如「a = b + c;」前端詞法分析器看到的是「a, =, b , +, c;」，語法分析器按定義的語法，先把他們組裝成表達式「b + c」，再組裝成「a = b + c」的語句。前端還負責語義（semantic checking）的檢查，例如檢測參與運算的變數是否是同一類型的，簡單的錯誤處理。最終的結果常常是一個抽象的語法樹（abstract syntax tree，或 AST），這樣後端可以在此基礎上進一步優化，處理。

編譯器後端（backend）
編譯器後端主要負責分析，優化中間代碼（Intermediate representation）以及生成機器代碼（Code Generation）。

一般說來所有的編譯器分析，優化，變型都可以分成兩大類：函數內（intraproceral）還是函數之間（interproceral）進行。很明顯，函數間的分析，優化更准確，但需要更長的時間來完成。

編譯器分析（compiler analysis）的對象是前端生成並傳遞過來的中間代碼，現代的優化型編譯器（optimizing compiler）常常用好幾種層次的中間代碼來表示程序，高層的中間代碼（high level IR）接近輸入的源程序的格式，與輸入語言相關（language dependent），包含更多的全局性的信息，和源程序的結構；中層的中間代碼（middle level IR）與輸入語言無關，低層的中間代碼(Low level IR)與機器語言類似。不同的分析，優化發生在最適合的那一層中間代碼上。

常見的編譯分析有函數調用樹（call tree），控制流程圖（Control flow graph），以及在此基礎上的變數定義－使用，使用－定義鏈（define-use/use-define or u-d/d-u chain），變數別名分析（alias analysis），指針分析（pointer analysis），數據依賴分析（data dependence analysis）等等。

上述的程序分析結果是編譯器優化（compiler optimization）和程序變形（compiler transformation）的前提條件。常見的優化和變新有：函數內嵌（inlining），無用代碼刪除（Dead code elimination），標准化循環結構（loop normalization），循環體展開（loop unrolling），循環體合並，分裂（loop fusion，loop fission），數組填充（array padding），等等。優化和變形的目的是減少代碼的長度，提高內存（memory），緩存（cache）的使用率，減少讀寫磁碟，訪問網路數據的頻率。更高級的優化甚至可以把序列化的代碼（serial code）變成並行運算，多線程的代碼（parallelized，multi-threaded code）。

機器代碼的生成是優化變型後的中間代碼轉換成機器指令的過程。現代編譯器主要採用生成匯編代碼（assembly code）的策略，而不直接生成二進制的目標代碼（binary object code）。即使在代碼生成階段，高級編譯器仍然要做很多分析，優化，變形的工作。例如如何分配寄存器（register allocatioin），如何選擇合適的機器指令（instruction selection），如何合並幾句代碼成一句等等。

編譯語言與解釋語言對比
許多人將高級程序語言分為兩類: 編譯型語言和解釋型語言。然而，實際上，這些語言中的大多數既可用編譯型實現也可用解釋型實現，分類實際上反映的是那種語言常見的實現方式。（但是，某些解釋型語言，很難用編譯型實現。比如那些允許在線代碼更改的解釋型語言。）

歷史
上世紀50年代，IBM的John Backus帶領一個研究小組對FORTRAN語言及其編譯器進行開發。但由於當時人們對編譯理論了解不多，開發工作變得既復雜又艱苦。與此同時，Noam Chomsky開始了他對自然語言結構的研究。他的發現最終使得編譯器的結構異常簡單，甚至還帶有了一些自動化。Chomsky的研究導致了根據語言文法的難易程度以及識別它們所需要的演算法來對語言分類。正如現在所稱的Chomsky架構（Chomsky Hierarchy），它包括了文法的四個層次：0型文法、1型文法、2型文法和3型文法，且其中的每一個都是其前者的特殊情況。2型文法（或上下文無關文法）被證明是程序設計語言中最有用的，而且今天它已代表著程序設計語言結構的標准方式。分析問題（parsing problem，用於上下文無關文法識別的有效演算法）的研究是在60年代和70年代，它相當完善的解決了這個問題。現在它已是編譯原理中的一個標准部分。

有限狀態自動機（Finite Automaton）和正則表達式（Regular Expression）同上下文無關文法緊密相關，它們與Chomsky的3型文法相對應。對它們的研究與Chomsky的研究幾乎同時開始，並且引出了表示程序設計語言的單詞的符號方式。

人們接著又深化了生成有效目標代碼的方法，這就是最初的編譯器，它們被一直使用至今。人們通常將其稱為優化技術（Optimization Technique），但因其從未真正地得到過被優化了的目標代碼而僅僅改進了它的有效性，因此實際上應稱作代碼改進技術（Code Improvement Technique）。

當分析問題變得好懂起來時，人們就在開發程序上花費了很大的功夫來研究這一部分的編譯器自動構造。這些程序最初被稱為編譯器的編譯器（Compiler-compiler），但更確切地應稱為分析程序生成器（Parser Generator），這是因為它們僅僅能夠自動處理編譯的一部分。這些程序中最著名的是Yacc（Yet Another Compiler-compiler），它是由Steve Johnson在1975年為Unix系統編寫的。類似的，有限狀態自動機的研究也發展了一種稱為掃描程序生成器（Scanner Generator）的工具，Lex（與Yacc同時，由Mike Lesk為Unix系統開發）是這其中的佼佼者。

在70年代後期和80年代早期，大量的項目都貫注於編譯器其它部分的生成自動化，這其中就包括了代碼生成。這些嘗試並未取得多少成功，這大概是因為操作太復雜而人們又對其不甚了解。

編譯器設計最近的發展包括：首先，編譯器包括了更加復雜演算法的應用程序它用於推斷或簡化程序中的信息；這又與更為復雜的程序設計語言的發展結合在一起。其中典型的有用於函數語言編譯的Hindley-Milner類型檢查的統一演算法。其次，編譯器已越來越成為基於窗口的交互開發環境（Interactive Development Environment，IDE）的一部分，它包括了編輯器、連接程序、調試程序以及項目管理程序。這樣的IDE標准並沒有多少，但是對標準的窗口環境進行開發已成為方向。另一方面，盡管近年來在編譯原理領域進行了大量的研究，但是基本的編譯器設計原理在近20年中都沒有多大的改變，它現在正迅速地成為計算機科學課程中的中心環節。

在九十年代，作為GNU項目或其它開放源代碼項目的一部分，許多免費編譯器和編譯器開發工具被開發出來。這些工具可用來編譯所有的計算機程序語言。它們中的一些項目被認為是高質量的，而且對現代編譯理論感性趣的人可以很容易的得到它們的免費源代碼。

大約在1999年，SGI公布了他們的一個工業化的並行化優化編譯器Pro64的源代碼，後被全世界多個編譯器研究小組用來做研究平台，並命名為Open64。Open64的設計結構好，分析優化全面，是編譯器高級研究的理想平台。

編譯器是一種特殊的程序，它可以把以特定編程語言寫成的程序變為機器可以運行的機器碼。我們把一個程序寫好，這時我們利用的環境是文本編輯器。這時我程序把程序稱為源程序。在此以後程序員可以運行相應的編譯器，通過指定需要編譯的文件的名稱就可以把相應的源文件（通過一個復雜的過程）轉化為機器碼了。

編譯器工作方法
首先編譯器進行語法分析，也就是要把那些字元串分離出來。然後進行語義分析，就是把各個由語法分析分析出的語法單元的意義搞清楚。最後生成的是目標文件，我們也稱為obj文件。再經過鏈接器的鏈接就可以生成最後的可執行代碼了。有些時候我們需要把多個文件產生的目標文件進行鏈接，產生最後的代碼。我們把一過程稱為交叉鏈接。

㈢匯編語言編譯器是怎麼來的

第一個軟體，顯然是用機器語言寫的。

當用機器語言寫成了文字處理軟體，才能用屏幕、鍵盤打字。

當用機器語言寫成了編譯軟體，才能把打好的字，編譯成機器碼。

㈣什麼是匯編，它與編譯有什麼不同

【匯編程序】：把匯編語言書寫的程序翻譯成與之等價的機器語言程序的翻譯程序。【編譯程序】：把用高級程序設計語言書寫的源程序，翻譯成等價的計算機匯編語言或機器語言的目標程序的翻譯程序。【解釋程序】：對源程序邊解釋翻譯成機器代碼邊執行的高級語言程序。高級語言的程序的執行的途徑：1）源程序（高級語言）->【編譯程序】->目標程序（匯編語言）->【匯編程序】->目標程序（機器語言）->計算結果2）源程序（高級語言）->【編譯程序】->目標程序（機器語言）->計算結果3）源程序（高級語言）->【解釋程序】（逐條讀出源程序中的語句並解釋執行，即在解釋程序的執行過程中並不產生目標程序）->計算結果

㈤匯編語言的編譯器是用什麼寫的呢

編譯器一般是用c寫的，最初的東西肯定是用機器語言寫的，我老師曾經用在紙帶上穿孔的辦法寫過程序。
他當時的願望是用鍵盤敲一個A就能輸入一個A,而不是出來一排孔。

㈥匯編語言的發展歷程

說到匯編語言的產生，首先要講一下機器語言。機器語言是機器指令的集合。機器指令展開來講就是一台機器可以正確執行的命令。電子計算機的機器指令是一列二進制數字。計算機將之轉變為一列高低電平，以使計算機的電子器件受到驅動，進行運算。
上面所說的計算機指的是可以執行機器指令，進行運算的機器。這是早期計算機的概念。在我們常用的PC機中，有一個晶元來完成上面所說的計算機的功能。這個晶元就是我們常說的CPU（Central Processing Unit，中央處理單元）。每一種微處理器，由於硬體設計和內部結構的不同，就需要用不同的電平脈沖來控制，使它工作。所以每一種微處理器都有自己的機器指令集，也就是機器語言。
早期的程序設計均使用機器語言。程序員們將用0, 1數字編成的程序代碼打在紙帶或卡片上，1打孔，0不打孔，再將程序通過紙帶機或卡片機輸入計算機，進行運算。這樣的機器語言由純粹的0和1構成，十分復雜，不方便閱讀和修改，也容易產生錯誤。程序員們很快就發現了使用機器語言帶來的麻煩，它們難於辨別和記憶，給整個產業的發展帶來了障礙，於是匯編語言產生了。
匯編語言的主體是匯編指令。匯編指令和機器指令的差別在於指令的表示方法上。匯編指令是機器指令便於記憶的書寫格式。操作：寄存器BX的內容送到AX中1000100111011000機器指令movax,bx匯編指令此後，程序員們就用匯編指令編寫源程序。可是，計算機能讀懂的只有機器指令，那麼如何讓計算機執行程序員用匯編指令編寫的程序呢？這時，就需要有一個能夠將匯編指令轉換成機器指令的翻譯程序，這樣的程序我們稱其為編譯器。程序員用匯編語言寫出源程序，再用匯編編譯器將其編譯為機器碼，由計算機最終執行。

㈦什麼是編譯程序和匯編程序

編譯程序是把用高級程序設計語言或計算機匯編語言書寫的源程序，翻譯成等價的機器語言格式目標程序的翻譯程序，屬於採用生成性實現途徑實現的翻譯程序。編譯程序以高級程序設計語言書寫的源程序作為輸入，而以匯編語言或機器語言表示的目標程序作為輸出；編譯出的目標程序通常還要經歷運行階段，以便在運行程序的支持下運行，加工初始數據，算出所需的計算結果。
匯編程序是指把匯編語言書寫的程序翻譯成與之等價的機器語言程序的翻譯程序，是為特定計算機或計算機系列設計的一種面向機器的語言，由匯編執行指令和匯編偽指令組成。匯編程序輸入的是用匯編語言書寫的源程序，輸出的是用機器語言表示的目標程序。採用匯編語言編寫程序雖不如高級程序設計語言簡便、直觀，但是匯編出的目標程序佔用內存較少、運行效率較高，且能直接引用計算機的各種設備資源。它通常用於編寫系統的核心部分程序，或編寫需要耗費大量運行時間和實時性要求較高的程序段。匯編程序主要有簡單匯編程序、模塊匯編程序、條件匯編程序、宏匯編程序、高級匯編程序幾種。

㈧關於編譯器的產生

編譯器本身也是程序，通常也是C語言寫的，世界上第一個編譯器的部分內容肯定只能用機器碼寫。。。但機器碼建立的一些文本處理功後，自然就用這個功能處理宏文本來代替機器碼。。。當然第一台計算機能用一種文本語言來代替機器碼，自然可以用這個簡單的編譯器去編譯復雜的編譯器，一個復雜的去編譯更復雜的。。。。
當然最終結果就是C語言編譯器本身也會是C語言寫的，區別只是PC機的C語言編譯器，去編譯一個非PC機上運行的程序的
程序的編譯器。。。。即使編譯器編譯編譯器。。。比如java編譯器是C/C++寫的。。。還有現在的某款晶元的匯編編譯器，本身會是C/c++語言寫的，因為編譯器也是程序，當然可以用C語言編譯器去編譯一個匯編編譯器。。。只就是錘子可以做機器，當然機器也可以生產錘子。。。

㈨匯編器和編譯器有什麼區別

匯編器（Assembler）是將匯編語言翻譯為機器語言的程序。一般而言，匯編生成的是目標代碼，需要經鏈接器（Linker）生成可執行代碼才可以執行。
匯編語言是一種以處理器指令系統為基礎的低級語言，採用助記符表達指令操作碼，採用標識符表示指令操作數。作為一門語言，對應於高級語言的編譯器，需要一個「匯編器」來把匯編語言原文件匯編成機器可執行的代碼。常用的高級語言編譯器有Microsoft公司的MASM系列和Borland公司的TASM系列編譯器，還有一些小公司推出的或者免費的匯編軟體包等。

編譯器就是將「一種語言（通常為高級語言）」翻譯為「另一種語言（通常為低級語言）」的程序。一個現代編譯器的主要工作流程：源代碼 (source code) → 預處理器 (preprocessor) → 編譯器 (compiler) → 目標代碼 (object code) → 鏈接器(Linker) → 可執行程序 (executables)
高級計算機語言便於人編寫，閱讀交流，維護。機器語言是計算機能直接解讀、運行的。編譯器將匯編或高級計算機語言源程序（Source program）作為輸入，翻譯成目標語言（Target language）機器代碼的等價程序。源代碼一般為高級語言 (High-level language)，如Pascal、C、C++、Java、漢語編程等或匯編語言，而目標則是機器語言的目標代碼（Object code），有時也稱作機器代碼（Machine code）。
對於C#、VB等高級語言而言，此時編譯器完成的功能是把源碼（SourceCode）編譯成通用中間語言（MSIL/CIL）的位元組碼（ByteCode）。最後運行的時候通過通用語言運行庫的轉換，編程最終可以被CPU直接計算的機器碼（NativeCode）

導航:首頁 > 源碼編譯 > 聊一聊匯編的誕生與編譯器

聊一聊匯編的誕生與編譯器

與聊一聊匯編的誕生與編譯器相關的資料