c程序編譯的秘密_C語言源程序的編譯過程包括哪三個階段

㈠編譯程序包括哪幾個主要組成部分

編譯過程分為分析和綜合兩個部分，並進一步劃分為詞法分析、語法分析、語義分析、代碼優化、存儲分配和代碼生成等六個相繼的邏輯步驟。這六個步驟只表示編譯程序各部分之間的邏輯聯系，而不是時間關系。

編譯過程既可以按照這六個邏輯步驟順序地執行，也可以按照平行互鎖方式去執行。在確定編譯程序的具體結構時，常常分若干遍實現。對於源程序或中間語言程序，從頭到尾掃視一次並實現所規定的工作稱作一遍。每一遍可以完成一個或相連幾個邏輯步驟的工作。

(1)c程序編譯的秘密擴展閱讀：

對於c編譯程序來說，其語言的特點如下：

1、c語言是一種結構化語言。它層次清晰，便於按模塊化方式組織程序，易於調試和維護，而且表現能力和處理能力極強。

2、c語言具有豐富的運算符和數據類型，便於實現各類復雜的數據結構。它還可以直接訪問內存的物理地址，進行位(bit)一級的操作。

3、由於c語言實現了對硬體的編程操作，因此集高級語言和低級語言的功能於一體。它既可用於系統軟體的開發，也適合於應用軟體的開發。

4、此外，c語言還具有效率高、可移植性強等特點。因此它廣泛地移植到了各類各型計算機上，從而形成了多種版本。

㈡ C語言為什麼要先編譯成匯編語言

C語言，具有可移植性，或者說同樣的代碼可以在不同cpu平台上運行得到同樣的結果
匯編語言，移植性差，一般針對某型cpu，每個類型的cpu都有自己的匯編語言
為保證C語言編制的通用演算法的可移植性，比如我們用C編寫了一套mp3解碼演算法程序，要在pc機上、手機上都能用，那麼我們就採用通用的C編譯器，將C語言程序編譯成指定CPU的匯編語言，再匯編成機器可執行程序。
另一個用途是程序優化問題，在C語言層次，由於是高級語言，不涉及底層硬體，那麼底層硬體的特性不能夠得到充分利用，在需要優化演算法的場合，我們需要將C語言演算法編譯生成匯編程序，然後修改需要優化的匯編程序達到目的。比如，你在手機上經常會遇到音頻解碼器，需要安裝，而且不同的cpu需要選擇不同的解碼器，這些解碼器應當就是在匯編層次上優化了演算法的可執行代碼，關鍵部分經過匯編級優化，不需要優化部分仍然使用C語言編譯的結果。

㈢關於C語言編譯階段的一些問題

呵呵，找一本好書吧。我不能完全給你寫清楚，"sting.h"的拼寫已經有人說了。
簡單地說，要理解幾種文件：
A：源文件：例如匯編（asm）、c語言、cpp
B：目標文件
C：庫文件（lib）
D：可執行文件

A經過編譯器得到B，若干個B可以經過庫管理程序得到C，C也可以通過庫管理程序得到B（提取）
若干個B通過鏈接器可以得到D，但是比如strcmp是出現在C中的，但實際上鏈接器會到C中提取出strcmp所在的B，然後將這個B放入到你的D中。整過過程是一個求閉包的過程，具體參見《Linker and Loader》。

最後說說.h，其實.h本身並不是必要的，但是它可以減少人們的錯誤，減少重復的代碼。
比如printf，你完全可以不include<stdio.h>，你就自己寫上一行：
int printf(...);
然後你後面就是直接使用就好了，但是這樣會有很多缺陷，這些缺陷可能只有你深刻地理解C語言本身的缺陷後才能明白，不多說了。

㈣ C語言源程序的編譯過程包括哪三個階段

編譯：將源程序轉換為擴展名為.obj的二進制代碼
連接：將obj文件進行連接，加入庫函數等生成可執行文件
運行：執行可執行文件，有錯返回修改，無錯結束

㈤ C語言這么厲害，它自身又是用什麼語言寫的編寫過程被稱為自舉

來自一個小白的提問： 「C語言本身用什麼語言寫的？」

換個角度來問，其實是：C語言在運行之前，得編譯才行，那C語言的編譯器從哪裡來？用什麼語言來寫的？如果是用C語言本身來寫的，到底是先有蛋還是先有雞？

我們假設世界上不存在任何編譯器，先從機器語言說起，看看怎麼辦。

機器語言可以直接被CPU執行，不需要編譯器。

然後是匯編語言，匯編語言雖然只是機器語言的助記符，但是也需要編譯成機器語言才能執行，沒辦法只能用機器語言來寫這第一個編譯器了（以後就不用了）。

匯編語言的問題解決了，就往前邁進了一大步，這時候就可以用匯編語言去寫C語言的編譯器，我們說這是C編譯器的老祖宗。

有了這個老祖宗，就可以編譯任意的C語言程序了，那是不是可以用C語言本身寫一個編譯器？只要用老祖宗編譯一下就可以了。

OK，這么一層層上來，終於得到了一個用C語言寫的編譯器，真是夠麻煩的。

到這個時候，之前那個匯編寫的C語言編譯器就可以拋棄了。

當然，如果在C語言之前，已經出現了別的高級語言，例如Pascal，那就可以用Pascal來寫一個C語言的編譯器。

第一個Pascal的編譯器據說使用Fortran寫的。而作為第一個高級語言的Fortran，它的編譯器應該是匯編語言寫的。

關於編譯器，這里邊有個有趣的傳說：

傳說Unix 發明人之一的 Ken Thompson在貝爾實驗室，大搖大擺的走到任何一台Unix機器前，輸入自己的用戶名和密碼，就能以root的方式登錄！

貝爾實驗室人才濟濟，另外一些大牛發誓要把這個漏洞找出來，他們通讀了Unix的C源碼，終於找到了登錄的後門，清理後門以後編譯Unix , 運行，可是Thompson 還是能夠登錄進去。

有人覺得可能是編譯器中有問題，在編譯Unix的時候植入了後門，於是他們又用C語言重新寫了一個編譯器，用新的編譯器再次編譯了Unix，這下總算天下太平了吧。

可是仍然不管用， Thompson 依然可以用root登錄，真是讓人崩潰！

後來Thompson 本人解開了秘密，是第一個C 語言編譯器有問題，這個編譯器在編譯Unix源碼的時候，當然會植入後門，這還不夠，更牛的是，如果你用C 語言寫了一個新編譯器，肯定也需要編譯成二進制代碼啊，用什麼來編譯，只有用Thompson寫的那第一個編譯器來編譯，好了，你寫的這個編譯器就會被污染了，你的編譯器再去編譯Unix , 也會植入後門 :-)

說到這里我就想起了幾年前的XcodeGhost 事件，簡單來說就是在Xcode（非官方渠道下載的）中植入了木馬，這樣XCode編譯出的ios app都被污染了，這些app就可以被黑客利用做非法之事。

雖然這個XCodeGhost和Thompson的後面相比差得遠，但是提醒我們，下載軟體的時候要走正規渠道，從官方網站下載，認准網站的HTTPS標准，甚至可以驗證一下checksum。

可能有人問：我用匯編寫一段Hello World都很麻煩，居然有人可以用它寫復雜的編譯器？這可能嗎？

當然可能，在開發第一代Unix的時候，連C語言都沒有， Ken Thompson 和 Dennis Ritchie 可是用匯編一行行把Unix敲出來的。 WPS第一版是求伯君用匯編寫出來的， Turbo Pascal 的編譯器也是Anders 用匯編寫出來的，大神們的能力不是普通人能想像得到的。

對於編譯器來說，還可以採用「滾雪球」的方式來開發：

還是以C語言為例，第一個版本可以先選擇C語言的一個子集，例如只支持基本的數據類型，流程式控制制語句，函數調用...... 我們把這個子集稱為C0。

然後用匯編語言寫個編譯器，只搞定這個語言的子集C0，這樣寫起來就容易不少。

C0這個語言可以工作了，然後我們擴展這個子集，例如添加struct，指針...... ，把新的語言稱為C1。

那C1這個語言的編譯器由誰來寫？自然是C0。

等到C1可以工作了，再次擴展語言特性，用C1寫編譯器，得到C2。

然後是C3, C4...... 最後得到完整的C語言。

這個過程被稱為bootstraping ，中文叫做自舉。

對於熱愛編程的人來說，有一群一起學習一起解答的小夥伴很重要！

這里有一個 C/C++編程學習交流俱樂部 （群），私信我【01】進入！

還有編程學習文件（源碼，零基礎教程，項目實戰教學視頻），歡迎初學者和正在進階中的小夥伴們！

㈥ C語言中條件編譯的作用

條件編譯屬於三種宏定義中的一種，條件指示符的最主要目的是防止頭文件的重復包含和編譯，例如:一個c文件包含同一個h文件多次，如果不加#ifndef宏定義，會出現變數重復定義的錯誤

條件編譯常用的有四個預處理命令：#if、#else、#elif、#endif。

#if指令的形式為：

#if常量表達式
代碼塊
#endif

#if後面的常量表達式為值，則編譯它與#endif之間的代碼，否則跳過這些代碼。指令#endif標識一個#if塊的結束。

#else被使用來標志#if的末尾和#else塊的開始。這是必須的，因為任何#if僅有一個#endif與之關聯。

#elif意指"else if"，它形成一個if else if嵌套語句用於多種編譯選擇。#elif後面跟一個常量表達式，如果表達式是真，則編譯其後的代碼塊，不對其他#elif表達式進行檢測，否則順序測試下一塊。常見的形式如下：

形式1:

#ifdef標識符
/*程序段1*/
#else
/*程序段2*/
#endif

它的作用是當標識符已經由#define定義過了,則編譯程序段1,否則編譯程序段2，也可以使用簡單形式

#ifdef標識符
/*程序段1*/
#endif

形式2:

#ifndef標識符
#define標識符
/*程序段1*/
#else
/*程序段2*/
#endif

它的作用是當標識符沒有由#define定義過,則編譯程序段1,否則編譯程序段2 ，也可以使用簡單形式

#ifndef標識符
#define標識符
/*程序段1*/
#endif

形式3:

#if表達式
/*程序段1*/
#else
*程序段2*/
#endif

它的作用是當「表達式」值為真時編譯程序段1。否則則編譯程序段2,也可以使用簡單形式

#if表達式
/*程序段1*/
#endif

形式4:

#if表達式1
/*程序段1*/
#elif表達式2
/*程序段2*/
............
#elif表達式n
/*程序段n*/
#endif

它的作用是當「表達式1」值為1時編譯程序段1，表達式2的值為真是編譯程序段2,否則依次順序判斷到表達式n。

最後，條件編譯的條件是一個常量表達式，支持邏輯與&&和或||運算。以上四種形式的條件編譯預處理結構都可以嵌套使用，

標識符: 在理論上來說可以是自由命名的，但每個頭文件的這個標識符都應該是唯一的。標識的命名規則一般是頭文件名全大寫，前後加下劃線，並把文件名中的「.」也變成下劃線，如：stdio.h。

#ifndef_STDIO_H_
#define_STDIO_H_
/*程序段*/
#endif

導航:首頁 > 源碼編譯 > c程序編譯的秘密

c程序編譯的秘密

與c程序編譯的秘密相關的資料