導航:首頁 > 源碼編譯 > 開發一個編譯器第一步做什麼

開發一個編譯器第一步做什麼

發布時間:2022-03-09 09:01:41

編譯器做什麼工作

1. 詞法分析 詞法分析器根據詞法規則識別出源程序中的各個記號(token),每個記號代表一類單詞(lexeme)。源程序中常見的記號可以歸為幾大類:關鍵字、標識符、字面量和特殊符號。詞法分析器的輸入是源程序,輸出是識別的記號流。詞法分析器的任務是把源文件的字元流轉換成記號流。本質上它查看連續的字元然後把它們識別為「單詞」。 2. 語法分析 語法分析器根據語法規則識別出記號流中的結構(短語、句子),並構造一棵能夠正確反映該結構的語法樹。 3. 語義分析 語義分析器根據語義規則對語法樹中的語法單元進行靜態語義檢查,如果類型檢查和轉換等,其目的在於保證語法正確的結構在語義上也是合法的。 4. 中間代碼生成 中間代碼生成器根據語義分析器的輸出生成中間代碼。中間代碼可以有若干種形式,它們的共同特徵是與具體機器無關。最常用的一種中間代碼是三地址碼,它的一種實現方式是四元式。三地址碼的優點是便於閱讀、便於優化。 5. 中間代碼優化 優化是編譯器的一個重要組成部分,由於編譯器將源程序翻譯成中間代碼的工作是機械的、按固定模式進行的,因此,生成的中間代碼往往在時間和空間上有很大浪費。當需要生成高效目標代碼時,就必須進行優化。 6. 目標代碼生成 目標代碼生成是編譯器的最後一個階段。在生成目標代碼時要考慮以下幾個問題:計算機的系統結構、指令系統、寄存器的分配以及內存的組織等。編譯器生成的目標程序代碼可以有多種形式:匯編語言、可重定位二進制代碼、內存形式。 7 符號表管理 符號表的作用是記錄源程序中符號的必要信息,並加以合理組織,從而在編譯器的各個階段能對它們進行快速、准確的查找和操作。符號表中的某些內容甚至要保留到程序的運行階段。 8 出錯處理用戶編寫的源程序中往往會有一些錯誤,可分為靜態錯誤和動態錯誤兩類。所謂動態錯誤,是指源程序中的邏輯錯誤,它們發生在程序運行的時候,也被稱作動態語義錯誤,如變數取值為零時作為除數,數組元素引用時下標出界等。靜態錯誤又可分為語法錯誤和靜態語義錯誤。語法錯誤是指有關語言結構上的錯誤,如單詞拼寫錯、表達式中缺少操作數、begin和end不匹配等。靜態語義錯誤是指分析源程序時可以發現的語言意義上的錯誤,如加法的兩個操作數中一個是整型變數名,而另一個是數組名等。

㈡ 做個編譯器需要什麼前置條件

用C語言比較好,效率比較高。
java也可以,好調試。
我用過以上兩種做過編譯器,別的語言不好說。
做個編譯器不難,一個人做也用不了太多時間。但相關的東西要做的話就花時間了。比如編輯環境,比如調試跟蹤器。

㈢ 做編譯器有前途嗎

有,只要你能做個能用編譯器,那就是高級軟體工程師了,大多數高級工程師都沒這水平,其實做編譯器根本沒有意義,因為你做出來的不會有人用。。。只有大型軟體公司諸如蘋果,微軟,intel推出新新型軟硬體開發環境,或者用新語言包裝開發組件的才會去做編譯器,你是要去這些公司工作嗎???????普通人做的編譯器根本無法推廣,質量保證不了,還有就是非常麻煩,編譯器是非常復雜的,最低也要精通目標環境的匯編,被編譯的語言(可以自己開發新的,也可以沿用舊的諸如C++等),還有就是令人頭疼的正則表達式,這些是最基本要求,這還牽扯不到編譯原理。。。。。

㈣ java編譯器和java解釋器分別是干什麼用的我只知道java編譯成class文件需要編譯器

如果做一件事情,需要三個步驟的話,寫代碼第一步,編譯器做了第二步(把代碼轉換成位元組碼),解釋器做第三步(把位元組碼解釋成最終的執行代碼),因為一次性到第三步有點復雜!想想現實生活中這樣的例子吧,比如說多語種翻譯之類的!

㈤ 開發一個 C++ 編譯器的難度有多大,難點又在哪裡

C++的前端是出了名的復雜度和可靠性要求並駕齊驅的軟體。

(這兩點都比它高一個數量級的大概就只有OS了)

對於這種系統,唯一的辦法就是燒錢。

燒錢的作用主要包括:
1.留人;
2.填坑;
3.買買買。

先說留人:復雜度一般是「細節」的代名詞。現實中的編譯器大多數以遞歸下降為主,自底向上的歸納推導為輔。這兩樣在教科書上也就是幾頁紙的事情。但是現實總是很殘酷的,人們總想讓語言更加「易用」,這就意味著各種上下文相關的情況都會出現。

對於C++來說,你要判斷一個符號是類型或者變數(比如這個符號被用在模板參數中),要看前面的聲明/定義。這就是一個上下文相關的推導。然後你就會寫大量的if else switch case之類的代碼來解決各種各樣的可能分支。寫它的人當然知道它是做什麼的,但是如果這個人離職了,新來一個人,就呆掉了,這寫的都是什麼煞筆玩意兒。因為它不知道現實中怎樣的需求會導致奇形怪狀的邏輯。所以人員的穩定,對於這種長周期迭代、邏輯復雜的項目是很重要的。但是人的水平要求高嗎?不算高也不算低。總結來說就是:有邏輯,知好歹。技術什麼都可以培養,但是態度和基本智商是比較難培養起來的。

至於怎麼保證人員穩定?很簡單:加薪。

再說填坑:編譯器是對正確性要求很高的基礎軟體。這里的正確性既包括產生的代碼的正確性,也包括編譯器自身對於各種問題的容忍度和足夠豐富的錯誤提示。容錯和錯誤提示本身也是代碼,也有很大的出錯幾率。所以這些軟體,bug少不了。但是作為基礎軟體,你又不能隨便就2+3搞成了2*3,這樣還怎麼讓別人相信愛情。所以要燒很多錢來養一幫debugger。

再說買買買:古人日:我們不用很麻煩很辛苦也可以成佛。既然這么費神我們自己做干什麼,不如買別人的吧。於是MS就乾脆不自己做了,直接去EDG整了個前端,這樣就可以少了不少人年。這就是傳統土豪和水果這種新暴發戶想的不一樣的地方。

傳統土豪想的是:我們有這么多錢為什麼還要自己解決問題呢?買買買!
水果新貴則是:啊呀,不小心有了這么多錢,我們要不要給自己製造點問題好把這些錢花出去?

㈥ Java中,創建一個對象時,編譯器到底做了些什麼

首先JAVA虛擬機 檢查創建這個對象的類是否是一個以前從沒有見過的類型,如果不是,java虛擬機將為其分配內存,如果是,java虛擬機將調用具體的ClassLoader找到對應的.class文件,並將這個文件的內容讀到內存中去

㈦ 編譯器是什麼意思,是做什麼的

編譯器
編譯器是一種特殊的程序,它可以把以特定編程語言寫成的程序變為機器可以運行的機器碼。我們把一個程序寫好,這時我們利用的環境是文本編輯器。這時我程序把程序稱為源程序。在此以後程序員可以運行相應的編譯器,通過指定需要編譯的文件的名稱就可以把相應的源文件(通過一個復雜的過程)轉化為機器碼了。

下面我們看看它是如何工作的。首先編譯器進行語法分析,也就是要把那些字元串分離出來。然後進行語義分析,就是把各個由語法分析分析出的語法單元的意義搞清楚。最後生成的是目標文件,我們也稱為obj文件。再經過鏈接器的鏈接就可以生成最後的可執行代碼了。有些時候我們需要把多個文件產生的目標文件進行鏈接,產生最後的代碼。我們把一過程稱為交叉鏈接。

有一個稱為LCC的編譯器,還挺不錯的;還有一個用於分析其規則的小工具;

㈧ 匯編語言編譯器是怎麼編寫的

編譯器自舉!搜索這個關鍵字
程序都是編譯器編譯的。這個是肯定的
至於第一款X語言編譯器是不是直接1010101010自己寫的那就不知道啦

一般開發編譯器的話。有兩條路選擇
1.利用yacc(或者其變種)&lex(詞法分析)-等工具自己生成語法模板
詞法語法都可以使用這些工具自己生成
然後自己編寫生成的中間碼和生成的機器碼就可以了
一般做編譯原理類似試驗都是如此的。許多編譯器也的確是這樣

2.自己寫詞法分析和語法分析。可以參考一些開源的編譯器
lcc-這個是ANSI C99標準的編譯器是開源的
或者nasm,watcom等編譯器到www.sf.net上不少開源的編譯器

總的來說。高級語言編譯器比較難寫
如果想快速寫出一個的話
可以採用第一種做法。利用工具生成語法詞法模板
先寫一個簡單的匯編編譯器比較簡單
開源的有nasm,jwasm(支持masm語法開源的編譯器)
http://www.japheth.de/JWasm.html
fasm(這款編譯器是自舉的.就是自己可以編譯自己),
http://flatassembler.net/

剩下的就是自己做好語言規則關鍵字map
引用高手的話。語言map做好了你的編譯器也做好一半了
剩下的都是機械性的工作了。
生成x86或者arm指令。

優化工作這個很難解釋.根據你所需要的做吧
畢竟可以做出一個無錯,又XX的編譯器已經很難得

你可以選擇使用現有的編譯器開發自己的編譯器
然後等到你的編譯器支持相當數量指令和成熟度的時候
使用自己的語法重新寫一遍編譯器.
這樣你就可以用自己的編譯器開發自己的編譯器了(是不是很邪惡?)

另外舉幾個例子
Delphi的編譯器是C++ Builder開發的。
而C++ Builder的IDE是Delphi開發的
C++ Builder的編譯器是C++ Builder開發的-這個就是編譯器自舉了。。Delphi和C++ Builder共享一個後端化優化器。
Delphi 早期的版本的編譯器是tasm直接編譯的。可見Anders的匯編功力多強悍(Anders也就是後來VJ++,C#,.NET工程的核心架構師.最關鍵的靈魂級人物)

VC++的編譯器是VC++開發的。很明顯這都說明了編譯器自舉
自己開發自己。如果一個編譯器可以做到自己編譯自己。那基本上就可以實現任何功能了。

關於編譯器開發的書籍可以看一下
龍書《編譯原理(第二版)》
虎書《現代編譯原理-C語言描述》
鯨書《高級編譯器設計與實現》
建議從鯨書看起。然後是龍書
再來是虎書--虎書裡面描述了許多現代編譯器(正如其名)技術
例如面向對象啦,優化,垃圾回收等等.
鯨書看完基本上就可以實現一個簡單的Tiny C編譯器了
然後在龍書鞏固,讀一下語言規范,自己看一些開源的匯編編譯器代碼
自己就可以嘗試做一個匯編語言編譯器了.等到技術提高了
在嘗試做一些高級語法識別,參考LCC代碼做一下ANSI C99的
C語言編譯器。再來就看你自己的興趣和領悟度拉
如果想支持C++的話就得要對編譯器做許多方便的研究

類似Java那種跨平台或者Ruby,Python等動態語言
虎書中也有描述。當然看自己功力了

㈨ 急急急!怎麼設計一個軟體,第一步是在哪裡設計呀

#1:程的是很不容易的事,軟體編程就更是如此了.所謂的編程,就是告訴計算機,第一步做什麼,第二步做什麼,這個過程.你可以選擇你列的任何的一種語言都可以的,按照它的語法結構,編寫代碼,然後由計算機自動編譯成計算機語言(0011001100111)二進制,最後會生成一個可以執行的(*.exe)文件.就象QQ.EXE之類的軟體了,它裡面封裝很多的代碼,你只看見了他的可執行文件.
#2:設計程序--是在一定的開發環境下設計的,C語言設計就要在VC或TC下編寫,ASP要在ASP的環境下編寫。C#就就要在Visual studio 2005下編寫,還要按照各自的語法規則寫。這樣才能在它的環境中被編譯,生成可執行文件(*。EXE)
#3:編程後還要調試,看看是不是達到了我們所要求的結果,要是沒有的話就要在修改程序代碼,知道按照我門的要求輸出結果為止。這樣編程過程就OK啦
#4:封裝對象,加密加外殼,這樣一個就好了。以後只要我們電擊*.EXE就可以由計算機來完成我們預期的工作了.

其實編程真的,我個人以為 很有意思的.

㈩ C語言源程序開發的第一步是什麼

第一步

在程序編輯過程中,所輸入源文件中的是一些字元碼,但是機器能夠直接處理的是0、1信息。為此,首先要將源程序文件翻譯成0、1碼所表示的信息,應用相應的文件保存。這種保存0、1碼的文件稱為目標程序文件。由源程序翻譯成目標程序的過程稱為編譯。

在編譯過程中,還要對源程序中的語法和邏輯結構進行檢查。編譯任務是由稱為編譯器的軟體完成的。目標程序文件尚且不能執行,它們只是一些目標程序模塊。

第二步

將目標程序模塊以及程序所需的系統固有目標程序模塊(如執行輸入、輸出操作的模塊)鏈接成一個完成的程序。經正確鏈接所生成的文件才是可執行文件。完成鏈接過程的軟體稱為鏈接器。

第三步

C語言中的運算符種類很多,正確的使用這些運算符,有以下三點需要注意。

1.含義

要注意區分一個運算符符號在C語言程序中和在普通數學表達式中的意義的不同,如「=」。

2.優先順序

在一個表達式中存在多個運算符時候,進行運算的先後順序。

3.結合性

即在一個表達式中存在多個優先順序別相同的運算符時,先進行哪個運算符的運算。

第四步

標識符也稱為名字,如變數名、函數名、文件名等。在C語言程序中,所使用的標識符應當符合以下詞法規則。

(1).標識符是大/小寫字母、數字和下劃線所組成的序列,但不能以數字開頭。

(2)C語言區分同一字母的大/小寫,如abc和abC就是不同的標識符。

(3)C89要求編譯器所能識別的標識符長度不多於31個有效字元。C99要求編譯器所能識別的標識符長度不多於63個有效字元。

(4)普通標識符不能使用對於系統有特殊意義的名字,如類型名、語句名等。這些對系統具有特殊意義的名字稱為關鍵字。

閱讀全文

與開發一個編譯器第一步做什麼相關的資料

熱點內容
c代碼編譯吃cpu頻率還是核心 瀏覽:165
pdf簽名adobe 瀏覽:405
在家無聊解壓圖片 瀏覽:534
單片機撥打電話 瀏覽:440
單片機問題解說 瀏覽:795
我的世界手機版命令方塊零重力 瀏覽:689
解壓游戲無廣告最新版 瀏覽:423
如何下載養生堂app 瀏覽:242
oracle中文亂碼java 瀏覽:937
兒童編程實踐課小結 瀏覽:482
APP是如何實現數據獲取的 瀏覽:522
買車子看什麼app 瀏覽:832
美國單片機 瀏覽:815
如何在app上架自己的游戲 瀏覽:461
安卓系統車載導航支持什麼格式u盤 瀏覽:626
天翼雲伺服器怎麼打開埠 瀏覽:911
如何啟用對伺服器遠程的訪問 瀏覽:778
程序員環境分析 瀏覽:820
tsp演算法是數據挖掘演算法嗎 瀏覽:675
編譯原理好處 瀏覽:824