編譯詞法分析讀寫代碼_編譯過程分為哪幾個階段各階段的遵循的原則、識別機構、使用的文法編譯原理

① 編譯詳細資料大全

編譯(compilation , compile) 1、利用編譯程式從源語言編寫的源程式產生目標程式的過程。 2、用編譯程式產生目標程式的動作。編譯就是把高級語言變成計算機可以識別的2進制語言，計算機只認識1和0，編譯程式把人們熟悉兆猜吵的語言換成2進制的。編譯程式把一個兆晌源程式翻譯成目標程式的工作過程分為五個階段：詞法分析；語法分析；語義檢查和中間代碼生成；代碼最佳化；目標代碼生成。主要是進行詞法分析和語法分析，又稱為源程式分析，分析過程中發現有語法錯誤，給出提示信息。

編譯語言是一種以編譯器來實現的程式語言。它不像直譯語言一樣，由解釋器將代碼一句一句運行，而是以編譯器，先將代碼編譯為機器碼，再加以運行。理論上，任何程式語言都可以是編譯式，或直譯式的。它們之間的區別，僅與程式的套用有關。

基本介紹

中文名：編譯
外文名：compilation
學科：計算機科學
用途：編譯程式
解釋：編寫的源程式產生目標程式的過程
領域：編譯原理

編譯程式,詞法分析,語法分析,中間代碼,代碼最佳化,目標代碼,表格管理,出錯處理,

編譯程式

將某一種程式設計語言寫的程式翻譯成等價的另一種語言的程式的程式, 稱之為編譯程式(compiler) .

詞法分析

詞法分析的任務是對由字元組成的單詞進行處理，從左至右逐個字元地對源程式進行掃描，產生一個個的單詞符號，把作為字元串的源程式改造成為單詞符號串的中間程式。執行詞法分析的程式稱為詞法分析程式或掃描器。源程式中的單詞符號經掃描器分析，一般產生二元式：單詞種別；單詞自身的值。單詞種別通常用整數編碼，如果一個種別只含一個單詞符號，那麼對這個單詞符號，種別編碼就完全代表它自身的值了。若一個種別含有許多個單詞符號，那麼，對於它的每個單詞符號族侍，除了給出種別編碼以外，還應給出自身的值。詞法分析器一般來說有兩種方法構造：手工構造和自動生成。手工構造可使用狀態圖進行工作，自動生成使用確定的有限自動機來實現。

語法分析

編譯程式的語法分析器以單詞符號作為輸入，分析單詞符號串是否形成符合語法規則的語法單位，如表達式、賦值、循環等，最後看是否構成一個符合要求的程式，按該語言使用的語法規則分析檢查每條語句是否有正確的邏輯結構，程式是最終的一個語法單位。編譯程式的語法規則可用上下文無關文法來刻畫。語法分析的方法分為兩種：自上而下分析法和自下而上分析法。自上而下就是從文法的開始符號出發，向下推導，推出句子。而自下而上分析法採用的是移進歸約法，基本思想是：用一個暫存符號的先進後出棧，把輸入符號一個一個地移進棧里，當棧頂形成某個產生式的一個候選式時，即把棧頂的這一部分歸約成該產生式的左鄰符號。

中間代碼

中間代碼是源程式的一種內部表示，或稱中間語言。中間代碼的作用是可使編譯程式的結構在邏輯上更為簡單明確，特別是可使目標代碼的最佳化比較容易實現中間代碼，即為中間語言程式，中間語言的復雜性介於源程式語言和機器語言之間。中間語言有多種形式，常見的有逆波蘭記號、四元式、三元式和樹。

代碼最佳化

代碼最佳化是指對程式進行多種等價變換，使得從變換後的程式出發，能生成更有效的目標代碼。所謂等價，是指不改變程式的運行結果。所謂有效，主要指目標代碼運行時間較短，以及佔用的存儲空間較小。這種變換稱為最佳化。有兩類最佳化：一類是對語法分析後的中間代碼進行最佳化，它不依賴於具體的計算機；另一類是在生成目標代碼時進行的，它在很大程度上依賴於具體的計算機。對於前一類最佳化，根據它所涉及的程式范圍可分為局部最佳化、循環最佳化和全局最佳化三個不同的級別。

目標代碼

目標代碼生成是編譯的最後一個階段。目標代碼生成器把語法分析後或最佳化後的中間代碼變換成目標代碼。目標代碼有三種形式： ① 可以立即執行的機器語言代碼，所有地址都重定位； ② 待裝配的機器語言模組，當需要執行時，由連線裝入程式把它們和某些運行程式連線起來，轉換成能執行的機器語言代碼； ③ 匯編語言代碼，須經過匯編程式匯編後，成為可執行的機器語言代碼。目標代碼生成階段應考慮直接影響到目標代碼速度的三個問題：一是如何生成較短的目標代碼；二是如何充分利用計算機中的暫存器，減少目標代碼訪問存儲單元的次數；三是如何充分利用計算機指令系統的特點，以提高目標代碼的質量。

表格管理

編譯過程中源程式的各種信息被保留在種種不同的表格，編譯各階段的工作都涉及到構造、查找、或更新有關的表格。編譯程式的公共輔助部分。對源程式中的各種量進行管理，登記在相應的表格。編譯程式處理時通過查表得到所需的信息。

出錯處理

如果編譯過程中發現源程式有錯誤，編譯程式應報告錯誤的性質和錯誤的發生的地點，並且將錯誤所造成的影響限制在盡可能小的范圍內，使得源程式的其餘部分能繼續被編譯下去，有些編譯程式還能自動糾正錯誤，這些工作由錯誤處理程式完成。需要注意的是，一般上編譯器只做語法檢查和最簡單的語義檢查，而不檢查程式的邏輯。

② 編譯過程分為哪幾個階段各階段的遵循的原則、識別機構、使用的文法編譯原理

編譯原理中的遍概念
編譯階段也常常劃分為兩大步驟，分析步驟和綜合步驟分析步驟和綜合步驟分析步驟是指對源程序的分析－線性分析(詞法分析或掃描) －層次分析(語法分析) －語義分析綜合步驟是指後端的工作，為目標程序的生成而進行的綜合

你分析過嗎？若按照這種組合方式實現編譯程序，可以設想，某一編譯程序的前端加上相應不同的後端則可以為不同的機器構成同一個源語言的編譯程序。也可以設想，不同語言編譯的前端生成同一種中間語言，再使用一個共同的後端，則可為同一機器生成幾個語言的編譯程序。

一個編譯過程可由一遍、兩遍或多遍完成。所謂"遍"，也稱作"趟"，是對源程序或其等價的中間語言程序從頭到尾掃視並完成規定任務的過程。每一遍掃視可完成上述一個階段或多個階段的工作。例如一遍可以只完成詞法分析工作；一遍完成詞法分析和語法分析工作；甚至一遍完成整個編譯工作。對於多遍的編譯程序，第一遍的輸入是用戶書寫的源程序，最後一遍的輸出是目標語言程序，其餘是上一遍的輸出為下一遍的輸入。

在實際的編譯系統的設計中，編譯的幾個階段的工作究竟應該怎樣組合，即編譯程序究竟分成幾遍，參考的因素主要是源語言和機器(目標機)的特徵。比如源語言的結構直接影響編譯的遍的劃分；像 PL/1 或 ALGOL 68 那樣的語言，允許名字的說明出現在名字的使用之後，那麼在看到名字之前是不便為包含該名字的表達式生成代碼的，這種語言的編譯程序至少分成兩遍才容易生成代碼。另外機器的情況，即編譯程序工作的環境也影響編譯程序的遍數的劃分。遍數多一點，整個編譯程序的邏輯結構可能清晰些，但遍數多即意味著增加讀寫中間文件的次數，勢必消耗較多時間，一般會比一遍的編譯要慢。

③ 詞法分析（編譯）

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <ctype.h>
#include <conio.h>

int IsLetter(char ch)
{
if (isalpha(ch))
return 1;
return 0;
}
int IsDigit(char ch)
{
if (isalnum(ch))
return 1;
return 0;
}
int IsSpace(char ch)
{
if (isspace(ch))
return 1;
return 0;
}
void GetChar(FILE *fp, char *ch)
{
*ch = fgetc(fp);
}
void GetBC(FILE *fp,char *ch)
{
do
{
GetChar(fp,ch);
}
while (IsSpace(*ch) && (*ch != EOF));
}
void Retract(FILE *fp, char *ch)
{
fseek(fp,-1,SEEK_CUR);
*ch = ' ';
}
char Reserve(char *strToken)
{
if (strcmp(strToken,"BEGIN") == 0) return '1';
if (strcmp(strToken,"FOR") == 0) return '2';
if (strcmp(strToken,"END") == 0) return '3';
if (strcmp(strToken,"DIM") == 0) return '4';
if (strcmp(strToken,"WHILE") == 0) return '5';
if (strcmp(strToken,"STOP") == 0) return '6';
if (strcmp(strToken,"IF") == 0) return '7';
if (strcmp(strToken,"ELSE") == 0) return '8';
if (strcmp(strToken,"INT") == 0) return '9';
return '0';
}
void Concat(char *strToken, char *ch)
{
int i;
for (i=0;i<80;i++)
{
if (strToken == NULL)
{
*strToken = *ch;
break;
}
strToken++;
}
}
int lexSubFunc(FILE *fp1,FILE *fp2)
{
char ch,code;
int i;
char strToken[80];
while (1)
{
GetBC(fp1,&ch);
for (i=0;i<80;i++) strToken[i]=' ';
if (ch == EOF) return 0;
if (IsLetter(ch))
{
while (IsLetter(ch) || IsDigit(ch))
{
Concat(strToken,&ch);
GetChar(fp1,&ch);
}
Retract(fp1,&ch);
code = Reserve(strToken);
if (code == '0')
{
printf("<$ID,%s>\n",strToken);
fputs("<$ID,",fp2);
fputs(strToken,fp2);
fputs(">\n",fp2);
}
else
{
printf("<%c,->\n",code);
fputs("<",fp2);
fputc(code,fp2);
fputs(",->\n",fp2);
}
}
else if (IsDigit(ch))
{
while (IsDigit(ch))
{
Concat(strToken,&ch);
GetChar(fp1,&ch);
}
Retract(fp1,&ch);
printf("<$INT,%s>\n",strToken);
fputs("<$INT,",fp2);
fputs(strToken,fp2);
fputs(">\n",fp2);
}
else if (ch == '=')
{
printf("<$ASSIGN,->\n");
fputs("<$ASSIGN,->\n",fp2);
}
else if (ch == '+')
{
printf("<$PLUS,->\n");
fputs("<$PLUS,->\n",fp2);
}
else if (ch == '*')
{
GetChar(fp1,&ch);
if (ch == '*')
{
printf("<$POWER,->\n");
fputs("<$POWER,->\n",fp2);
}
else
{
Retract(fp1,&ch);
printf("<$STAR,->\n");
fputs("<$STAR,->\n",fp2);
}
}
else if (ch == ';')
{
printf("<$SEMICOLON,->\n");
fputs("<$SEMICOLON,->\n",fp2);
}
else if (ch == '(')
{
printf("<$LPAR,->\n");
fputs("<$LPAR,->\n",fp2);
}
else if (ch == ')')
{
printf("<$RPAR,->\n");
fputs("<$RPAR,->\n",fp2);
}
else if (ch == '{')
{
printf("<$LBRACE,->\n");
fputs("<$LBRACE,->\n",fp2);
}
else if (ch == '}')
{
printf("<$RBRACE,->\n");
fputs("<$RBRACE,->\n",fp2);
}
}
}
int main()
{
FILE *fp1,*fp2;
if ((fp1=fopen("abc.txt","r"))==NULL)
{
printf("Cannot open file");
getch();
exit(1);
}
if ((fp2=fopen("out.txt","w"))==NULL)
{
printf("Cannot create out.txt");
getch();
exit(1);
}
lexSubFunc(fp1,fp2);
fclose(fp1);
fclose(fp2);
return 0;
}

④ 編譯原理詞法分析程序

（一）Block子程序分析

procere enter(k: object1); //填寫符號表
begin {enter object into table}
tx := tx + 1; //下標加1，tx的初始值為零，零下標不地址不填寫標志符，用於查找失敗使用
with table[tx] do //填入內容，保存標志符名和類型
begin name := id; kind := k;
case k of //根據類型判斷是否正確
constant: begin if num > amax then //如果是常量，判斷是否大於最大值，若是則報30號錯
begin error(30); num :=0 end;
val := num //否則保存數值
end;
varible: begin level := lev; adr := dx; dx := dx + 1; //如果是變數，填寫變數內部表示，LEVEl是變數的層次，adr為地址
end;
proc: level := lev //如果是過程，保存過程的層次
end
end
end {enter};

//查找符號表的位置
function position(id: alfa): integer;
var i: integer;
begin {find indentifier id in table} //從後向前查找
table[0].name := id; i := tx; //找到保存類型
while table[i].name <> id do i := i-1;
position := i //返回標志符在符號表中的位置
end {position};

procere block(lev,tx: integer; fsys: symset);
var dx: integer; {data allocation index} //數據分配索引
tx0: integer; {initial table index} //初始符號表索引
cx0: integer; {initial code index} //初始代碼索引
procere enter(k: object1); //填寫符號表，下次分析
begin {enter object into table}
tx := tx + 1;
with table[tx] do
begin name := id; kind := k;
case k of
constant: begin if num > amax then
begin error(30); num :=0 end;
val := num
end;
varible: begin level := lev; adr := dx; dx := dx + 1;
end;
proc: level := lev
end
end
end {enter};

function position(id: alfa): integer; //查找符號表，下次分析
var i: integer;
begin {find indentifier id in table}
table[0].name := id; i := tx;
while table[i].name <> id do i := i-1;
position := i
end {position};

procere constdeclaration; //常量聲明
begin if sym = ident then //如果是標志符，讀入一個TOKEN
begin getsym;
if sym in [eql, becomes] then //讀入的是等號或符值號繼續判斷
begin if sym = becomes then error(1); //如果是「=」報1號錯
getsym; //讀入下一個TOKEN
if sym = number then //讀入的是數字，填寫符號表
begin enter(constant); getsym
end
else error(2) //如果不是數字，報2號錯
end else error(3) //不是等號或符值號，報3號錯
end else error(4) //如果不是標志符，報4號錯
end {constdeclaration};

procere vardeclaration; //變數聲明
begin if sym = ident then //讀入的是標志符，填寫符號表
begin enter(varible); getsym
end else error(4) //不是標志符，報4號錯
end {vardeclaration};

procere listcode;
var i: integer;
begin {list code generated for this block}
for i := cx0 to cx-1 do
with code[i] do
writeln(i:5, mnemonic[f]:5, 1:3, a:5)
end {listcode};

procere statement(fsys: symset);
var i, cx1, cx2: integer;
procere expression(fsys: symset); //表達式分析
var addop: symbol;
procere term(fsys: symset); //項分析
var mulop: symbol;
procere factor(fsys: symset); //因子分析
var i: integer;
begin test(facbegsys, fsys, 24); //讀入的是「（」，標志符或數字
while sym in facbegsys do
begin
if sym = ident then //是標志符，查表
begin i:= position(id);
if i = 0 then error(11) else //未找到，報11號錯
with table[i] do //找到，讀入標志符類型
case kind of
constant: gen(lit, 0, val); //寫常量命令
varible: gen(lod, lev-level, adr);//寫變數命令
proc: error(21) //過程名，報21號錯
end;
getsym //讀入下一個TOKEN
end else
if sym = number then //讀入的是數字
begin if num > amax then //如果數字大於最大數，報30號錯誤
begin error(30); num := 0
end;
gen(lit, 0, num); getsym //調用數字命令，讀入下一個TOKEN
end else
if sym = lparen then //讀入的是「（」
begin getsym; expression([rparen]+fsys); //調用表達式分析函數
if sym = rparen then getsym else error(22) //如果「（」後無「）」，報22號錯
end;
test(fsys, [lparen], 23)
end
end {factor};//因子分析結束

//項分析
begin {term} factor(fsys+[times, slash]); //調用因子分析程序
while sym in [times, slash] do //取得是乘、除號循環
begin mulop:=sym;getsym;factor(fsys+[times,slash]); //記錄符號，調用因子分析
if mulop=times then gen(opr,0,4) else gen(opr,0,5) //寫乘除指令
end
end {term};
begin {expression}
if sym in [plus, minus] then //如果是加減號
begin addop := sym; getsym; term(fsys+[plus,minus]); //記錄符號，調用項分析程序
if addop = minus then gen(opr, 0,1) //寫加減指令
end else term(fsys+[plus, minus]);
while sym in [plus, minus] do //如果是加減號循環
begin addop := sym; getsym; term(fsys+[plus,minus]);
if addop=plus then gen(opr,0,2) else gen(opr,0,3)
end
end {expression};

//條件過程
procere condition(fsys: symset);
var relop: symbol;
begin
if sym = oddsym then //如果是判奇符
begin getsym; expression(fsys); gen(opr, 0, 6) //取下一個TOKEN，調用expression，填指令
end else
begin expression([eql, neq, lss, gtr, leq, geq]+fsys);
if not(sym in [eql, neq, lss, leq, gtr, geq]) then //如果不是取到邏輯判斷符號，出錯.20
error(20) else
begin relop := sym; getsym; expression(fsys);
case relop of
eql: gen(opr, 0, 8); // =，相等
neq: gen(opr, 0, 9); // #，不相等
lss: gen(opr, 0, 10); // <，小於
geq: gen(opr, 0, 11); // ]，大於等於
gtr: gen(opr, 0, 12); // >，大於
leq: gen(opr, 0, 13); // [，小於等於
end
end
end
end {condition};

begin {statement}
if sym = ident then //如果是標識符
begin i := position(id); //查找符號表
if i = 0 then error(11) else //未找到，標識符未定義，報11號錯
if table[i].kind <> varible then //如果標識符不是變數，報12號錯
begin {assignment to non-varible} error(12); i := 0
end;
getsym; if sym = becomes then getsym else error(13); //如果是變數讀入下一個TOKEN，不是賦值號，報13好錯；是則讀入一個TOKEN
expression(fsys); //調用表達是過程
if i <> 0 then //寫指令
with table[i] do gen(sto, lev-level, adr)
end else
if sym = callsym then //如果是過程調用保留字，讀入下一個TOKEN
begin getsym;
if sym <> ident then error(14) else //不是標識符報14號錯
begin i := position(id);
if i = 0 then error(11) else //是標識符，未定義，報13號錯
with table[i] do // 已定義的標識符讀入類型
if kind=proc then gen(cal, lev-level, adr) //是過程名寫指令
else error(15); //不是過程名，報15號錯
getsym
end
end else
if sym = ifsym then //如果是IF
begin getsym; condition([thensym, dosym]+fsys); //讀入一個TOKEN,調用條件判斷過程
if sym = thensym then getsym else error(16); //如果是THEN,讀入一個TOKEN，不是，報16號錯
cx1 := cx; gen(jpc, 0, 0); //寫指令
statement(fsys); code[cx1].a := cx
end else
if sym = beginsym then //如果是BEGIN
begin getsym; statement([semicolon, endsym]+fsys); //讀入一個TOKEN
while sym in [semicolon]+statbegsys do
begin
if sym = semicolon then getsym else error(10); //如果讀入的是分號
statement([semicolon, endsym]+fsys)
end;
if sym = endsym then getsym else error(17) //如果是END 讀入一個TOKEN，不是，報17號錯
end else
if sym = whilesym then //如果是WHILE
begin cx1 := cx; getsym; condition([dosym]+fsys); //調用條件過程
cx2 := cx; gen(jpc, 0, 0); //寫指令
if sym = dosym then getsym else error(18); //如果是DO讀入下一個TOKEN，不是報18號錯
statement(fsys); gen(jmp, 0, cx1); code[cx2].a := cx
end;
test(fsys, [], 19)
end {statement};

begin {block}
dx:=3;
tx0:=tx;
table[tx].adr:=cx;
gen(jmp,0,0);
if lev > levmax then error(32);
repeat
if sym = constsym then //如果是CONST
begin getsym; //讀入TOKEN
repeat constdeclaration; //常量聲明
while sym = comma do
begin getsym; constdeclaration
end;
if sym = semicolon then getsym else error(5) //如果是分號讀入下一個TOKEN，不是報5號錯
until sym <> ident //不是標志符常量聲明結束
end;
if sym = varsym then 如果是VAR
begin getsym; 讀入下一個TOKEN
repeat vardeclaration; //變數聲明
while sym = comma do
begin getsym; vardeclaration
end;
if sym = semicolon then getsym else error(5) //如果是分號讀入下一個TOKEN，不是報5號錯
until sym <> ident; //不是標志符常量聲明結束
end;
while sym = procsym do //過程聲明
begin getsym;
if sym = ident then
begin enter(proc); getsym
end
else error(4); //不是標志符報4號錯
if sym = semicolon then getsym else error(5); //如果是分號讀入下一個TOKEN，不是報5號錯
block(lev+1, tx, [semicolon]+fsys);
if sym = semicolon then //如果是分號，取下一個TOKEN，不是報5號錯
begin getsym;test(statbegsys+[ident,procsym],fsys,6)
end
else error(5)
end;
test(statbegsys+[ident], declbegsys, 7)
until not(sym in declbegsys); //取到的不是const var proc結束
code[table[tx0].adr].a := cx;
with table[tx0] do
begin adr := cx; {start adr of code}
end;
cx0 := 0{cx}; gen(int, 0, dx);
statement([semicolon, endsym]+fsys);
gen(opr, 0, 0); {return}
test(fsys, [], 8);
listcode;
end {block};

⑤ 編譯原理全部的名詞解釋

書上有別那麼懶!.
編譯過程的六個階段：詞法分析,語法分析,語義分析,中間代碼生成,代碼優化,目標代碼生成
解釋程序：把某種語言的源程序轉換成等價的另一種語言程序——目標語言程序,然後再執行目標程序.解釋方式是接受某高級語言的一個語句輸入,進行解釋並控制計算機執行,馬上得到這句的執行結果,然後再接受下一句.
編譯程序：就是指這樣一種程序,通過它能夠將用高級語言編寫的源程序轉換成與之在邏輯上等價的低級語言形式的目標程序(機器語言程序或匯編語言程序).
解釋程序和編譯程序的根本區別：是否生成目標代碼
句子的二義性（這里的二義性是指語法結構上的.）:文法G[S]的一個句子如果能找到兩種不同的最左推導(或最右推導),或者存在兩棵不同的語法樹,則稱這個句子是二義性的.
文法的二義性:一個文法如果包含二義性的句子,則這個文法是二義文法,否則是無二義文法.
LL(1)的含義：(LL(1)文法是無二義的； LL(1)文法不含左遞歸)
第1個L：從左到右掃描輸入串第2個L：生成的是最左推導
1 ：向右看1個輸入符號便可決定選擇哪個產生式
某些非LL(1)文法到LL(1)文法的等價變換: 1. 提取公因子 2. 消除左遞歸
文法符號的屬性:單詞的含義,即與文法符號相關的一些信息.如,類型、值、存儲地址等.
一個屬性文法(attribute grammar)是一個三元組A=(G, V, F)
G：上下文無關文法.
V：屬性的有窮集.每個屬性與文法的一個終結符或非終結符相連.屬性與變數一樣,可以進行計算和傳遞.
F：關於屬性的斷言或謂詞(一組屬性的計算規則)的有窮集.斷言或語義規則與一個產生式相聯,只引用該產生式左端或右端的終結符或非終結符相聯的屬性.
綜合屬性:若產生式左部的單非終結符A的屬性值由右部各非終結符的屬性值決定,則A的屬性稱為綜合屬
繼承屬性:若產生式右部符號B的屬性值是根據左部非終結符的屬性值或者右部其它符號的屬性值決定的,則B的屬性為繼承屬性.
(1)非終結符既可有綜合屬性也可有繼承屬性,但文法開始符號沒有繼承屬性.
(2) 終結符只有綜合屬性,沒有繼承屬性,它們由詞法程序提供.
在計算時：綜合屬性沿屬性語法樹向上傳遞；繼承屬性沿屬性語法樹向下傳遞.
語法制導翻譯：是指在語法分析過程中,完成附加在所使用的產生式上的語義規則描述的動作.
語法制導翻譯實現：對單詞符號串進行語法分析,構造語法分析樹,然後根據需要構造屬性依賴圖,遍歷語法樹並在語法樹的各結點處按語義規則進行計算.
中間代碼（中間語言）
1、是復雜性介於源程序語言和機器語言的一種表示形式.
2、一般,快速編譯程序直接生成目標代碼.
3、為了使編譯程序結構在邏輯上更為簡單明確,常採用中間代碼,這樣可以將與機器相關的某些實現細節置於代碼生成階段仔細處理,並且可以在中間代碼一級進行優化工作,使得代碼優化比較容易實現.
何謂中間代碼：源程序的一種內部表示,不依賴目標機的結構,易於代碼的機械生成.
為何要轉換成中間代碼:(1)邏輯結構清楚；利於不同目標機上實現同一種語言.
(2)便於移植,便於修改,便於進行與機器無關的優化.
中間代碼的幾種形式：逆波蘭記號 ,三元式和樹形表示 ,四元式
符號表的一般形式：一張符號表的的組成包括兩項,即名字欄和信息欄.
信息欄包含許多子欄和標志位,用來記錄相應名字和種種不同屬性,名字欄也稱主欄.主欄的內容稱為關鍵字（key word）.
符號表的功能：（1）收集符號屬性 (2) 上下文語義的合法性檢查的依據：檢查標識符屬性在上下文中的一致性和合法性.(3)作為目標代碼生成階段地址分配的依據
符號的主要屬性及作用：
1. 符號名 2. 符號的類型（整型、實型、字元串型等））3. 符號的存儲類別（公共、私有）
4. 符號的作用域及可視性（全局、局部） 5. 符號變數的存儲分配信息（靜態存儲區、動態存儲區）
存儲分配方案策略：靜態存儲分配；動態存儲分配：棧式、堆式.
靜態存儲分配
1、基本策略
在編譯時就安排好目標程序運行時的全部數據空間,並能確定每個數據項的單元地址.
2、適用的分配對象：子程序的目標代碼段；全局數據目標（全局變數）
3、靜態存儲分配的要求：不允許遞歸調用,不含有可變數組.
FORTRAN程序是段結構,不允許遞歸,數據名大小、性質固定. 是典型的靜態分配
動態存儲分配
1、如果一個程序設計語言允許遞歸過程、可變數組或允許用戶自由申請和釋放空間,那麼,就需要採用動態存儲管理技術.
2、兩種動態存儲分配方式：棧式,堆式
棧式動態存儲分配
分配策略：將整個程序的數據空間設計為一個棧.
【例】在具有遞歸結構的語言程序中,每當調用一個過程時,它所需的數據空間就分配在棧頂,每當過程工作結束時就釋放這部分空間.
過程所需的數據空間包括兩部分
一部分是生存期在本過程這次活動中的數據對象.如局部變數、參數單元、臨時變數等；
另一部分則是用以管理過程活動的記錄信息(連接數據).
活動記錄（AR）
一個過程的一次執行所需要的信息使用一個連續的存儲區來管理,這個區 (塊)叫做一個活動記錄.
構成
1、臨時工作單元；2、局部變數；3、機器狀態信息；4、存取鏈；
5、控制鏈；6、實參；7、返回地址
什麼是代碼優化
所謂優化,就是對代碼進行等價變換,使得變換後的代碼運行結果與變換前代碼運行結果相同,而運行速度加快或佔用存儲空間減少.
優化原則：等價原則：經過優化後不應改變程序運行的結果.
有效原則：使優化後所產生的目標代碼運行時間較短,佔用的存儲空間較小.
合算原則：以盡可能低的代價取得較好的優化效果.
常見的優化技術
(1) 刪除多餘運算(刪除公共子表達式) (2) 代碼外提 +刪除歸納變數+ (3)強度削弱; (4)變換循環控制條件 (5)合並已知量與復寫傳播 (6)刪除無用賦值
基本塊定義
程序中只有一個入口和一個出口的一段順序執行的語句序列,稱為程序的一個基本塊.
給我分數啊.

⑥ 編譯原理詞法分析

編譯的詞法分析，一般是先畫一個狀態轉換圖，一般是有多少分支，就有多少if語句，分支裡面再分（可能有循環語句）。注意記住詞的類別和詞的字元串，請以以下代碼為例，理會一下詞法分析的大致過程。
while(s[i]!='#')
{
while(s[i]==' '||s[i]=='\t'||s[i]=='\n')
{
if(s[i]=='\n')
line++;
i++;
}
if(s[i]=='#')
break;
j=i;
if(s[i]>='a'&&s[i]<='z'||s[i]>='A'&&s[i]<='Z')
{
i++;
while(s[i]>='a'&&s[i]<='z'||s[i]>='A'&&s[i]<='Z'||s[i]>='0'&&s[i]<='9')
i++;
if((i-j)==2&&s[j]=='i'&&s[j+1]=='f')
{
strcpy(dancishuzu[dancigeshu].name,"if");
dancishuzu[dancigeshu].bianhao=4;
dancigeshu++;
}
else if((i-j)==3&&s[j]=='i'&&s[j+1]=='n'&&s[j+2]=='t')
{
strcpy(dancishuzu[dancigeshu].name,"int");
dancishuzu[dancigeshu].bianhao=2;
dancigeshu++;
}
else if((i-j)==3&&s[j]=='f'&&s[j+1]=='o'&&s[j+2]=='r')
{
strcpy(dancishuzu[dancigeshu].name,"for");
dancishuzu[dancigeshu].bianhao=6;
dancigeshu++;
}
else if((i-j)==4&&s[j]=='m'&&s[j+1]=='a'&&s[j+2]=='i'&&s[j+3]=='n')
{
strcpy(dancishuzu[dancigeshu].name,"main");
dancishuzu[dancigeshu].bianhao=1;
dancigeshu++;
}
else if ((i-j)==4&&s[j]=='c'&&s[j+1]=='h'&&s[j+2]=='a'&&s[j+3]=='r')
{
strcpy(dancishuzu[dancigeshu].name,"char");
dancishuzu[dancigeshu].bianhao=3;
dancigeshu++;
}
else if ((i-j)==4&&s[j]=='e'&&s[j+1]=='l'&&s[j+2]=='s'&&s[j+3]=='e')
{
strcpy(dancishuzu[dancigeshu].name,"else");
dancishuzu[dancigeshu].bianhao=5;
dancigeshu++;
}
else if ((i-j)==5&&s[j]=='w'&&s[j+1]=='h'&&s[j+2]=='i'&&s[j+3]=='l'&&s[j+4]=='e')
{
strcpy(dancishuzu[dancigeshu].name,"while");
dancishuzu[dancigeshu].bianhao=7;
dancigeshu++;
}
else{
dancishuzu[dancigeshu].bianhao=10;
count=0;
while(j<i)
{
dancishuzu[dancigeshu].name[count++]=s[j];
j++;
}
dancishuzu[dancigeshu].name[count]='\0';
dancigeshu++;
}
}
else if(s[i]>='0'&&s[i]<='9')
{
while(s[i]>='0'&&s[i]<='9')
i++;
dancishuzu[dancigeshu].bianhao=11;
count=0;
while(j<i)
{
dancishuzu[dancigeshu].name[count++]=s[j];
j++;
}
dancishuzu[dancigeshu].name[count]='\0';
dancigeshu++;
}

else if(s[i]=='=')
{
if(s[i+1]=='=')
{
dancishuzu[dancigeshu].bianhao=30;
strcpy(dancishuzu[dancigeshu].name,"==");
dancigeshu++;
i+=2;
}
else
{
dancishuzu[dancigeshu].bianhao=12;
strcpy(dancishuzu[dancigeshu].name,"=");
dancigeshu++;
i++;
}
}
else if(s[i]=='+')
{
dancishuzu[dancigeshu].bianhao=13;
strcpy(dancishuzu[dancigeshu].name,"+");
dancigeshu++;
i++;
}
else if(s[i]=='-')
{
dancishuzu[dancigeshu].bianhao=14;
strcpy(dancishuzu[dancigeshu].name,"-");
dancigeshu++;
i++;
}
else if(s[i]=='*')
{
dancishuzu[dancigeshu].bianhao=15;
strcpy(dancishuzu[dancigeshu].name,"*");
dancigeshu++;
i++;
}
else if(s[i]=='/')
{
dancishuzu[dancigeshu].bianhao=16;
strcpy(dancishuzu[dancigeshu].name,"/");
dancigeshu++;
i++;
}
else if(s[i]=='(')
{
i++;
dancishuzu[dancigeshu].bianhao=17;
strcpy(dancishuzu[dancigeshu].name,"(");
dancigeshu++;
}
else if(s[i]==')')
{
i++;
dancishuzu[dancigeshu].bianhao=18;
strcpy(dancishuzu[dancigeshu].name,")");
dancigeshu++;
}
else if(s[i]=='[')
{
i++;
dancishuzu[dancigeshu].bianhao=19;
strcpy(dancishuzu[dancigeshu].name,"[");
dancigeshu++;
}
else if(s[i]==']')
{
i++;
dancishuzu[dancigeshu].bianhao=20;
strcpy(dancishuzu[dancigeshu].name,"]");
dancigeshu++;
}
else if(s[i]=='{')
{
i++;
dancishuzu[dancigeshu].bianhao=21;
strcpy(dancishuzu[dancigeshu].name,"{");
dancigeshu++;
}
else if(s[i]=='}')
{
i++;
dancishuzu[dancigeshu].bianhao=22;
strcpy(dancishuzu[dancigeshu].name,"}");
dancigeshu++;
}
else if(s[i]==',')
{
i++;
dancishuzu[dancigeshu].bianhao=23;
strcpy(dancishuzu[dancigeshu].name,",");
dancigeshu++;
}
else if(s[i]==':')
{
i++;
dancishuzu[dancigeshu].bianhao=24;
strcpy(dancishuzu[dancigeshu].name,":");
dancigeshu++;
}
else if(s[i]==';')
{
i++;
dancishuzu[dancigeshu].bianhao=25;
strcpy(dancishuzu[dancigeshu].name,";");
dancigeshu++;
}
else if(s[i]=='>')
{
if(s[i+1]=='=')
{
dancishuzu[dancigeshu].bianhao=28;
strcpy(dancishuzu[dancigeshu].name,">=");
dancigeshu++;
i+=2;
}
else
{
i++;
dancishuzu[dancigeshu].bianhao=26;
strcpy(dancishuzu[dancigeshu].name,">");
dancigeshu++;
}
}
else if(s[i]=='<')
{
if(s[i+1]=='=')
{
dancishuzu[dancigeshu].bianhao=29;
strcpy(dancishuzu[dancigeshu].name,"<=");
dancigeshu++;
i+=2;
}
else
{
i++;
dancishuzu[dancigeshu].bianhao=27;
strcpy(dancishuzu[dancigeshu].name,"<");
dancigeshu++;
}
}
else if(s[i]=='!'&&s[i+1]=='=')
{
dancishuzu[dancigeshu].bianhao=31;
strcpy(dancishuzu[dancigeshu].name,"!=");
dancigeshu++;
i+=2;
}
else
{
printf("\nline:%derror!",line);
i++;
return;
}
}

⑦ 編譯過程包括哪幾個主要階段及每個階段的功能。

【答案】：編譯過程包括詞法分析、語法分析、語義分析和中間代碼生成、優化、目標代碼生成5個階段。
詞法分析的功能是弊則對輸入的高級語言源程序進行詞法分析，識別其中的單詞符號，確定它們的種類，交給語法分析器，即把字元串形式的源程序分解為單詞符號串形式。
語法分析的功能是在詞法分析結果的基礎上，運用語言的語法規則，對程指或序進行語法分析，識別構成程序的各類語法范疇及它們之間的層次關系，並把這種層次關系表達成語法樹的形式。
詞義分析和中間代碼生成的功能是在語法分析的基礎上，對程序進行語義分析，「理解」其含義，產生出表達程序語義的內部表達形式(中間代碼)。表達語義的中間代碼與機器租逗棚代碼相似，可以認為這一步進行了翻譯工作，把源程序翻譯成了與具體機器指令系統無關的抽象指令代碼。
優化的功能是按照等價變換的原則，對語義分析器產生的中間代碼序列進行等價變換，刪除其中多餘的操作，對耗時耗空間的代碼進行優化，以期最後得到高效的可執行代碼。
目標代碼生成的功能是把優化後的中間代碼變換成機器指令代碼，得到可在目標機器上執行的機器語言程序。

導航:首頁 > 源碼編譯 > 編譯詞法分析讀寫代碼

編譯詞法分析讀寫代碼