標號區編譯原理_編譯原理課程設計－詞法分析器設計（C語言）

⑴ 編譯原理全部的名詞解釋

書上有別那麼懶!.
編譯過程的六個階段：詞法分析,語法分析,語義分析,中間代碼生成,代碼優化,目標代碼生成
解釋程序：把某種語言的源程序轉換成等價的另一種語言程序——目標語言程序,然後再執行目標程序.解釋方式是接受某高級語言的一個語句輸入,進行解釋並控制計算機執行,馬上得到這句的執行結果,然後再接受下一句.
編譯程序：就是指這樣一種程序,通過它能夠將用高級語言編寫的源程序轉換成與之在邏輯上等價的低級語言形式的目標程序(機器語言程序或匯編語言程序).
解釋程序和編譯程序的根本區別：是否生成目標代碼
句子的二義性（這里的二義性是指語法結構上的.）:文法G[S]的一個句子如果能找到兩種不同的最左推導(或最右推導),或者存在兩棵不同的語法樹,則稱這個句子是二義性的.
文法的二義性:一個文法如果包含二義性的句子,則這個文法是二義文法,否則是無二義文法.
LL(1)的含義：(LL(1)文法是無二義的； LL(1)文法不含左遞歸)
第1個L：從左到右掃描輸入串第2個L：生成的是最左推導
1 ：向右看1個輸入符號便可決定選擇哪個產生式
某些非LL(1)文法到LL(1)文法的等價變換: 1. 提取公因子 2. 消除左遞歸
文法符號的屬性:單詞的含義,即與文法符號相關的一些信息.如,類型、值、存儲地址等.
一個屬性文法(attribute grammar)是一個三元組A=(G, V, F)
G：上下文無關文法.
V：屬性的有窮集.每個屬性與文法的一個終結符或非終結符相連.屬性與變數一樣,可以進行計算和傳遞.
F：關於屬性的斷言或謂詞(一組屬性的計算規則)的有窮集.斷言或語義規則與一個產生式相聯,只引用該產生式左端或右端的終結符或非終結符相聯的屬性.
綜合屬性:若產生式左部的單非終結符A的屬性值由右部各非終結符的屬性值決定,則A的屬性稱為綜合屬
繼承屬性:若產生式右部符號B的屬性值是根據左部非終結符的屬性值或者右部其它符號的屬性值決定的,則B的屬性為繼承屬性.
(1)非終結符既可有綜合屬性也可有繼承屬性,但文法開始符號沒有繼承屬性.
(2) 終結符只有綜合屬性,沒有繼承屬性,它們由詞法程序提供.
在計算時：綜合屬性沿屬性語法樹向上傳遞；繼承屬性沿屬性語法樹向下傳遞.
語法制導翻譯：是指在語法分析過程中,完成附加在所使用的產生式上的語義規則描述的動作.
語法制導翻譯實現：對單詞符號串進行語法分析,構造語法分析樹,然後根據需要構造屬性依賴圖,遍歷語法樹並在語法樹的各結點處按語義規則進行計算.
中間代碼（中間語言）
1、是復雜性介於源程序語言和機器語言的一種表示形式.
2、一般,快速編譯程序直接生成目標代碼.
3、為了使編譯程序結構在邏輯上更為簡單明確,常採用中間代碼,這樣可以將與機器相關的某些實現細節置於代碼生成階段仔細處理,並且可以在中間代碼一級進行優化工作,使得代碼優化比較容易實現.
何謂中間代碼：源程序的一種內部表示,不依賴目標機的結構,易於代碼的機械生成.
為何要轉換成中間代碼:(1)邏輯結構清楚；利於不同目標機上實現同一種語言.
(2)便於移植,便於修改,便於進行與機器無關的優化.
中間代碼的幾種形式：逆波蘭記號 ,三元式和樹形表示 ,四元式
符號表的一般形式：一張符號表的的組成包括兩項,即名字欄和信息欄.
信息欄包含許多子欄和標志位,用來記錄相應名字和種種不同屬性,名字欄也稱主欄.主欄的內容稱為關鍵字（key word）.
符號表的功能：（1）收集符號屬性 (2) 上下文語義的合法性檢查的依據：檢查標識符屬性在上下文中的一致性和合法性.(3)作為目標代碼生成階段地址分配的依據
符號的主要屬性及作用：
1. 符號名 2. 符號的類型（整型、實型、字元串型等））3. 符號的存儲類別（公共、私有）
4. 符號的作用域及可視性（全局、局部） 5. 符號變數的存儲分配信息（靜態存儲區、動態存儲區）
存儲分配方案策略：靜態存儲分配；動態存儲分配：棧式、堆式.
靜態存儲分配
1、基本策略
在編譯時就安排好目標程序運行時的全部數據空間,並能確定每個數據項的單元地址.
2、適用的分配對象：子程序的目標代碼段；全局數據目標（全局變數）
3、靜態存儲分配的要求：不允許遞歸調用,不含有可變數組.
FORTRAN程序是段結構,不允許遞歸,數據名大小、性質固定. 是典型的靜態分配
動態存儲分配
1、如果一個程序設計語言允許遞歸過程、可變數組或允許用戶自由申請和釋放空間,那麼,就需要採用動態存儲管理技術.
2、兩種動態存儲分配方式：棧式,堆式
棧式動態存儲分配
分配策略：將整個程序的數據空間設計為一個棧.
【例】在具有遞歸結構的語言程序中,每當調用一個過程時,它所需的數據空間就分配在棧頂,每當過程工作結束時就釋放這部分空間.
過程所需的數據空間包括兩部分
一部分是生存期在本過程這次活動中的數據對象.如局部變數、參數單元、臨時變數等；
另一部分則是用以管理過程活動的記錄信息(連接數據).
活動記錄（AR）
一個過程的一次執行所需要的信息使用一個連續的存儲區來管理,這個區 (塊)叫做一個活動記錄.
構成
1、臨時工作單元；2、局部變數；3、機器狀態信息；4、存取鏈；
5、控制鏈；6、實參；7、返回地址
什麼是代碼優化
所謂優化,就是對代碼進行等價變換,使得變換後的代碼運行結果與變換前代碼運行結果相同,而運行速度加快或佔用存儲空間減少.
優化原則：等價原則：經過優化後不應改變程序運行的結果.
有效原則：使優化後所產生的目標代碼運行時間較短,佔用的存儲空間較小.
合算原則：以盡可能低的代價取得較好的優化效果.
常見的優化技術
(1) 刪除多餘運算(刪除公共子表達式) (2) 代碼外提 +刪除歸納變數+ (3)強度削弱; (4)變換循環控制條件 (5)合並已知量與復寫傳播 (6)刪除無用賦值
基本塊定義
程序中只有一個入口和一個出口的一段順序執行的語句序列,稱為程序的一個基本塊.
給我分數啊.

⑵ 編譯原理問題，高手進。

回答下列問題：(30分)
(6分)對於下面程序段
program test (input, output)
var i, j: integer;
procere CAL(x, y: integer);
begin
y:=y*y; x:=x-y; y:=y-x
end;
begin
i:=2; j:=3; CAL(i, j)
writeln(j)
end.
若參數傳遞的方法分別為(1)傳值、(2)傳地址，(3)傳名，請寫出程序執行的輸出結果。
答： (1) 3 (2) 16 (3) 16 (每個值2分)

(6分)計算文法G(M)的每個非終結符的FIRST和FOLLOW集合，並判斷該文法是否是LL(1)的，請說明理由。
G(M)：
M → TB
T → Ba |
B → Db | eT |
D → d |

解答：
計算文法的FIRST和FOLLOW集合：(4分)
FIRST(M) = { a，b，e，d， } FIRST(T) = { a，b，e，d， }
FIRST(B) = {b，e，d， } FIRST(D) = {d，}
FOLLOW (M) = {#} FOLLOW (T) = { a，b，e，d，#}
FOLLOW (B) = {a，# } FOLLOW (D) = { b}

檢查文法的所有產生式，我們可以得到：
1. 該文法不含左遞歸，
2. 該文法中每一個非終結符M，T，B，D的各個產生式的候選首符集兩兩不相交。
3. 該文法的非終結符T、B和D，它們都有候選式，而且
FIRST(T)∩FOLLOW(T)={ a，b，e，d }≠
所以該文法不是LL(1)文法。(2分)

(4分)考慮下面的屬性文法
產生式語義規則
S→ABC

A→a
B→b
C→c B.u := S.u
A.u := B.v + C.v
S.v := A.v
A.v :=3*A.u
B.v := B.u
C.v := 1
畫出字元串abc的語法樹;
對於該語法樹，假設S.u的初始值為5，屬性計算完成後，S.v的值為多少。
答：(1) (2分)

(2) S.v的值為18 (2分)

(4分)運行時的DISPLAY表的內容是什麼？它的作用是什麼？
答：DISPLAY表是嵌套層次顯示表。每當進入一個過程後，在建立它的活動記錄區的同時建立一張嵌套層次顯示表diaplay.假定現在進入的過程層次為i，則它的diaplay表含有i+1個單元，自頂向下每個單元依次存放著現行層、直接外層、…、直至最外層(主程序，0層)等每層過程的最新活動記錄的起始地址。通過DISPLAY表可以訪問其外層過程的變數。

(5分)對下列四元式序列生成目標代碼：
A:=B*C
D:=E+A
G:=B+C
H:=G*D
其中，H在基本塊出口之後是活躍變數， R0和R1是可用寄存器。
答: 目標代碼序列
LD R0 B
MUL R0 C
LD R1 E
ADD R1 R0
LD R0 B
ADD R0 C
MUL R0 R1
ST R0 H

(5分)寫出表達式a+b*(c-d)對應的逆波蘭式、三元式序列和抽象語法樹。
答：
逆波蘭式：(abcd-*+) (1分)
三元式序列: (2分)
OP ARG1 ARG2
(1) - c d
(2) * b (1)
(3) + a (2)
抽象語法樹：(2分)

(8分)構造一個DFA，它接受={a，b}上所有包含ab的字元串。
答：
(2分)構造相應的正規式：(a|b)*ab(a|b)*

(3分)
a a

a b
b b

(3分)確定化：
I
{0,1,2} {1,2,3} {1,2}
{1,2,3} {1,2,3} {1,2,4,5,6}
{1,2} {1,2,3} {1,2}
{1,2,4,5,6} {1,2,3,5,6} {1,2,5,6}
{1,2,3,5,6} {1,2,3,5,6} {1,2,4,5,6}
{1,2,5,6} {1,2,3,5,6} {1,2,5,6}
b b
b a
a a a a

a b b
b

最小化：
{0，1，2} {3，4，5}
{0， 2}，1， {3，4，5}

(6分)寫一個文法使其語言為L(G)={anbncm| m,n≥1，n為奇數，m為偶數}。
答：
文法G(S):

(8分)對於文法G(S):

1. 寫出句型b(Ma)b的最右推導並畫出語法樹。
2. 寫出上述句型的短語，直接短語和句柄。
答：
1. (4分)

2. (4分)
短語: Ma)， (Ma)， b(Ma)b
直接短語: Ma)
句柄: Ma)

(12分)對文法G(S)：
S → a | ^ | (T)
T → T，S | S
(1) 構造各非終結符的FIRSTVT和LASTVT集合;
(2) 構造算符優先表;
(3) 是算符優先文法嗎?
(4) 構造優先函數。
答：
(1) (4分)

(2) (4分)
a ^ ( ) ,
a > >
^ > >
( < < < = <
) > >
, < < < > >

(3) 是算符優先文法，因為任何兩個終結符之間至多隻有一種優先關系。 (1分)

(4) 優先函數(3分)
a ^ ( ) ,
F 4 4 2 4 4
G 5 5 5 2 3

(8分)設某語言的do-while語句的語法形式為
S do S(1) While E
其語義解釋為：

針對自下而上的語法分析器，按如下要求構造該語句的翻譯模式，將該語句翻譯成四元式：
(1) 寫出適合語法制導翻譯的產生式；
(2) 寫出每個產生式對應的語義動作。
答：(1). 適合語法制導翻譯的文法(4分)
G(S):
R do
UR S(1) While
SU E
(2). (4分)
R do
{ R.QUAD:=NXQ }

UR S(1) While
{ U.QUAD:=R.QUAD;
BACKPATCH(S.CHAIN, NXQ) }

SU E
{ BACKPATCH(E.TC, U.QUAD);
S.CHAIN:=E.FC }

答案二：
(1) S do M1 S(1) While M2 E
M ε (4分)
(2) M ε { M.QUAD := NXQ } (4分)
S do M1 S(1) While M2 E
{
BACKPATCH(S(1).CHAIN, M2.QUAD);
BACKPATCH(E.TC, M1.QUAD);
S.CHAIN:=E. FC
}

(10分)將語句
while C>0 do if A B=0 then C:=C+D else C:=C*D
翻譯成四元式。
答：
100 (j>， C， 0， 102)
101 (j， -， -， 112)
102 (jnz， A， -， 106)
103 (j， -， -， 104)
104 (j=， B， 0， 106)
105 (j， -， -， 109)
106 (+， C， D， T1)
107 (:=， T1， -， C)
108 (j， -， -， 100)
109 (*， C， D， T2)
110 (:=， T2， -， C)
111 (j， -， -， 100)
112

(10分)設有基本塊如下：
T1:=3
T2:=A*B
T3:=9+T1
M:=A*B
T4:=C-D
L:=T3*T4
T2:=C+D
N:=T2
畫出DAG圖；
設L，M，N 是出基本塊後的活躍變數，請給出優化後的四元式序列。
答：

1. (6分)
L

*
T2,M T4 T2,N

* - +

T1 T3
3 A B 12 C D

2. (4分)
M:=A*B
S1:=C-D
L:=12*S1
N:=C+D

(8分)文法G(S)及其LR分析表如下，請給出串baba#的分析過程。
(1) S → DbB (2) D → d (3) D → ε
(4) B → a (5) B → Bba (6) B → ε
LR分析表
ACTION GOTO
b D a # S B D
0 r3 s3 1 2
1 acc
2 s4
3 r2
4 r6 S5 r6 6
5 r4 r4
6 s7 r1
7 S8
8 r5 r5
解答：
步驟狀態符號輸入串
0 0 # baba#
1 02 #D baba#
2 024 #Db aba#
3 0245 #Dba ba#
4 0246 #DbB ba#
5 02467 #DbBb a#
6 024678 #DbBba #
7 0246 #DbB #
8 01 #S # acc
哈哈，估計認識！！

⑶ 編譯原理課程設計－詞法分析器設計（C語言）

#include"stdio.h"/*定義I/O庫所用的某些宏和變數*/

#include"string.h"/*定義字元串庫函數*/

#include"conio.h"/*提供有關屏幕窗口操作函數*/

#include"ctype.h"/*分類函數*/

charprog[80]={''},

token[8];/*存放構成單詞符號的字元串*/

charch;

intsyn,/*存放單詞字元的種別碼*/

sum,/*存放整數型單詞*/

m,p;/*p是緩沖區prog的指針，m是token的指針*/

char*rwtab[6]={"begin","if","then","while","do","end"};

voidscaner(){

m=0;

sum=0;

for(n=0;n<8;n++)

token[n]='';

ch=prog[p++];

while(ch=='')

ch=prog[p++];

if(isalpha(ch))/*ch為字母字元*/{

while(isalpha(ch)||isdigit(ch))/*ch為字母字元或者數字字元*/{

token[m++]=ch;

ch=prog[p++];}

token[m++]='';

ch=prog[p--];

syn=10;

for(n=0;n<6;n++)

if(strcmp(token,rwtab[n])==0)/*字元串的比較*/{

syn=n+1;

break;}}

else

if(isdigit(ch))/*ch是數字字元*/{

while(isdigit(ch))/*ch是數字字元*/{

sum=sum*10+ch-'0';

ch=prog[p++];}

ch=prog[p--];

syn=11;}

else

switch(ch){

case'<':m=0;token[m++]=ch;ch=prog[p++];

if(ch=='>'){

syn=21;

token[m++]=ch;}

elseif(ch=='='){

syn=22;

token[m++]=ch;}

else{

syn=20;

ch=prog[p--];}

break;

case'>':m=0;token[m++]=ch;ch=prog[p++];

if(ch=='='){

syn=24;

token[m++]=ch;}

else{

syn=23;

ch=prog[p--];}

break;

case':':m=0;token[m++]=ch;ch=prog[p++];

if(ch=='='){

syn=18;

token[m++]=ch;}

else{

syn=17;

ch=prog[p--];}

break;

case'+':syn=13;token[0]=ch;break;

case'-':syn=14;token[0]=ch;break;

case'*':syn=15;token[0]=ch;break;

case'/':syn=16;token[0]=ch;break;

case'=':syn=25;token[0]=ch;break;

case';':syn=26;token[0]=ch;break;

case'(':syn=27;token[0]=ch;break;

case')':syn=28;token[0]=ch;break;

case'#':syn=0;token[0]=ch;break;

default:syn=-1;}}

main()

{

printf(" Thesignificanceofthefigures: "

"1.figures1to6saidKeyword "

"2. "

"3.figures13to28saidOperators ");

p=0;

printf(" pleaseinputstring: ");

do{

ch=getchar();

prog[p++]=ch;

}while(ch!='#');

p=0;

do{

scaner();

switch(syn){

case11:printf("(%d,%d) ",syn,sum);break;

case-1:printf(" ERROR; ");break;

default:printf("(%d,%s) ",syn,token);

}

}while(syn!=0);

getch();

}

程序測試結果

對源程序beginx:=9:ifx>9thenx:=2*x+1/3;end#的源文件，經過詞法分析後輸出如下圖5-1所示：

具體的你在修改修改吧

⑷ 編譯原理三元式a:=0怎麼樣表示呢

一.(15分)有表達式如下:A+B*(C-D)**N (**為冪乘) (1)給出該表達式的逆波蘭式表示(後綴式); (2)給出上述表達式的四元式和三元式序列. 一起考研社區真情奉獻二.(15分)有C程序如下: main() { printf("%d,%d,%d\n",10); } (1)試著寫出上述printf語句輸出的結果; (2)從運行環境和printf的實現分析為什麼會有這樣的輸出結果. www.17ky.cn獨家資料三.(5分)構造一個DFA(確定的有限自動機),使之接受含偶數個"1"的0,1串集. www.17ky.cn會員奉獻四.(5分)有文法G,其產生式如下: S->S(S), S->ε /*空產生式*/ 試寫出一個語法制導定義,它輸出配對的括弧個數. www.17ky.cn獨家提供五.(10分)已知某語言L={a^(m)b^(n)|n>m>=0}.試寫出產生該語言的兩個文法G1和 G2,其中G1是LR(1)文法,G2是非LR(1)和非二義性文法. 更多考研真題，請光臨www.17ky.cn 六.填空(每空一分,共20分) 1.現代操作系統的兩個最基本的特徵是___和___. 2.進程式控制制塊的初始化工作包括___,___和___. 3.在操作系統中引入線程概念的主要目的是___. 4.unix系統v中,系統向用戶提供的用於創建新進程的系統調用是___;用於建立無名管道的系統調用是___;用於創建有名管道的系統調用是___. 5.unix系統v中,引起進程調度的原因有___,___,___和___等. 6.在分區分配演算法中,首次適應演算法傾向於優先利用內存中___部分的空閑分區,從而保留了___部分的大空閑區. 7.進行設備分配時所需的數據表格主要有___,___,___和___等. 8.利用符號鏈實現文件共享時,對文件主刪除了共享文件後造成的指針懸空問題,解決的方法是___. 更多考研真題，請光臨www.17ky.cn 七.(8分)在消息傳遞通信方式下, A.發送進程和接收進程在通信過程中可以採用那三種同步方式? B.試以下面給出的發送進程和接收進程(將接收到的數據存入S)為例,說明當接收進程執行到標號為L2的語句時,採用這三種同步方式,X的值可能各是多少? 一起考研社區真情奉獻發送進程P: 接收進程Q: M=10; L1: send M to Q; L1: receive S from P; L2: M=20; L2: X:=S+1; goto L1; 更多考研真題，請光臨www.17ky.cn 八.(8分)一系統具有150個存儲單元,在T0時刻按下表所示分配給3個進程: 進程Maximum demand Current allocation P1 70 25 P2 60 40 P3 60 45 對下列請求應用銀行家演算法分析判定是否是安全的: A.第4個進程P4到達,最大需求60個存儲單元,當前請求分配25個單元. B.第4個進程P4到達,最大需求50個存儲單元,當前請求分配35個單元. 如果是安全的請給出一個可能的進程安全執行序列.如果是不安全的,請說明原因. 更多考研真題，請光臨www.17ky.cn 九、(14分)設正在處理器上執行的一個進程的頁表如下.頁表的虛頁號和物理塊號是十進制數,起始頁號(塊號)均為0.所有的地址均是存儲器位元組地址,頁的大小為 1024位元組. A.詳述在設有快表的請求分頁存儲管理系統中,一個虛地址轉換成物理內存地址的過程. B.下列虛地址對應與什麼物理地址: (1)5499; (2) 2221; 虛頁號狀態位訪問位修改位物理塊號 0 1 1 0 4 1 1 1 1 7 2 0 0 0 --- 3 1 0 0 2 4 0 0 0 --- 5 1 0 1 0 www.17ky.cn獨家提供注釋:訪問位---當某頁被訪問時,其訪問位被置為1. www.17ky.cn考研人的成功俱樂部編譯原理與操作系統參考答案一. (1)後綴式:ABCD-*+ECD-N**/+ (2) 四元式三元式 (1)( - , C , D , t1) (1)( - , C , D ) (2)( * , B , t1, t2) (2)( * , B ,(1)) (3)( +, A , t2, t3) (3)( +, A ,(2)) (4)( - , C , D, t4) (4)( - , C , D ) (5)(**, t4, N , t5) (5)(**, (4), N) (6)( / , E , t5, t6) (6)( / ,E ,(5)) (7)( +, t3, t6, t7) (7)( +,(3),(6))

⑸ 編譯原理，子集法將NFA確定為DFA，求問，表格中的部分都是怎麼來的

我也在看這個。
先以S開始，經過任意個ε得到的結點就是第一個I，這道題就是{X，1,2}，
然後將{X，1,2}中的每一個字元經過a（中間可以有ε）後得到的結點加起來，X的Ia={1,2}，
1的Ia={1,2}，2的Ia是空集，所以這一行的Ia={1,2}。
後面的Ib也是一樣，只不過是經過b後得到的結點的集合。
然後分別將前面的Ia和Ib作為I計算新的Ia和Ib。
再將這些集合依次標號，這道題是{X，1,2}為X，{1,2}為1，{1,2,3}為2，{1,2，Y}為3，根據上面那個表就可以把圖畫出來了。

⑹ 【編譯原理】第二章：語言和文法

上述文法表示，該文法由終結符集合，非終結符集合，產生式集合，以及開始符號構成。
而產生式表示，一個表達式（Expression），可以由一個標識符（Identifier）、或者兩個表達式由加號或乘號連接、或者另一個表達式用括弧包裹（）構成。

約定：在不引起歧義的情況下，可以只寫產生式。如以上文法可以簡寫為：

產生式

可以簡寫為：

如上例中，

可以簡寫為：

給定文法，如果有，那麼可以將符號串重寫為，記作，這個過程稱為推導。
如上例中，可以推導出或或等等。

如果，
可以記作，則稱為經過n步推導出，記作。

推導的反過程稱為歸約。

如果，則稱是的一個 句型（sentential form ）。

由文法的開始符號推導出的所有句子構成的集合稱為 文法G生成的語言 ，記作。
即：

例
文法

表示什麼呢？
代表小寫字母；
代表數字；
表示若干個字母和數字構成的字元串；
說明是一個字母、或者是字母開頭的字元串。
那麼這個文法表示的即是，以字母開頭的、非空的字元串，即標識符的構成方式。

並、連接、冪、克林閉包、正閉包。
如上例表示為：

中必須包含一個 非終結符 。

產生式一般形式：
即上式中只有當上下文滿足與時，才能進行從到的推導。

上下文有關文法不包含空產生式（）。

產生式的一般形式：
即產生式左邊都是非終結符。

右線性文法 ：
左線性文法 ：
以上都成為正則文法。
即產生式的右側只能有一個終結符，且所有終結符只能在同一側。

例：（右線性文法）

以上文法滿足右線性文法。
以上文法生成一個以字母開頭的字母數字串（標識符）。
以上文法等價於 上下文無關文法 ：

正則文法能描述程序設計語言中的多數單詞。

正則文法能描述程序設計語言中的多數單詞，但不能表示句子構造，所以用到最多的是CFG。

根節點 表示文法開始符號S；
內部節點 表示對產生式的應用；該節點的標號是產生式左部，子節點從左到右表示了產生式的右部；
葉節點 （又稱邊緣）既可以是非終結符也可以是終結符。

給定一個句型，其分析樹的每一棵子樹的邊緣稱為該句型的一個短語。
如果子樹高度為2，那麼這棵子樹的邊緣稱為該句型的一個 直接短語 。

直接短語一定是某產生式的右部，但反之不一定。

如果一個文法可以為某個句子生成 多棵分析樹 ，則稱這個文法是 二義性的 。

二義性原因：多個if只有一個else；
消岐規則：每個else只與最近的if匹配。

⑺ 給力！2011年新年散分啦。高分求助編譯原理高手幫忙做幾道模擬題

三、（ 8 分）化簡文法 G[S] ：
S → ASe | BCaD | aD | AC
A → Cb | DBS
C → bC | d
B → Ac
D → Ad
化簡後： S → ASe|AC A → Cb C → bC | d
四、（ 12 分）設 L í {a,b,c}* 是滿足下述條件的符號串構成的語言：
(1)若出現 a ，則其後至少緊跟兩個 c ；
(2)若出現 b ，其後至少緊跟一個 c 。
試構造識別 L 的最小化的 DFA ，並給出描述 L 的正規表達式。
答：DFA 如圖所示。相應的正規式為 (c|acc|bc)* 。

五、（ 12 分）已給文法 G[S] ： S → SaP | Sf | P P → qbP | q
將 G[S] 改造成 LL （ 1 ）文法，並給出 LL （ 1 ）分析表。
答：改造後的文法： S → PS' S' → aPS'| fS' | e P → qP' P' → bP | e
各候選式的 FIRST 集，各非終結符的 FOLLOW 集為
產生式 FIRST 集 FOLLOW 集
S → PS' {q} {#}
S' → aPS'
→ fS'
→ e {a}
{f}
{ e } {#}
P → qP' {q} {a,f,#}
P' → bP
→ e {b}
{ e } {a,f,#}
LL(1) 分析表為

六、（ 12 分）給定文法 G[S] ： S → Aa|dAb|Bb|dBa A → c B → c
構造文法 G[S] 的 LR （ 1 ）分析表。
分析表如下圖所示

七、（ 8 分）將下面的條件語句表示成逆波蘭式和四元式序列：
if a>b then x:=a+b*c else x:=b-a;
答：（ 1 ）逆波蘭式：
,其中， BLE 表示汪或等於時的轉向指令； [ … ] 表示標號。
（ 2 ）四元式：
(1) ( j>, a, b, (3))
(2) ( j, , , (7) )
(3) ( *, b, c, T1)
(4) ( +, a, T1, T2)
(5) ( :=, T2, , x)
(6) ( j, , , (9))
(7) ( -, b, a, T3)
(8) ( :=, T3, , x)
(9) ( … … )
八、（ 8 分）給定基本塊：
A:=3*5
B:=E+F
C:=A+12
D:=E+F
A:=D+12
C:=C+1
E:=E+F
假定出基本塊後，只有 A 、 C 、 E 是活躍的，給出用 DAG 圖完成優化後的代碼序列。
答：化簡後的的四元式序列為
A :=D+12
E :=E+F
C :=28

⑻ 陳火旺編譯原理什麼是符號表符號表有哪些重要作用

符號表在編譯程序工作的過程中需要不斷收集、記錄和使用源程序中一些語法符號的類型和特徵等相關信息。這些信息一般以表格形式存儲於系統中。如常數表、變數名表、數組名表、過程名表、標號表等等，統稱為符號表。對於符號表組織、構造和管理方...

⑼ 編譯原理詞法分析

C語言詞法分析器
#include<iostream>
#include<stdio.h>
#include<string>

using namespace std;

FILE *f; //定義一個文件變數
static int line = 1; //表示游標所在的行數
struct ID{ char *name; int count;}id[100];//用於存放ID號碼
static int I = 0; //用於記錄ID存放的數量
int Number[100]; //用於存放數字
static int P = 0; //用於記錄存放數字的個數
int error[100] = {0}; //用於記錄錯誤所在的行數
static int K = 0; //記錄錯誤次數
void Error(); //記錄錯誤
void loginID(char *); //注冊ID號
void loginNumber(int &); //記錄數字
void noteLine(char &); //記錄游標所在的行數
void print(); //輸出分析結果
int same(char *chr); //判斷單詞是否已經存在

void Error()
{ error[K++] = line; }

void loginID(char *chr) //注冊ID號
{
int k = 0;
int h = 0;
for(int i = 0; i < I; i++)
{
if(!strcmp(chr,id.name)) //如果單詞已經存在
{
id.count++;
k = 1;
}
}
if(k == 0) //該單詞不存在
{
h = I + 1;
//I = h;
id[h].count++;
id[h].name = chr;
//strcpy(id[h].name ,chr);
}

}

void loginNumber(int &nu)
{ Number[P++] = nu; }

void noteLine(char &ch)
{
if ( ch == ' ' )
++line;
}

void print()//輸出部分
{
//cout << "關鍵字以及變數:" << endl;
//for(int i = 0; i < 100; i++)
//cout << i <<" " << id.name << " " << id.count << endl;
cout << "數字：" << endl;
for(int i = 1; i <= P; i++)
cout << i << ": " << Number[i-1] << endl;
if(error[0] != 0)
{
cout << "出現的錯誤！" << endl;
for(int i = 1; i <= K; i++)
cout << "第" << i << "個錯誤： " << "第" << error[i-1] << "行" << endl;
}
else cout << "沒有錯誤！" << endl;
}

//文件處理部分
void noblank( char &ch) //跳過空格，回車
{
noteLine(ch);
while(ch == ' ' || ch == ' ')
ch = fgetc(f);
}

void identifier(char name[],char &ch)//字母變數
{

int i;
for(i = 0; i < 20; i++)
name = '';
i = 0;
while (('0'<= ch && ch <= '9')||('a'<= ch&&ch <= 'z')||('A'<= ch&&ch <='Z'))
{
name = ch;
i++;
ch = fgetc(f);
}
loginID(name);
//for(int j = 0; j < i; j++)
//{cout << name[j];}
// cout << ' ';

}

int number(char &ch)//數字
{
int num=0;
while('0'<= ch && ch <= '9')
{
num = num* 10 + (ch-'0');
ch = fgetc(f);
}
if( ('a'<= ch&&ch <= 'z')||('A'<= ch&&ch <='Z'))
{
Error();
}
else if( ch == '.')
{;}
loginNumber(num); //記錄數字
return num;
}

void test(char &ch)//符號
{
char str[2]={'0/'};
if(ch == '*')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '.')
{ str[0] = ch; ch = fgetc(f);}
if(ch == ',')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '"')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '/')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '%')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '^')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '-')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '{')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '}')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '[')
{ str[0] = ch; ch = fgetc(f);}
if(ch == ']')
{ str[0] = ch; ch = fgetc(f);}
if(ch == ';')
{str[0] = ch; ch = fgetc(f);}
if(ch == ':')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '?')
{ str[0] = ch; ch = fgetc(f);}
if(ch == '(')
{ str[0] = ch; ch = fgetc(f);}
if(ch == ')')
{str[0] = ch; ch = fgetc(f);}
if(ch =='+')
{

str[0] = ch;
if((ch = fgetc(f)) == '+' )
{
str[1] = ch;
ch = fgetc(f);
//cout << str[0] << str[1] << endl;
}

//cout << str[0]<< endl;
}
if(ch == '-')
{

str[0] = ch;
if((ch = fgetc(f)) == '-' )
{
str[1] = ch;
ch = fgetc(f);
//cout << str[0] << str[1] << endl;
}

//cout << str[0]<< endl;
}
if(ch == '&')
{

str[0] = ch;
if((ch = fgetc(f)) == '&' )
{
str[1] = ch;
ch = fgetc(f);
//cout << str[0] << str[1] << endl;
}

//cout << str[0]<< endl;
}
if(ch == '|')
{

str[0] = ch;
if((ch = fgetc(f)) == '|' )
{
str[1] = ch;
ch = fgetc(f);
//cout << str[0] << str[1] << endl;
}

//cout << str[0]<< endl;
}
if(ch == '!')
{

str[0] = ch;
if((ch = fgetc(f)) == '=' )
{
str[1] = ch;
ch = fgetc(f);
//cout << str[0] << str[1] << endl;
}

//cout << str[0]<< endl;
}
if(ch == '=')
{

str[0] = ch;
if((ch = fgetc(f)) == '=' )
{
str[1] = ch;
ch = fgetc(f);
//cout << str[0] << str[1] << endl;
}

}
if(ch == '>')
{

str[0] = ch;
if((ch = fgetc(f)) == '=' )
{
str[1] = ch;
ch = fgetc(f);
//cout << str[0] << str[1] << endl;
}
else
if(ch == '>' )
{
str[1] = ch;
ch = fgetc(f);
//cout << str[0] << str[1] << endl;
}

}
if(ch == '<')
{
str[0] = ch;
if((ch = fgetc(f)) == '=' )
{
str[1] = ch;
ch = fgetc(f);
}
else
if(ch == '<' )
{
str[1] = ch;
ch = fgetc(f);
}

}

}

int main()
{
char ch;
char name[30];
for(int i = 0; i < 30; i++)
name = '/0';
f = fopen("c.txt","r"); //打開指定輸入文件
if (f == NULL)
cout<<"文件不存在！"<<endl;
ch = fgetc(f);
while(!feof(f))
{
noblank( ch ); //跳過回車，空格
if( ( ch >= 'a' && ch <= 'z' )||( ch >= 'A' && ch <= 'Z' ))
{ identifier(name,ch); } //處理字母
else if( ch >= '0'&& ch <= '9')
{ number(ch); } //處理數字
else
{ test(ch); } //處理符號
}
print(); //列印詞法分析結果
fclose(f); //關閉文件
system("pause");
return 0;
}

⑽ 編譯程序有編譯和翻譯兩種方式分別對其說明並比較急在線等

編譯程序編譯程序
compiler
把用高級程序設計語言書寫的源程序，翻譯成等價的計算機匯編語言或機器語言的目標程序的翻譯程序。編譯程序屬於採用生成性實現途徑實現的翻譯程序。它以高級程序設計語言書寫的源程序作為輸入，而以匯編語言或機器語言表示的目標程序作為輸出。編譯出的目標程序通常還要經歷運行階段，以便在運行程序的支持下運行，加工初始數據，算出所需的計算結果。編譯程序的實現演算法較為復雜。這是因為它所翻譯的語句與目標語言的指令不是一一對應關系,而是一多對應關系;同時也因為它要處理遞歸調用、動態存儲分配、多種數據類型，以及語句間的緊密依賴關系。但是，由於高級程序設計語言書寫的程序具有易讀、易移植和表達能力強等特點，編譯程序廣泛地用於翻譯規模較大、復雜性較高、且需要高效運行的高級語言書寫的源程序。
功能編譯程序的基本功能是把源程序翻譯成目標程序。但是,作為一個具有實際應用價值的編譯系統,除了基本功能之外，還應具備語法檢查、調試措施、修改手段、覆蓋處理、目標程序優化、不同語言合用以及人-機聯系等重要功能。①語法檢查:檢查源程序是否合乎語法。如果不符合語法，編譯程序要指出語法錯誤的部位、性質和有關信息。編譯程序應使用戶一次上機，能夠盡可能多地查出錯誤。②調試措施：檢查源程序是否合乎設計者的意圖。為此，要求編譯程序在編譯出的目標程序中安置一些輸出指令，以便在目標程序運行時能輸出程序動態執行情況的信息，如變數值的更改、程序執行時所經歷的線路等。這些信息有助於用戶核實和驗證源程序是否表達了演算法要求。③修改手段：為用戶提供簡便的修改源程序的手段。編譯程序通常要提供批量修改手段（用於修改數量較大或臨時不易修改的錯誤）和現場修改手段（用於運行時修改數量較少、臨時易改的錯誤）。④覆蓋處理：主要是為處理程序長、數據量大的大型問題程序而設置的。基本思想是讓一些程序段和數據公用某些存儲區，其中只存放當前要用的程序或數據;其餘暫時不用的程序和數據,先存放在磁碟等輔助存儲器中，待需要時動態地調入。⑤目標程序優化：提高目標程序的質量,即佔用的存儲空間少,程序的運行時間短。依據優化目標的不同，編譯程序可選擇實現表達式優化、循環優化或程序全局優化。目標程序優化有的在源程序級上進行，有的在目標程序級上進行。⑥不同語言合用：其功能有助於用戶利用多種程序設計語言編寫應用程序或套用已有的不同語言書寫的程序模塊。最為常見的是高級語言和匯編語言的合用。這不但可以彌補高級語言難於表達某些非數值加工操作或直接控制、訪問外圍設備和硬體寄存器之不足，而且還有利於用匯編語言編寫核心部分程序,以提高運行效率。⑦人-機聯系：確定編譯程序實現方案時達到精心設計的功能。目的是便於用戶在編譯和運行階段及時了解內部工作情況，有效地監督、控制系統的運行。
早期編譯程序的實現方案，是把上述各項功能完全收納在編譯程序之中。然而，習慣做法是在操作系統的支持下，配置調試程序、編輯程序和連接裝配程序，用以協助實現程序的調試、修改、覆蓋處理，以及不同語言合用功能。但在設計編譯程序時，仍須精心考慮如何與這些子系統銜接等問題。
工作過程編譯程序必須分析源程序，然後綜合成目標程序。首先，檢查源程序的正確性，並把它分解成若干基本成分；其次，再根據這些基本成分建立相應等價的目標程序部分。為了完成這些工作，編譯程序要在分析階段建立一些表格,改造源程序為中間語言形式,以便在分析和綜合時易於引用和加工（圖1）。
數據結構分析和綜合時所用的主要數據結構，包括符號表、常數表和中間語言程序。符號表由源程序中所用的標識符連同它們的屬性組成，其中屬性包括種類（如變數、數組、結構、函數、過程等）、類型（如整型、實型、字元串、復型、標號等），以及目標程序所需的其他信息。常數表由源程序中用的常數組成，其中包括常數的機內表示，以及分配給它們的目標程序地址。中間語言程序是將源程序翻譯為目標程序前引入的一種中間形式的程序，其表示形式的選擇取決於編譯程序以後如何使用和加工它。常用的中間語言形式有波蘭表示、三元組、四元組以及間接三元組等。
分析部分源程序的分析是經過詞法分析、語法分析和語義分析三個步驟實現的。詞法分析由詞法分析程序（又稱為掃描程序）完成，其任務是識別單詞（即標識符、常數、保留字，以及各種運算符、標點符號等）、造符號表和常數表，以及將源程序換碼為編譯程序易於分析和加工的內部形式。語法分析程序是編譯程序的核心部分，其主要任務是根據語言的語法規則，檢查源程序是否合乎語法。如不合乎語法，則輸出語法出錯信息；如合乎語法，則分解源程序的語法結構，構造中間語言形式的內部程序。語法分析的目的是掌握單詞是怎樣組成語句的，以及語句又是如何組成程序的。語義分析程序是進一步檢查合法程序結構的語義正確性，其目的是保證標識符和常數的正確使用，把必要的信息收集和保存到符號表或中間語言程序中，並進行相應的語義處理。
綜合部分綜合階段必須根據符號表和中間語言程序產生出目標程序，其主要工作包括代碼優化、存儲分配和代碼生成。代碼優化是通過重排和改變程序中的某些操作，以產生更加有效的目標程序。存儲分配的任務是為程序和數據分配運行時的存儲單元。代碼生成的主要任務是產生與中間語言程序符等價的目標程序，順序加工中間語言程序，並利用符號表和常數表中的信息生成一系列的匯編語言或機器語言指令。
結構編譯過程分為分析和綜合兩個部分，並進一步劃分為詞法分析、語法分析、語義分析、代碼優化、存儲分配和代碼生成等六個相繼的邏輯步驟。這六個步驟只表示編譯程序各部分之間的邏輯聯系，而不是時間關系。編譯過程既可以按照這六個邏輯步驟順序地執行，也可以按照平行互鎖方式去執行。在確定編譯程序的具體結構時，常常分若干遍實現。對於源程序或中間語言程序，從頭到尾掃視一次並實現所規定的工作稱作一遍。每一遍可以完成一個或相連幾個邏輯步驟的工作。例如，可以把詞法分析作為第一遍；語法分析和語義分析作為第二遍；代碼優化和存儲分配作為第三遍；代碼生成作為第四遍。反之，為了適應較小的存儲空間或提高目標程序質量，也可以把一個邏輯步驟的工作分為幾遍去執行。例如，代碼優化可劃分為代碼優化准備工作和實際代碼優化兩遍進行。
一個編譯程序是否分遍,以及如何分遍,根據具體情況而定。其判別標准可以是存儲容量的大小、源語言的繁簡、解題范圍的寬窄，以及設計、編制人員的多少等。分遍的好處是各遍功能獨立單純、相互聯系簡單、邏輯結構清晰、優化准備工作充分。缺點是各遍之中不可避免地要有些重復的部分，而且遍和遍之間要有交接工作，因之增加了編譯程序的長度和編譯時間。
一遍編譯程序是一種極端情況，整個編譯程序同時駐留在內存,彼此之間採用調用轉接方式連接在一起(圖2)。當語法分析程序需要新符號時，它就調用詞法分析程序；當它識別出某一語法結構時，它就調用語義分析程序。語義分析程序對識別出的結構進行語義檢查，並調用「存儲分配」和「代碼生成」程序生成相應的目標語言指令。
隨著程序設計語言在形式化、結構化、直觀化和智能化等方面的發展，作為實現相應語言功能的編譯程序，也正向自動程序設計的目標發展，以便提供理想的程序設計工具。
參考書目
陳火旺、錢家驊、孫永強編：《編譯原理》，國防工業出版社，北京，1980。
A.V.Aho, Principles of Compiler Design,Addison Wes-ley, Reading, Massachusetts, 1977.
--------------------------------------------------------------------------------
編譯程序 (compiler)
將用高級程序設計語言書寫的源程序，翻譯成等價的用計算機匯編語言、機器語言或某種中間語言表示的目標程序的翻譯程序。用戶利用編譯程序實現數據處理任務時，先要經歷編譯階段，再經歷運行階段。編譯階段以源程序作為輸入，以目標程序作為輸出，其主要任務是將源程序翻譯成目標程序。運行階段的任務是運行所編譯出的目標程序，實現源程序中指定的數據處理任務，其工作通常包括：輸入初始數據，對數據或文件進行數據加工，輸出必要信息和加工結果等。編譯程序的實現演算法較為復雜。這是因為它所翻譯的語句與目標語言的指令不是一一對應關系，而是一多對應關系；同時因為它要在編譯階段處理遞歸調用、動態存儲分配、多種數據類型實現、代碼生成與代碼優化等繁雜技術問題；還要在運行階段提供良好、有效的運行環境。由於高級程序設計語言書寫的程序具有易讀、易移植和表達能力強等特點，所以編譯程序廣泛地用於翻譯規模較大、復雜性較高、且需要高效運行的高級語言書寫的源程序。
功能編譯程序的基本功能是把源程序翻譯成目標程序。此外，還要具備語法檢查、調試措施、修改手段、覆蓋處理、目標程序優化、不同語言合用以及人機聯系等具有實際應用價值的重要功能。①語法檢查。檢查源程序是否合乎語法。②調試措施。檢查源程序是否合乎用戶的設計意圖。③修改手段。為用戶提供簡便的修改源程序的手段。④覆蓋處理。主要為處理程序較長、數據量較大的大型問題程序而設置。基本思想是讓一些程序段和數據公用某些存儲區，其中只存放當前要用的程序段或數據，其餘暫時不用的程序段和數據均存放在磁碟等輔助存儲器中，待需要時動態地調入存儲區中運行。⑤目標程序優化。提高目標程序的質量，即使編譯出的目標程序運行時間短、佔用存儲少。⑥不同語言合用。便於用戶利用多種程序設計語言編寫應用程序或套用已有的不同語言書寫的程序模塊。最為常見的是高級語言和匯編語言的合用。⑦人機聯系。便於用戶在編譯和運行階段及時了解系統內部工作情況，有效地監督、控制系統的運行。
早期編譯程序的實現方案，是把上述各項功能完全收納在編譯程序之中。後來的習慣方法是在操作系統的支持下，配置編輯程序、調試程序、連接裝配程序等實用程序或工具軟體，目的是創造一個良好的開發環境和運行環境，便於應用軟體的編程、修改、調試、集成以及報表生成、界面設計等工作。但編譯程序設計者設計編譯方案時，仍需精心考慮上述各項功能，較好地解決目標程序與這些實用程序或軟體工具之間的配合與銜接等問題。
工作過程編譯程序必須分析源程序，然後綜合成目標程序。為達到這個目的，編譯程序要在分析階段建立一些表格，改造源程序為中間語言形式，以便在分析和綜合時易於引用和加工。
數據結構分析和綜合時所用的主要數據結構，包括符號表、常數表和中間語言程序。符號表由源程序中所用的標識符連同它們的屬性組成，其中屬性包括種類（如變數、數組、結構、函數、過程等）、類型（如整型、實型、字元串、復型、標號等），以及目標程序所需的其他信息。常數表由源程序中用的常數組成，其中包括常數的機內表示以及分配給它們的目標程序地址。中間語言程序是將源程序翻譯成目標程序前引入的一種中間形式的程序，其表示形式的選擇取決於編譯程序以後如何使用它和如何加工它。常用的中間語言形式有波蘭表示、三元組、四元組以及間接三元組等。
分析部分源程序的分析是經過詞法分析、語法分析和語義分析三個步驟實現的。詞法分析由詞法分析程序（又稱為掃描程序）完成，其任務是識別單詞（即標識符、常數、保留字，以及各種運算符、標點符號等）、造符號表和常數表，以及將源程序換碼為編譯程序易於分析和加工的內部形式。語法分析程序是編譯程序的核心部分，其主要任務是根據語言的語法規則，檢查源程序是否合乎語法，並分解源程序。如果不合乎語法，則輸出語法出錯信息；如果合乎語法，則分解源程序的語法結構，構造中間語言形式的內部程序。語法分析的目的是掌握單詞是怎樣組成語句的，以及語句又是如何組成程序的。語義分析程序進一步檢查合法程序結構的語義正確性，其目的是保證標識符和常數的正確使用，把必要的信息收集和保存到符號表或中間語言程序中，並進行相應的語義處理。
綜合部分綜合階段根據符號表和中間語言程序產生出目標程序，其主要工作包括代碼優化、存儲分配和代碼生成。代碼優化是通過重排和改變程序中的某些操作，以產生更加有效的目標程序。存儲分配是為程序和數據分配運行時的存儲單元。代碼生成是產生與中間語言程序等價的目標程序，亦即，順序加工中間語言程序，利用符號表和常數表中的信息生成一系列的匯編語言或機器語言指令。
動態 20世紀80年代以後，程序設計語言在形式化、結構化、直觀化和智能化等方面有了長足的進步和發展，主要表現在兩個方面：①隨著程序設計理論和方法的發展，相繼推出了一系列新型程序設計語言，如結構化程序設計語言、並發程序設計語言、分布式程序設計語言、函數式程序設計語言、智能化程序設計語言、面向對象程序設計語言等；②基於語法、語義和語用方面的研究成果，從不同的角度和層次上深刻地揭示了程序設計語言的內在規律和外在表現形式。與此相應地，作為實現程序設計語言重要手段之一的編譯程序，在體系結構、設計思想、實現技術和處理內容等方面均有不同程度的發展、變化和擴充。另外，編譯程序已作為實現編程的重要軟體工具，被納入到軟體支援環境的基本層軟體工具之中。因此，規劃編譯程序實現方案時，應從所處的具體軟體支援環境出發，既要遵循整個環境的全局性要求和規定，又要精心考慮與其他諸層軟體工具之間的相互支援、配合和銜接關系。

導航:首頁 > 源碼編譯 > 標號區編譯原理

標號區編譯原理

與標號區編譯原理相關的資料