簡單的文本編譯器演算法_什麼是編譯原理

❶ 演算法與程序的區別與聯系

演算法和程序的區別是：

(1) 兩者定義不同。演算法是對特定問題求解步驟的描述，它是有限序列指令。而程序是實現預期目的而進行操作的一系列語句和指令。

說通俗一些演算法是解決一個問題的思路，程序，是解決這些問題所具體好寫的代碼。演算法沒有語言界限。他只是一個思路。為實現相同的一個演算法，用不同語言編寫的程序會不一樣。

(2)兩者的書寫規定不同。程序必須用規定的程序設計語言來寫，而演算法很隨意。演算法是一系列解決問題的清晰指令，也就是說，能夠對一定規范的輸入，在有限時間內獲得所要求的輸出。演算法常常含有重復的步驟和一些邏輯判斷。

簡單演算法舉例例：求 1*2*3*4*5

步驟 1 ：先求 1*2 ，得到結果 2 。

步驟 2 ：將步驟 1 得到的乘積 2 再乘以 3 ，得到結果 6 。

步驟 3 ：將步驟 2 得到的乘積 6 再乘以 4 ，得到結果 24 。

步驟 4 ：將步驟 3 得到的乘積 24 再乘以 5 ，得到最後結果 120 。

演算法與程序的聯系：

演算法和程序都是指令的有限序列，但是程序是演算法，而演算法不一定是程序。程序 = 數據結構 + 演算法。演算法的主要目的在於為人們提供閱讀了解所執行的工作流程與步驟。數據結構與演算法要通過程序的實現，才能由計算機系統來執行。可以這樣理解，數據結構和演算法形成了可執行的程序。

(1)簡單的文本編譯器演算法擴展閱讀

演算法的要素：

一、數據對象的運算和操作：計算機可以執行的基本操作是以指令的形式描述的。一個計算機系統能執行的所有指令的集合，成為該計算機系統的指令系統。一個計算機的基本運算和操作有如下四類：

1、算術運算：加減乘除等運算。

2、邏輯運算：或、且、非等運算。

3、關系運算：大於、小於、等於、不等於等運算。

4、數據傳輸：輸入、輸出、賦值等運算。

二、演算法的控制結構：一個演算法的功能結構不僅取決於所選用的操作，而且還與各操作之間的執行順序有關。

❷ 什麼是編譯原理

編譯原理是計算機專業的一門重要專業課，旨在介紹編譯程序構造的一般原理和基本方法。內容包括語言和文法、詞法分析、語法分析、語法制導翻譯、中間代碼生成、存儲管理、代碼優化和目標代碼生成。編譯原理是計算機專業設置的一門重要的專業課程。雖然只有少數人從事編譯方面的工作，但是這門課在理論、技術、方法上都對學生提供了系統而有效的訓練，有利於提高軟體人員的素質和能力。
這門課程關注的是編譯器方面的產生原理和技術問題，似乎和計算機的基礎領域不沾邊，可是編譯原理卻一直作為大學本科的必修課程，同時也成為了研究生入學考試的必考內容。編譯原理及技術從本質上來講就是一個演算法問題而已，當然由於這個問題十分復雜，其解決演算法也相對復雜。我們學的數據結構與演算法分析也是講演算法的，不過講的基礎演算法，換句話說講的是演算法導論，而編譯原理這門課程講的就是比較專註解決一種的演算法了。在20世紀 50年代，編譯器的編寫一直被認為是十分困難的事情，第一Fortran的編譯器據說花了18年的時間才完成。在人們嘗試編寫編譯器的同時，誕生了許多跟編譯相關的理論和技術，而這些理論和技術比一個實際的編譯器本身價值更大。就猶如數學家們在解決著名的哥德巴赫猜想一樣，雖然沒有最終解決問題，但是其間誕生不少名著的相關數論。

❸ 新版編譯器OnCalculate我這樣編寫，理解，對嗎

OnCalculate

OnCalculate()函數只在自定義指標中調用，通過Calculate計算指標值是必須的。通常在接到指標計算的交易品種新訂單號時發生。這個指標不需要附在交易品種的價格圖表上。

OnCalculate() 函數有個返回值int。有兩個可能定義。一個指標中不可以有兩個函數版本。

一種是用於單數據緩沖中計算的指標。例如，自定義移動平均數指標。

int OnCalculate (const int rates_total, // 價格[] 數組的大小
const int prev_calculated, // 前一次調用處理的柱
const int begin, // 有效數據起始位置
const double& price[] // 計算的數組
);
價格[]數組中，可以傳送時間序列和計算的一些指標緩沖。ArrayGetAsSeries()函數確定價格[] 數組索引方向。為了不依賴默認值，需要無條件的調用ArraySetAsSeries()函數用於工作的數組。

價格[]數組中，在「參數」標簽啟動指標時，選擇適當的時間序列或者指標。所以，需要在「應用於」欄位的下拉列表中指定必要的項目。

Selecting timeseries to calculate an indicator

從其他mql5程序中接收自定義指標值，要使用iCustom()函數，返回嵌入指標處理程序。可以指定適當的價格[]數組或者另一個指標處理程序。這個參數在自定義指標輸入變數列表中最後傳送。
示例：

void OnStart()
{
//---
string terminal_path=TerminalInfoString(STATUS_TERMINAL_PATH);
int handle_customMA=iCustom(Symbol(),PERIOD_CURRENT, "Custom Moving Average",13,0, MODE_EMA,PRICE_TYPICAL);
if(handle_customMA>0)
Print("handle_customMA = ",handle_customMA);
else
Print("Cannot open or not EX5 file '"+terminal_path+"\\MQL5\\Indicators\\"+"Custom Moving Average.ex5'");
}
這個示例中，通過的最後參數是PRICE_TYPICAL值（從ENUM_APPLIED_PRICE計數開始），指出自定義指標可以用獲得的典型價格建立（高價+低價+平倉）/3。如果沒有確定這個參數，指標基於PRICE_CLOSE 值建立，例如每欄平倉價。

另一個示例顯示依照指定價格[]數組的最後一個參數傳送指標處理程序，由函數iCustom()所描述。

另一種形式意在所有其他指標，計算更多的時間序列。

int OnCalculate (const int rates_total, // 輸入時間序列大小
const int prev_calculated, // 前一次調用處理的柱
const datetime& time[], // 時間
const double& open[], // 開盤價
const double& high[], // 最高價
const double& low[], // 最低價
const double& close[], // 收盤價
const long& tick_volume[], // 訂單交易量
const long& volume[], // 真實交易量
const int& spread[] // 點差
);
開盤價[]，最高價[]，最低價[]和收盤價[]參數由當前時間表的開盤價，最高和最低價和收盤價數組組成。時間參數[]包括開盤時間值數組，擴展參數[]有一個數組包括擴展歷史記錄（如果為交易安全提供擴展）。volume[] 和tick_volume[] 參數分別包括交易和交易量歷史記錄。

確定時間[]索引方向，開盤價[]，最高價[]，最低價[]，收盤價[]，交易量[]，交易量[] 和擴展[],需要調用ArrayGetAsSeries()函數。若不想依賴默認值，需要無條件的調用函數ArraySetAsSeries()用於工作的數組。

首先rates_total 參數包括欄的數量，可用來計算指標，與圖表中現存的欄數一致。

需要注意OnCalculate() 返回值和第二輸入參數prev_calculated的連接。調用函數時，prev_calculated 參數包括上次調用時OnCalculate() 返回值。這就允許用經濟演算法計算自定義指標，避免重復計算。

返回rates_total參數值足夠了，包括當前調用函數的欄數。如果自從上次調用函數OnCalculate()，價格數據更改了（下載深度歷史記錄或者填滿歷史空白期），輸入參數prev_calculated 值由終端機設置為零。

註：如果OnCalculate返回零，那麼指標值不能顯示在客戶端的數據窗口。

為更好的理解，啟動附加以下代碼的指標很有用。

指標示例：
#property indicator_chart_window
#property indicator_buffers 1
#property indicator_plots 1
//---- 圖的線
#property indicator_label1 "Line"
#property indicator_type1 DRAW_LINE
#property indicator_color1 clrDarkBlue
#property indicator_style1 STYLE_SOLID
#property indicator_width1 1
//--- 指標緩沖區
double LineBuffer[];
//+------------------------------------------------------------------+
//| 自定義指標初始化函數 |
//+------------------------------------------------------------------+
int OnInit()
{
//--- 指標緩沖區繪圖
SetIndexBuffer(0,LineBuffer,INDICATOR_DATA);
//---
return(INIT_SUCCEEDED);
}
//+------------------------------------------------------------------+
//| 自定義指標重復函數 |
//+------------------------------------------------------------------+
int OnCalculate(const int rates_total,
const int prev_calculated,
const datetime& time[],
const double& open[],
const double& high[],
const double& low[],
const double& close[],
const long& tick_volume[],
const long& volume[],
const int& spread[])
{
//--- 獲得當前交易品種和圖表周期的有效柱數
int bars=Bars(Symbol(),0);
Print("Bars = ",bars,", rates_total = ",rates_total,", prev_calculated = ",prev_calculated);
Print("time[0] = ",time[0]," time[rates_total-1] = ",time[rates_total-1]);
//--- 為下次調用返回prev_calculated值
return(rates_total);
}
//+------------------------------------------------------------------+

❹ 編譯器中都有哪些演算法

詞法/語法分析、程序分析與程序變換、代碼生成、內存管理、虛擬機、函數式語言的實現與優化。。。每個話題都能出不止一本書。

用到的演算法/數據結構多如牛毛：

各種樹、圖為主，其他如棧、隊列、散列表、並查集。。。

貪心、回溯、動態規劃、遺傳演算法、矩陣變換。。

在一個問題下很難回答好。。先簡單介紹一下和圖相關的。

1. 和什麼圖打交道
CFG(Control Flow Graph)
控制流圖是對程序中分支跳轉關系的抽象，描述程序所有可能執行路徑

節點是語句集合（basic block)；

每個basic block有唯一入口和出口；

如果A到B有邊，表示A執行完後可能執行B

PDG(Program Dependence Graph)
PDG在編譯器中用得不多，常見於軟體工程/安全相關的應用（程序切片、安全信息流等）

SSA(Single Static Assignment)
SSA簡化了很多數據流分析問題。

其他圖
DJ Graph, Loop Nesting Forest, Program Structure Tree等等。

可參考：IR for Program Analysis。下面主要介紹CFG

2. CFG初步處理
CFG構造

dominator樹生成
在CFG中，如果A是B的dominator，則從程序入口執行到B的任意路徑一定經過A

控制依賴分析
根據dominator和post-dominator分析依賴關系。數據依賴、控制依賴信息在自動並行化中尤其重要（如果循環的每次迭代都沒有依賴，那麼可以並行處理）

控制流圖化簡
在復雜度相同的情況下，CFG的規模影響演算法的效果。如果一個CFG僅通過如下變換能化簡為一個節點，則它是可化簡的：

如果節點n有唯一的前驅，那麼將其和其前驅合並為一個節點

如果節點存在到自身的邊，那麼將該邊刪除
構造SSA
SSA可以由CFG構造。

3. CFG與數據流分析
下面才進入主題。。
一般的文獻介紹DFA（Data flow analysis），都會用幾個基礎的分析為例：Constant Propagation，Range propagation，Avaliable expressions，Reaching Definition。而Reaching Definition的一個應用，就是大家喜聞樂見的「跳轉到定義處」（真要做到「智能」跳轉並不簡單）

這部分涉及東西較多，一些演算法也和」圖「並不直接相關，不再展開。

PS，很多DFA問題可以用graph reachability統一建模，強烈推薦此文：
Program analysis via graph reachability

❺ MD5是如何編譯的

MD5簡介

MD5的全稱是Message-Digest Algorithm 5，在90年代初由MIT的計算機科學實驗室和RSA Data Security Inc發明，經MD2、MD3和MD4發展而來。

Message-Digest泛指位元組串(Message)的Hash變換，就是把一個任意長度的位元組串變換成一定長的大整數。請注意我使用了「位元組串」而不是「字元串」這個詞，是因為這種變換只與位元組的值有關，與字元集或編碼方式無關。

MD5將任意長度的「位元組串」變換成一個128bit的大整數，並且它是一個不可逆的字元串變換演算法，換句話說就是，即使你看到源程序和演算法描述，也無法將一個MD5的值變換回原始的字元串，從數學原理上說，是因為原始的字元串有無窮多個，這有點象不存在反函數的數學函數。

MD5的典型應用是對一段Message(位元組串)產生fingerprint(指紋)，以防止被「篡改」。舉個例子，你將一段話寫在一個叫readme.txt文件中，並對這個readme.txt產生一個MD5的值並記錄在案，然後你可以傳播這個文件給別人，別人如果修改了文件中的任何內容，你對這個文件重新計算MD5時就會發現。如果再有一個第三方的認證機構，用MD5還可以防止文件作者的「抵賴」，這就是所謂的數字簽名應用。

MD5還廣泛用於加密和解密技術上，在很多操作系統中，用戶的密碼是以MD5值（或類似的其它演算法）的方式保存的，用戶Login的時候，系統是把用戶輸入的密碼計算成MD5值，然後再去和系統中保存的MD5值進行比較，而系統並不「知道」用戶的密碼是什麼。

一些黑客破獲這種密碼的方法是一種被稱為「跑字典」的方法。有兩種方法得到字典，一種是日常搜集的用做密碼的字元串表，另一種是用排列組合方法生成的，先用MD5程序計算出這些字典項的MD5值，然後再用目標的MD5值在這個字典中檢索。

即使假設密碼的最大長度為8，同時密碼只能是字母和數字，共26+26+10=62個字元，排列組合出的字典的項數則是P(62,1)+P(62,2)….+P(62,8)，那也已經是一個很天文的數字了，存儲這個字典就需要TB級的磁碟組，而且這種方法還有一個前提，就是能獲得目標賬戶的密碼MD5值的情況下才可以。

在很多電子商務和社區應用中，管理用戶的Account是一種最常用的基本功能，盡管很多Application Server提供了這些基本組件，但很多應用開發者為了管理的更大的靈活性還是喜歡採用關系資料庫來管理用戶，懶惰的做法是用戶的密碼往往使用明文或簡單的變換後直接保存在資料庫中，因此這些用戶的密碼對軟體開發者或系統管理員來說可以說毫無保密可言，本文的目的是介紹MD5的java Bean的實現，同時給出用MD5來處理用戶的Account密碼的例子，這種方法使得管理員和程序設計者都無法看到用戶的密碼，盡管他們可以初始化它們。但重要的一點是對於用戶密碼設置習慣的保護。

有興趣的讀者可以從這里取得MD5也就是RFC 1321的文本。 http://www.ietf.org/rfc/rfc1321.txt

實現策略

MD5的演算法在RFC1321中實際上已經提供了C的實現，我們其實馬上就能想到，至少有兩種用Java實現它的方法，第一種是，用Java語言重新寫整個演算法，或者再說簡單點就是把C程序改寫成Java程序。第二種是，用JNI(Java Native Interface)來實現，核心演算法仍然用這個C程序，用Java類給它包個殼。

但我個人認為，JNI應該是Java為了解決某類問題時的沒有辦法的辦法（比如與操作系統或I/O設備密切相關的應用），同時為了提供和其它語言的互操作性的一個手段。使用JNI帶來的最大問題是引入了平台的依賴性，打破了SUN所鼓吹的「一次編寫到處運行」的Java好處。因此，我決定採取第一種方法，一來和大家一起嘗試一下「一次編寫到處運行」的好處，二來檢驗一下Java 2現在對於比較密集的計算的效率問題。

實現過程

限於這篇文章的篇幅，同時也為了更多的讀者能夠真正專注於問題本身，我不想就某一種Java集成開發環境來介紹這個Java Bean的製作過程，介紹一個方法時我發現步驟和命令很清晰，我相信有任何一種Java集成環境三天以上經驗的讀者都會知道如何把這些代碼在集成環境中編譯和運行。用集成環境講述問題往往需要配很多屏幕截圖，這也是我一直對集成環境很頭疼的原因。我使用了一個普通的文本編輯器，同時使用了Sun公司標準的JDK 1.3.0 for Windows NT。

其實把C轉換成Java對於一個有一定C語言基礎的程序員並不困難，這兩個語言的基本語法幾乎完全一致．我大概花了一個小時的時間完成了代碼的轉換工作，我主要作了下面幾件事：

把必須使用的一些#define的宏定義變成Class中的final static，這樣保證在一個進程空間中的多個Instance共享這些數據
刪去了一些無用的#if define，因為我只關心MD5，這個推薦的C實現同時實現了MD2 MD3和 MD4，而且有些#if define還和C不同編譯器有關
將一些計算宏轉換成final static 成員函數。
所有的變數命名與原來C實現中保持一致，在大小寫上作一些符合Java習慣的變化，計算過程中的C函數變成了private方法(成員函數)。
關鍵變數的位長調整
定義了類和方法
需要注意的是，很多早期的C編譯器的int類型是16 bit的，MD5使用了unsigned long int，並認為它是32bit的無符號整數。而在Java中int是32 bit的，long是64 bit的。在MD5的C實現中，使用了大量的位操作。這里需要指出的一點是，盡管Java提供了位操作，由於Java沒有unsigned類型，對於右移位操作多提供了一個無符號右移：>>>，等價於C中的 >> 對於unsigned 數的處理。

因為Java不提供無符號數的運算，兩個大int數相加就會溢出得到一個負數或異常，因此我將一些關鍵變數在Java中改成了long類型(64bit)。我個人認為這比自己去重新定義一組無符號數的類同時重載那些運算符要方便，同時效率高很多並且代碼也易讀，OO(Object Oriented)的濫用反而會導致效率低下。

限於篇幅，這里不再給出原始的C代碼，有興趣對照的讀者朋友可以去看RFC 1321。MD5.java源代碼

測試

在RFC 1321中，給出了Test suite用來檢驗你的實現是否正確：

MD5 ("") =

MD5 ("a") =

MD5 ("abc") =

MD5 ("message digest") =

MD5 ("abcdefghijklmnopqrstuvwxyz") =

……

這些輸出結果的含義是指：空字元串」」的MD5值是，字元串」a」的MD5值是……
編譯並運行我們的程序：
javac –d . MD5.java
java beartool.MD5
為了將來不與別人的同名程序沖突，我在我的程序的第一行使用了package beartool;

因此編譯命令javac –d . MD5.java 命令在我們的工作目錄下自動建立了一個beartool目錄，目錄下放著編譯成功的 MD5.class

我們將得到和Test suite同樣的結果。當然還可以繼續測試你感興趣的其它MD5變換，例如：

java beartool.MD5 1234

將給出1234的MD5值。

可能是我的計算機知識是從Apple II和Z80單板機開始的，我對大寫十六進制代碼有偏好，如果您想使用小寫的Digest String只需要把byteHEX函數中的A、B、C、D、E、F改成a、b、 c、d、e、f就可以了。

MD5據稱是一種比較耗時的計算，我們的Java版MD5一閃就算出來了，沒遇到什麼障礙，而且用肉眼感覺不出來Java版的MD5比C版的慢。

為了測試它的兼容性，我把這個MD5.class文件拷貝到我的另一台linux+IBM JDK 1.3的機器上，執行後得到同樣結果，確實是「一次編寫到處運行了」。

Java Bean簡述

現在，我們已經完成並簡單測試了這個Java Class，我們文章的標題是做一個Java Bean。

其實普通的Java Bean很簡單，並不是什麼全新的或偉大的概念，就是一個Java的Class，盡管 Sun規定了一些需要實現的方法，但並不是強制的。而EJB(Enterprise Java Bean)無非規定了一些必須實現（非常類似於響應事件）的方法，這些方法是供EJB Container使用(調用)的。

在一個Java Application或Applet里使用這個bean非常簡單，最簡單的方法是你要使用這個類的源碼工作目錄下建一個beartool目錄，把這個class文件拷貝進去，然後在你的程序中import beartool.MD5就可以了。最後打包成.jar或.war是保持這個相對的目錄關系就行了。

Java還有一個小小的好處是你並不需要摘除我們的MD5類中那個main方法，它已經是一個可以工作的Java Bean了。Java有一個非常大的優點是她允許很方便地讓多種運行形式在同一組代碼中共存，比如，你可以寫一個類，它即是一個控制台Application和GUI Application，同時又是一個Applet，同時還是一個Java Bean，這對於測試、維護和發布程序提供了極大的方便，這里的測試方法main還可以放到一個內部類中，有興趣的讀者可以參考： http://www.cn.ibm.com/developerWorks/java/jw-tips/tip106/index.shtml

這里講述了把測試和示例代碼放在一個內部靜態類的好處，是一種不錯的工程化技巧和途徑。

把Java Bean裝到JSP里

正如我們在本文開頭講述的那樣，我們對這個MD5 Bean的應用是基於一個用戶管理，這里我們假設了一個虛擬社區的用戶login過程，用戶的信息保存在資料庫的個名為users的表中。這個表有兩個欄位和我們的這個例子有關，userid :char(20)和pwdmd5 :char(32)，userid是這個表的Primary Key，pwdmd5保存密碼的MD5串，MD5值是一個128bit的大整數，表示成16進制的ASCII需要32個字元。

這里給出兩個文件，login.html是用來接受用戶輸入的form，login.jsp用來模擬使用MD5 Bean的login過程。

為了使我們的測試環境簡單起見，我們在JSP中使用了JDK內置的JDBC-ODBC Bridge Driver，community是ODBC的DSN的名字，如果你使用其它的JDBC Driver，替換掉login.jsp中的
Connection con= DriverManager.getConnection("jdbc:odbc:community", "", "");
即可。

login.jsp的工作原理很簡單，通過post接收用戶輸入的UserID和Password，然後將Password變換成MD5串，然後在users表中尋找UserID和pwdmd5，因為UserID是users表的Primary Key，如果變換後的pwdmd5與表中的記錄不符，那麼SQL查詢會得到一個空的結果集。

這里需要簡單介紹的是，使用這個Bean只需要在你的JSP應用程序的WEB-INF/classes下建立一個beartool目錄，然後將MD5.class拷貝到那個目錄下就可以了。如果你使用一些集成開發環境，請參考它們的deploy工具的說明。在JSP使用一個java Bean關鍵的一句聲明是程序中的第2行：

<jsp:useBean id='oMD5' scope='request' class='beartool.MD5'/>
這是所有JSP規范要求JSP容器開發者必須提供的標准Tag。

id=實際上是指示JSP Container創建Bean的實例時用的實例變數名。在後面的<%和%>之間的Java程序中，你可以引用它。在程序中可以看到，通過 pwdmd5=oMD5.getMD5ofStr (password)引用了我們的MD5 Java Bean提供的唯一一個公共方法: getMD5ofStr。

Java Application Server執行.JSP的過程是先把它預編譯成.java（那些Tag在預編譯時會成為java語句），然後再編譯成.class。這些都是系統自動完成和維護的，那個.class也稱為Servlet。當然，如果你願意，你也可以幫助Java Application Server去干本該它乾的事情，自己直接去寫Servlet，但用Servlet去輸出HTML那簡直是回到了用C寫CGI程序的惡夢時代。

如果你的輸出是一個復雜的表格，比較方便的方法我想還是用一個你所熟悉的HTML編輯器編寫一個「模板」，然後在把JSP代碼「嵌入」進去。盡管這種JSP代碼被有些專家指責為「空心粉」，它的確有個缺點是代碼比較難管理和重復使用，但是程序設計永遠需要的就是這樣的權衡。我個人認為，對於中、小型項目，比較理想的結構是把數據表示（或不嚴格地稱作WEB界面相關）的部分用JSP寫，和界面不相關的放在Bean裡面，一般情況下是不需要直接寫Servlet的。

如果你覺得這種方法不是非常的OO(Object Oriented)，你可以繼承（extends）它一把，再寫一個bean把用戶管理的功能包進去。

到底能不能兼容？

我測試了三種Java應用伺服器環境，Resin 1.2.3、Sun J2EE 1.2、IBM WebSphere 3.5，所幸的是這個Java Bean都沒有任何問題，原因其實是因為它僅僅是個計算程序，不涉及操作系統，I/O設備。其實用其它語言也能簡單地實現它的兼容性的，Java的唯一優點是，你只需提供一個形態的運行碼就可以了。請注意「形態」二字，現在很多計算結構和操作系統除了語言本身之外都定義了大量的代碼形態，很簡單的一段C語言核心代碼，轉換成不同形態要考慮很多問題，使用很多工具，同時受很多限制，有時候學習一種新的「形態」所花費的精力可能比解決問題本身還多。比如光Windows就有EXE、Service、的普通DLL、COM DLL以前還有OCX等等等等，在Unix上雖說要簡單一些，但要也要提供一個.h定義一大堆宏，還要考慮不同平台編譯器版本的位長度問題。我想這是Java對我來說的一個非常重要的魅力吧。

MD5演算法說明

一、補位
二、補數據長度
三、初始化MD5參數
四、處理位操作函數
五、主要變換過程
六、輸出結果

補位：
MD5演算法先對輸入的數據進行補位，使得數據位長度LEN對512求余的結果是448。即數據擴展至K*512+448位。即K*64+56個位元組，K為整數。
具體補位操作：補一個1，然後補0至滿足上述要求。
補數據長度：
用一個64位的數字表示數據的原始長度B，把B用兩個32位數表示。這時，數
據就被填補成長度為512位的倍數。
初始化MD5參數：
四個32位整數 (A,B,C,D) 用來計算信息摘要，初始化使用的是十六進製表
示的數字
A=0X01234567
B=0X89abcdef
C=0Xfedcba98
D=0X76543210

處理位操作函數：
X，Y，Z為32位整數。
F(X,Y,Z) = X&Y|NOT(X)&Z
G(X,Y,Z) = X&Z|Y?(Z)
H(X,Y,Z) = X xor Y xor Z
I(X,Y,Z) = Y xor (X|not(Z))

主要變換過程：
使用常數組T[1 ... 64]， T[i]為32位整數用16進製表示，數據用16個32位
的整數數組M[]表示。
具體過程如下：

/* 處理數據原文 */
For i = 0 to N/16-1 do

/*每一次，把數據原文存放在16個元素的數組X中. */
For j = 0 to 15 do
Set X[j] to M[i*16+j].
end /結束對J的循環

/* Save A as AA, B as BB, C as CC, and D as DD.
*/
AA = A
BB = B
CC = C
DD = D

/* 第1輪*/
/* 以 [abcd k s i]表示如下操作
a = b + ((a + F(b,c,d) + X[k] + T[i]) <<< s). */

/* Do the following 16 operations. */
[ABCD 0 7 1] [DABC 1 12 2] [CDAB 2 17 3] [BCDA 3
22 4]
[ABCD 4 7 5] [DABC 5 12 6] [CDAB 6 17 7] [BCDA 7
22 8]
[ABCD 8 7 9] [DABC 9 12 10] [CDAB 10 17 11] [BCDA
11 22 12]
[ABCD 12 7 13] [DABC 13 12 14] [CDAB 14 17 15]
[BCDA 15 22 16]

/* 第2輪* */
/* 以 [abcd k s i]表示如下操作
a = b + ((a + G(b,c,d) + X[k] + T[i]) <<< s). */
/* Do the following 16 operations. */
[ABCD 1 5 17] [DABC 6 9 18] [CDAB 11 14 19] [BCDA
0 20 20]
[ABCD 5 5 21] [DABC 10 9 22] [CDAB 15 14 23]
[BCDA 4 20 24]
[ABCD 9 5 25] [DABC 14 9 26] [CDAB 3 14 27] [BCDA
8 20 28]
[ABCD 13 5 29] [DABC 2 9 30] [CDAB 7 14 31] [BCDA
12 20 32]

/* 第3輪*/
/* 以 [abcd k s i]表示如下操作
a = b + ((a + H(b,c,d) + X[k] + T[i]) <<< s). */
/* Do the following 16 operations. */
[ABCD 5 4 33] [DABC 8 11 34] [CDAB 11 16 35]
[BCDA 14 23 36]
[ABCD 1 4 37] [DABC 4 11 38] [CDAB 7 16 39] [BCDA
10 23 40]
[ABCD 13 4 41] [DABC 0 11 42] [CDAB 3 16 43]
[BCDA 6 23 44]
[ABCD 9 4 45] [DABC 12 11 46] [CDAB 15 16 47]
[BCDA 2 23 48]

/* 第4輪*/
/* 以 [abcd k s i]表示如下操作
a = b + ((a + I(b,c,d) + X[k] + T[i]) <<< s). */
/* Do the following 16 operations. */
[ABCD 0 6 49] [DABC 7 10 50] [CDAB 14 15 51]
[BCDA 5 21 52]
[ABCD 12 6 53] [DABC 3 10 54] [CDAB 10 15 55]
[BCDA 1 21 56]
[ABCD 8 6 57] [DABC 15 10 58] [CDAB 6 15 59]
[BCDA 13 21 60]
[ABCD 4 6 61] [DABC 11 10 62] [CDAB 2 15 63]
[BCDA 9 21 64]

/* 然後進行如下操作 */
A = A + AA
B = B + BB
C = C + CC
D = D + DD

end /* 結束對I的循環*/

輸出結果。

❻ 如何更好的掌握編譯器的設計與實現

1. 閱讀相關書籍：編譯原理、編譯器設計、編譯器實現等；
2. 自學相關編程語言：C、C++、Java等；
3. 實踐：可以使用開源的編譯器框架，例如ANTLR，搭建自己的編譯器；
4. 了解編譯器的各個組成部分，並學習它們的工作原理；
5. 閱讀技術文章，了解編譯器的設計和實現的最新進展；
6. 加入開源項目，編寫和維護編譯器；
7. 在論壇上交流，和更多的編譯器開發者分享心得體會；
8. 參加學術會議，接觸到最新的研究成果；
9. 嘗試著自己設計一個編譯器，用實踐來加深理解。

❼ 編譯原理的數據結構

編譯原理一直是計算機學習的必修課.
當然，由編譯器的階段使用的演算法與支持這些階段的數據結構之間的交互是非常強大的。編譯器的編寫者盡可能有效實施這些方法且不引起復雜性。理想的情況是：與程序大小成線性比例的時間內編譯器，換言之就是，在0 （ n ）時間內，n是程序大小的度量（通常是字元數）。本節將講述一些主要的數據結構，它們是其操作部分階段所需要的，並用來在階段中交流信息。臨時文件（temporary file）：計算機過去一直未能在編譯器時將整個程序保留在存儲器中。這一問題已經通過使用臨時文件來保存翻譯時中間步驟的結果或通過「匆忙地」編譯（也就是只保留源程序早期部分的足夠信息用以處理翻譯）解決了。存儲器的限制現在也只是一個小問題了，現在可以將整個編譯單元放在存儲器之中，特別是在可以分別編譯的語言中時。但是偶爾還是會發現需要在某些運行步驟中生成中間文件。其中典型的是代碼生成時需要反填（backpatch）地址。例如，當翻譯如下的條件語句時 if x = 0 then ... else ... 在知道else部分代碼的位置之前必須由文本跳到else部分：
CMP X,0 JNE NEXT ;;
location of NEXT not yet known < code for then-part > NEXT : < code for else-part >
通常，必須為NEXT的值留出一個空格，一旦知道該值後就會將該空格填上，利用臨時文件可以很容易地做到這一點。
如果想利用上面的編譯原理開發一套屬於自己的編程語言，或者想在一個產品中嵌入編程語言，可以參考zengl開源網開發的zengl編程語言，該編程語言為國人使用C語言開發，裡麵包含兩個部分，一個是編譯器，一個是解釋執行中間代碼的虛擬機。編譯器包含了詞法掃描，語法分析，中間代碼輸出等，虛擬機則類似JAVA一樣解釋執行中間代碼。作者將所有的版本都公布出來，好讓讀者可以由淺入深的做研究，並且為了證明該編程語言的實用性，還結合SDL游戲開發庫開發了一款圖形界面和命令行界面的21點撲克小游戲。
zengl編程語言目前適用平台為windows和linux (最開始在Linux下使用gcc開發，後來移植到windows平台)

導航:首頁 > 源碼編譯 > 簡單的文本編譯器演算法

簡單的文本編譯器演算法

與簡單的文本編譯器演算法相關的資料