① U3D如何做代碼混淆
Unity代碼混淆方案
內容提要:Unity引擎下的代碼保護,由於Unity引擎的一些特殊性,實行起來較為復雜,在國內外業界並沒有現成的方案。筆者通過在《QQ樂團》項目上的實際嘗試,得出了一種具體可行,能夠有效保護代碼邏輯的方案。特此分享給關注Unity引擎的項目,希望能提供一些的參考。
背景
Unity引擎上的程序執行在Mono運行時上,使用Mono編譯出的程序集格式與.NET標准一致。C#是Unity引擎下主要的開發語言,它具備不少高級語言特性,如反射、元數據、內置序列化等。但C#同時也是很容易被反編譯的語言,如果不採用任何保護措施,使用常用的工具(.NET Reflector)便能很容易得到可二次編譯的代碼。對項目運營帶來了比較大的風險。
.NET平台下通常的保護手段是混淆編譯出的程序集。VisualStudio自帶了一個混淆工具Dotfuscator可以對程序集進行混淆。功能包括名稱修改,流程混淆,字元串加密等。經過Dotfuscator混淆後的程序集,能夠避免被常用反編譯工具破解。變數的表意性被破壞,同時函數的內部流程也被混淆(如下[B1] )。能有效起到保護源代碼的效果。
publicclass181: 218
{
// Fields
publicuint0;
publicushort1;
publicstaticreadonlyuint2;
publicstaticreadonlyuint3;
// Methods
static181();
public181();
public95.02();
public95.02(ref515A_0, uintA_1);
public95.02(79A_0, refuintA_1);
public95.02(ref79A_0, uintA_1);
public95.02(byte[] A_0, intA_1, refuintA_2);
public95.02(ref481A_0, intA_1, charA_2);
public95.02(refstringA_0, intA_1, charA_2);
public95.02(refbyte[] A_0, intA_1, refintA_2, uintA_3);
public95.03(ref79A_0, uintA_1);
public95.03(refbyte[] A_0, intA_1, refintA_2, uintA_3);
public95.04(refbyte[] A_0, intA_1, refintA_2, uintA_3);
}
public95.00(refsbyteA_0, intA_1)
{
// This item is obfuscated and can not be translated.
goto Label_0006;
if(1!= 0)
{
}
95.0local= 95.0.0;
bytenum= 0;
local = this.0(refnum,A_1);
A_0 = (sbyte) num;
returnlocal;
Unity引擎下,Mono編譯出的程序集,由於採用與.NET相同的格式標准。能夠直接被Dotfuscator混淆。但Unity引擎有一些特殊的地方,使混淆工作與一般的.NET程序存在差異。第三節將主要討論這些特殊點。
Unity引擎下代碼混淆的特殊性
代碼被資源引用[B2] 。Unity的可視化編輯特性在設計上的關鍵之處在於使代碼能夠以組件的形式依附到資源實例上。相比傳統游戲,Unity的兩類資源(scene和prefab)不僅包括數據,還包括附加在資源上的類對象。也就是說,這兩類資源的存儲格式中存在唯一標識某代碼類型的數據。混淆流程必須不破環這種對應關系才能使資源上的代碼邏輯正確被執行。(Unity這樣設計的意義並不是本文討論的重點,而另一篇分享個人對Unity可視化編輯的理解的文章中將會詳細說明。)
發布到Web的Unity項目,在生成播放器可執行包(*.unity)的介面中,將編譯程序集和打包這兩個步驟捆綁在的一起。我們沒辦法像普通.NET程序那樣,對編譯出的程序集進行混淆後再打到播放器可執行包中。
UnityEngine按函數名進行調用。MonoBehaviour是Unity引擎的一個重要的組件基類。其上的很多方法,Unity是通過方法名稱進行訪問的,如Awake、Start、Update等等。這些方法如果在混淆中被改名,將使方法調用失敗。這個問題相對比較好處理,Dotfuscator的重命名功能提供了排除配置。我們只要得到繼承於MonoBehaviour的所有類型,就能生成相應的排除配置,告知Dotfuscator不要對這些方法進行重命名。生成的配置節選如下[B3] :
<option>xmlserialization</option>
<excludelist>
<type name="CEventMgr|CGameRoot|…|…" regex="true" excludetype="false">
<method name="Update"regex="true" />
<method name="LateUpdate"regex="true" />
<method name="FixedUpdate"regex="true" />
<methodname="Awake" regex="true" />
<customattributename="System.Runtime.CompilerServices.CompilerGeneratedAttribute"regex="true" />
<method name=".*"regex="true" />
<field name=".*"regex="true" />
</type>
<type name=".*"regex="true">
<customattributename="ANoRenameInObfuscate" regex="true" />
</type>
<type name=".*"excludetype="false" regex="true">
<method name=".*"regex="true">
<customattributename="ANoRenameInObfuscate" regex="true" />
</method>
</type>
思路
何時混淆?由於Web項目編譯和打包的過程是捆綁在一起的,官方沒有提供獨立的介面。(之前有跟官方反饋,但目前官方並沒有提供具體計劃。)想自己來分析官方的打包格式是行不通並且不太科學的。僅剩的辦法就是自己將代碼編譯成DLL,混淆之後再添加到Unity項目中。
順著這條思路,筆者在《QQ樂團》項目上作了嘗試。將項目中所有執行相關的代碼(不包括編輯器擴展的代碼)移出,指定相關的Unity依賴庫,編譯成DLL。再將此DLL復制到原項目中。這時意料之中的事情發生了——項目中所有資源上的代碼引用全部丟失。為了找到資源對代碼的映射形式,筆者調整Unity編輯器的設定,將資源的序列化格式改為文本格式,並進行對比分析。發現資源中是通過一個GUID來對應具體代碼的[B4] 。(如下)
m_ObjectHideFlags: 1
m_PrefabParentObject: {fileID: 0}
m_PrefabInternal: {fileID: 100100000}
m_GameObject: {fileID: 100000}
m_Enabled: 1
m_EditorHideFlags: 0
m_Script: {fileID:11500000, guid: , type: 1}
m_Name:
mInt: 1
mFloat: .5
中的類型雖然還沒有進行過混淆,但GUID已經發生了變化。將新的GUID替換到資源文件中,引用關系果然恢復了。
Unity引擎下的特殊問題都是可以解決的。於是順著這思路,開發了若干工具,得到了前後GUID的對應關系,並掃描所有資源以進行GUID的替換。另一方面,在混淆之後,類型的變數名發生了改變,資源中變數名賦有具體的值,也需要替換資源中的變數名對應到混淆後的變數名。這一切花費了不少的精力,終於是把工具都做成了。
然而人算不如天算,最終導致此方案走進死角的是一個之前很難意料到的問題:Unity引擎在處理DLL中的模版類型時存在缺陷——DLL中的模版類型沒有GUID,不能被資源所引用。這個問題在Unity官方網站上有少量反饋,而官方承認了這個bug,且沒有給出解決方案。而《QQ樂團》的項目在UI操作上比較廣泛地使用了模版類型,去除模版的使用談何容易。就這樣,這么一個不經意的問題為這個嘗試的方向畫上了句號。
「系著枷鎖跳舞」,這句話是形容的是在各種條件約束下盡可能的追求解決方案的一種狀態。總結之前的失敗,最終還是找到了實際可行的改進方案,並成功應用到《QQ樂團》的Web版本和微客戶端版本上。
最終的思路是將項目進行分層。獨立出一個不被資源引用的,包含最敏感的協議解析和各個系統模塊的「邏輯層」,將邏輯層的代碼獨立編譯成一個DLL,進行混淆再包含到項目中。邏輯層之外的代碼主要包括被資源引用到的,或是系統模塊部分介面定義這樣的不太敏感的內容,姑且稱為「行為層」。為了讓邏輯層可以獨立編譯,我們要求邏輯層可對行為層進行引用,而行為層則只能通過留在行為層的邏輯層介面訪問邏輯層。這樣我們就保護了我們最重要的代碼,同時繞過了資源引用代碼的問題。
這個方案對項目架構提出了一定的要求。一是要求敏感代碼和資源保持獨立,需要一個框架來載入各個模塊,而不是直接將模塊代碼直接附在場景物體的資源中。二是要求層次清晰,不允許反向依賴。有利於《QQ樂團》項目的消息是,《QQ樂團》從最早期就實現了一個較清晰的架構管理方法。因此花費了一定的時間進行分層,和實現介面訪問機制後,就成功執行了這個方案。
實際混淆步驟。《QQ樂團》是使用VisualBuild來執行版本構建和發布流程的。以下介紹版本構建中混淆相關的流程:
從Unity項目的Assets目錄中拷貝出邏輯層的代碼目錄(CodeGameLogic)。和編輯器擴展代碼(避免混淆後編輯器擴展代碼對邏輯層的依賴丟失導致編譯出錯)。
調用Unity.exe命令行編譯剩餘的行為層部分:
這個函數實際執行了:
BuildPipeline.BuildPlayer(new string[] {"Assets/obfuscated.unity" }, "WebPlayerObfuscated",
BuildTarget.WebPlayer, BuildOptions.None);
Editor程序集(也就是編輯器擴展程序集)時編譯失敗,中斷編譯過程,避免在BuildPlayer過程結束時構建生成的DLL被清理掉。BuildPlayer之前故意在Editor目錄下弄一個錯誤的代碼文件即可。
將生成的行為層DLL拷貝到邏輯層構建目錄。行為層DLL的路徑是在項目的Library/ScriptAssemblies下,有Assembly-CSharp.dll和Assembly-CSharp-firstpass.dll兩個文件。另外也拷貝邏輯層依賴的其它DLL到構建目錄,包括UnityEngine.dll,以及項目Plugins目錄下的依賴庫。
調用Mono的編譯器mcs編譯邏輯層DLL——CodeGameLogic.dll。編譯命令如下:
生成DotObfuscator的配置文件」WebCfg.xml」。這里是用自己編寫的工具,掃描CodeGameLogic.dll中的類型,得到不能被混淆的類型名和方法名,加入到配置文件的排出列表中。如「三。3」小節所示。
調用DotObfuscator對CodeGameLogic.dll執行混淆,得到混淆後的CodeGameLogic.dll:
將混淆後的CodeGameLogic.dll拷貝到項目中,然後構建項目。這里要注意的是,如果是構建Web項目,需要將dll拷貝到Plugins目錄。如果是Standalone(即客戶端)項目,直接拷貝到Assets目錄下即可。另外,這次構建是不可以有編譯錯誤的,所以第1部需要移除Editor目錄下的編輯器擴展的代碼。
接下來將構建好的項目與資源合並,就可以得到完整的混淆版本。
總結:
Unity項目的代碼反編譯較為容易。需要在重視代碼混淆工作。
Unity項目的代碼混淆方案實施起來限制較多。本文介紹的方案是筆者知曉的目前唯一可用的混淆方案。對項目的架構分層有強制性的要求。最好是在項目初期就考慮如何對項目進行分層,將需要保護的內容放置在被混淆的層中。
② Protobuf3使用手冊
此指南介紹如何使用協議緩沖區語言來構建協議緩沖區數據,涵蓋.proto文件語法及從.proto文件生成數據訪問類。重點關注proto3版本,關於proto2語法的信息請查閱相應指南。
定義消息類型時,首先創建一個簡單的示例,假設目標是定義一個搜索請求消息格式,其中包含查詢字元串、特定結果頁面以及每頁多個結果。這通過.proto文件完成。
指定欄位類型,包含標量類型如整數和字元串,或復合類型如枚舉和其他消息類型。為欄位分配唯一編號,這些編號用於在二進制格式中標識欄位,且不隨時間更改。記住,1-15編號使用1位元組編碼,16-2047編號使用2位元組編碼。選擇合適的編號以預留空間給頻繁出現的元素。
使用proto3時,可默認將重復的標量數值欄位以編碼方式處理。查閱編碼詳情以獲取更多信息。此外,可在單個.proto文件中定義多種消息類型,為相關消息提供便利。
在.proto文件中添加註釋,使用C/C++風格的語法//和/* ... */。保留欄位編號,避免在更新消息類型時發生沖突。確保不會重用已刪除欄位的編號,避免導致問題如數據損壞或隱私錯誤。
通過協議緩沖區編譯器處理.proto文件,生成所選語言的代碼,包含獲取和設置欄位值、序列化和解析消息的功能。每個語言的API指南提供了更多使用示例。
標量消息欄位類型包括整數、字元串、浮點數等。在序列化消息時,了解不同類型如何編碼。注意Java中的類型轉換和表示。默認值在解析消息時設置,適用於重復欄位,確保正確處理。
枚舉用於定義預定義值列表的欄位。在定義消息時添加枚舉,並指定每個可能值。使用allow_alias選項允許別名定義,並確保值在32位整數范圍內。生成的代碼提供Java、Kotlin、C++等語言的枚舉實現。
保留值在更新枚舉類型時避免沖突。指定已刪除條目的值為reserved,防止在後續版本中使用。不同語言的枚舉限制存在,確保遵循限制。
使用其他消息類型作為欄位類型,例如在消息內部定義嵌套類型。導入定義以在不同文件中使用消息類型。注意導入語法和文件路徑,確保依賴正確管理。
升級消息類型時,添加或刪除欄位不影響現有代碼。僅需注意未知欄位處理和向後兼容性問題。添加或刪除欄位可能導致檢查值返回None/NOT_SET的混淆。
maps提供關聯映射定義,其中鍵和值類型可為整數或字元串。生成的API支持所有支持映射的語言。確保正確解析和使用maps語法。
包說明符用於避免協議消息類型的名稱沖突。在定義欄位時使用包說明符。不同語言的生成代碼根據包規則有所不同。
定義服務介面以在RPC系統中使用消息類型。gRPC是協議緩沖區最直接的RPC系統,支持直接從文件生成代碼。了解第三方RPC實現的相關信息。
JSON編碼支持在協議緩沖區中使用,簡化系統間數據共享。了解JSON編碼規則,注意默認值處理。選項可以定製JSON編碼行為,包括優化編碼大小。
生成類的步驟涉及使用協議緩沖區編譯器和適當插件(如對於Go)。提供編譯器安裝和使用指南。了解如何將輸出打包為ZIP或JAR文件。