⑴ 什麼是php編碼
PHP程序設計中中文編碼問題曾經困擾很多人,導致這個問題的原因其實很簡單,每個國家(或區域)都規定了計算機信息交換用的字元編碼集,如美國的擴展ASCII碼,中國的GB2312-80,日本的JIS等。作為該國家/區域內信息處理的基礎,字元編碼集起著統一編碼的重要作用。字元編碼集按長度分為SBCS(單位元組字元集),DBCS(雙位元組字元集)兩大類。早期的軟體(尤其是操作系統),為了解決本地字元信息的計算機處理,出現了各種本地化版本(L10N),為了區分,引進了LANG,Codepage等概念。但是由於各個本地字元集代碼范圍重疊,相互間信息交換困難;軟體各個本地化版本獨立維護成本較高。因此有必要將本地化工作中的共性抽取出來,作一致處理,將特別的本地化處理內容降低到最少。這也就是所謂的國際化(118N)。各種語言信息被進一步規范為Locale信息。處理的底層字元集變成了幾乎包含了所有字形的 Unicode。
現在大部分具有國際化特徵的軟體核心字元處理都是以Unicode為基礎的,在軟體運行時根據當時的ocale/Lang /Codepage設置確定相應的本地字元編碼設置,並依此處理本地字元。在處理過程中需要實現Unicode和本地字元集的相互轉換,甚或以 Unicode為中間的兩個不同本地字元集的相互轉換。這種方式在網路環境下被進一步延伸,任何網路兩端的字元信息也需要根據字元集的設置轉換成可接受的內容。
資料庫中的字元集編碼問題
流行的關系資料庫系統都支持資料庫字元集編碼,也就是說在創建資料庫時可以指定它自己的字元集設置,資料庫的數據以指定的編碼形式存儲。當應用程序訪問數據時,在入口和出口處都會有字元集編碼的轉換。對於中文數據,資料庫字元編碼的設置應當保證數據的完整性。GB2312、GBK、UTF-8等都是可選的資料庫字元集編碼;當然我們也可以選擇ISO8859-1(8-bit),只是我們得在應
用程序寫數據之前先將16Bit的一個漢字或Unicode拆分成兩個8-bit的字元,讀數據之後也需要將兩個位元組合並起來,同時還要判別其中的SBCS 字元,因此我們並不推薦採用ISO8859-1作為資料庫字元集編碼。這樣不但沒有充分利用資料庫自身的字元集編碼支持,而且同時也增加了編程的復雜度。編程時,可以先用資料庫管理系統提供的管理功能檢查其中的中文數據是否正確。
PHP程序在查詢資料庫之前,首先執行 mysql_query("SETNAMESxxxx");其中xxxx是你網頁的編碼(charset=xxxx),如果網頁中 charset=utf8,則xxxx=utf8,如果網頁中charset=gb2312,則xxxx=gb2312,幾乎所有WEB程序,都有一段連接資料庫的公共代碼,放在一個文件里,在這文件里,加入mysql_query("SETNAMESxxxx")就可以了。
SETNAMES 顯示客戶端發送的SQL語句中使用什麼字元集。因此,SETNAMES'utf-8'語句告訴伺服器「將來從這個客戶端傳來的信息採用字元集utf- 8」。它還為伺服器發送回客戶端的結果指定了字元集(例如,如果你使用一個SELECT語句,它表示列值使用了什麼字元集)。
定位問題時常用的技巧
定位中文編碼問題通常採用最笨的也是最有效的辦法―在你認為有嫌疑的程序處理後列印字元串的內碼。通過列印字元串的內碼,你可以發現什麼時候中文字元被轉換成Unicode,什麼時候Unicode被轉回中文內碼,什麼時候一個中文字成了兩個Unicode字元,什麼時候中文字元串被轉成了一串問號,什麼時候中文字元串的高位被截掉了……
取用合適的樣本字元串也有助於區分問題的類型。如:"aa啊aa?@aa"等中英相間,GB、GBK特徵字元均有的字元串。一般來說,英文字元無論怎麼轉換或處理,都不會失真(如果遇到了,可以嘗試著增加連續的英文字母長度)。
解決各種應用的亂碼問題
1)使用標簽設置頁面編碼
這個標簽的作用是聲明客戶端的瀏覽器用什麼字元集編碼顯示該頁面,xxx可以為GB2312、GBK、UTF-8(和MySQL不同,MySQL是 UTF8)等等。因此,大部分頁面可以採用這種方式來告訴瀏覽器顯示這個頁面的時候採用什麼編碼,這樣才不會造成編碼錯誤而產生亂碼。但是有的時候我們會發現有了這句還是不行,不管xxx是哪一種,瀏覽器採用的始終都是一種編碼,這個情況我後面會談到。
請注意,是屬於HTML信息的,僅僅是一個聲明,僅表明伺服器已經把HTML信息傳到了瀏覽器。
2)header("content-type:text/html;charset=xxx");
這個函數header()的作用是把括弧裡面的信息發到http標頭。如果括弧裡面的內容為文中所說那樣,那作用和標簽基本相同,大家對照第一個看發現字元都差不多的。但是不同的是如果有這段函數,瀏覽器就會永遠採用你所要求的xxx編碼,絕對不會不聽話,因此這個函數是很有用的。為什麼會這樣呢?那就得說說http標頭和HTML信息的差別了:
http標頭是伺服器以http協議傳送HTML信息到瀏覽器前所送出的字串。而標簽是屬於 HTML信息的,所以header()發送的內容先到達瀏覽器,通俗點就是header()的優先順序高於(不知道可不可以這樣講)。假如一個php頁面既有header("content-type:text/html;charset=xxx"),又有,瀏覽器就只認前者http標頭而不認meta了。當然這個函數只能在php頁面內使用。
同樣也留有一個問題,為什麼前者就絕對起作用,而後者有時候就不行呢?這就是接下來要談的Apache的原因了。
3)AddDefaultCharset
Apache根目錄的conf文件夾里,有整個Apache的配置文檔httpd.conf。
用文本編輯器打開httpd.conf,第708行(不同版本可能不同)有AddDefaultCharsetxxx,xxx為編碼名稱。這行代碼的意思:設置整個伺服器內的網頁文件http標頭里的字元集為你默認的xxx字元集。有這行,就相當於給每個文件都加了一行header("content- type:text/html;charset=xxx")。這下就明白為什麼明明設置了是utf-8,可瀏覽器始終採用gb2312的原因。
如果網頁里有header("content-type:text/html;charset=xxx"),就把默認的字元集改為你設置的字元集,所以這個函數永遠有用。如果把AddDefaultCharsetxxx前面加個"#",注釋掉這句,而且頁面里不含header("content- type…"),那這個時候就輪到meta標簽起作用了。
下面列出以上的優先順序:
..header("content-type:text/html;charset=xxx")
..AddDefaultCharsetxxx
..
如果你是web程序員,建議給你的每個頁面都加個header("content-type:text/html;charset=xxx"),這樣就可以保證它在任何伺服器都能正確顯示,可移植性也比較強。
4)php.ini中的default_charset配置:
php.ini中的default_charset="gb2312"定義了php的默認語言字元集。一般推薦注釋掉此行,讓瀏覽器根據網頁頭中的charset來自動選擇語言而非做一個強制性的規定,這樣就可以在同台伺服器上提供多種語言的網頁服務。
結束語 參考:http://wsiyu.com/read.php?tid=1561
其實php開發中的中文編碼並沒有想像的那麼復雜,雖然定位和解決問題沒有定規,各種運行環境也各不盡然,但後面的原理是一樣的。了解字元集的知識是解決字元問題的基礎。不過,隨著中文字元集的變化,不僅僅是php編程,中文信息處理中的問題還是會存在一段時間的。
⑵ php 如何判斷字元是否是utf8編碼
嚴格來說,不好判斷,但如下方法或許能給你應急處理。 function is_utf8_encode($str, $flag=false){ static $charset = null; if($charset == null){ //gbk中的漢字,但是滿足utf-8的編碼規范,對於這些漢字當做gbk字元處理 $charstr = '隴摟簍擄鹵路脳脿謾貓茅錨矛鉚貌貿梅霉煤眉膩膿臎墨艅艌艒奴菐菒菕菙菛菢菤菧蓱傘藝藟藠藡藱螒螔螕螖螘螙螚螛螜螝螞螠螡螢螣螤巍危韋違桅圍唯惟偽尾緯未蔚味畏胃喂魏位渭謂尉慰蟺蟻蟽蟿蠀蠁蠂蠄蠅衼袗袘袙袚袛袝袞袟袠袡袣袥袦袧袨袩袪小孝校肖嘯笑效楔些歇蠍鞋協挾攜邪斜脅諧寫械卸蟹懈泄瀉謝屑薪芯鋅褉褋褌褍褎褏褑褔褕褖褗褘褜褝褞褟褢'; $charset = str_split($charstr, 2); $charset = array_flip($charset);}$pflag = true;$qflag = false; $len = strlen($str);
⑶ PHP依然是世界上最好的編程語言
世界上最好的語言是什麼?——PHP。
根據 W3Techs的報告顯示了自2010年1月以來伺服器端編程語言使用的 歷史 趨勢。從2010年到2021年,PHP的市場份額不減反而增加了。PHP在2010年的份額為72.5%,而今天增加到了78.8%。
PHP由Rasmus Lerdorf於1994年創建的,PHP作為一種解釋執行的腳本語言,主要用於伺服器端開發,尤其適用於Web開發並可嵌入HTML中。PHP語法和C語言類似,易學易用,雖然PHP存在一些不足之處,但是它之所以能屹立編程語言界20多年,優點肯定也是不少的,因此,如果你想學習如何自己搭建一個網站,PHP是一個不錯的選擇。
如果你想學習PHP,不妨可以通過下面這些書籍開始:
1、《PHP 之道》
HP 之道 收集了現有的 PHP 最佳實踐、編碼規范和權威學習指南,方便 PHP 開發者閱讀和查找。它主要是向 PHP 新手介紹一些他們沒有發現或者是太晚發現的主題, 或是經驗豐富的專業人士已經實踐已久的做法提供一些新想法。它不會告訴你應該使用什麼樣的工具,而是提供多種選擇的建議,並盡可能地說明方法及用法上的差異。(地址: http://laravel-china.github.io/php-the-right-way/ )
2、《PHP Pandas(PHP7)》
本書適合初學者,它不會教你如何製作網站,相反,它教你的是PHP的基礎知識。它非常淺顯易懂,涵蓋了基礎語法到構建大型PHP應用程序的所有內容。每一章都有非常詳細的解釋和一些容易理解的示例。(地址: https://leanpub.com/php-pandas/read )
3、《Survive the Deep End: PHP Security》
這是一本關於PHP應用安全的書籍,本書將會告訴你如何提高應用程序的安全性,它會通過完整的示例對一些常見的安全攻擊手段進行深入剖析,並為你提供解決方案的建議(地址: https://phpsecurity.readthedocs.io/en/latest/Introction.html )
4、《PHP 7 From Scratch》
PHP 7 From Scratch是一本面向初學者的書,它解釋了語言的基本屬性,設置開發環境,使用內置函數和構建簡單的Web頁面。在每章的最後,你可以進行額外的練習以進一步理解。(地址: https://leanpub.com/php7fromscratch/read )
⑷ php人教版小學語文晦
1. 引言…. 2
2. 適用范圍…. 2
3. 標准化的重要性和好處…. 3
4. PHP編碼規范與原則…. 3
4.1. 代碼標記… 3
4.2. 注釋… 3
4.3. 書寫規則… 4
4.3.1. 縮進… 4
4.3.2. 大括弧{}、if和switch. 4
4.3.3. 運算符、小括弧、空格、關鍵詞和函數… 5
4.3.4. 函數定義… 6
4.3.5. 引號… 6
4.3.6. 多語言問題… 7
4.4. 命名原則… 8
4.4.1. 變數、對象、函數名… 8
4.4.2. 常量… 8
4.5. 變數的初始化與邏輯檢查… 8
4.6. 安全性… 9
4.7. 兼容性… 9
4.8. 代碼重用… 10
4.9. 其他細節問題… 10
4.9.1. 包含調用… 10
4.9.2. 錯誤報告級別… 11
5. 資料庫設計…. 11
5.1. 欄位… 11
5.1.1. 表和欄位命名… 11
5.1.2. 欄位結構… 11
5.2. SQL語句… 12
5.3. 性能與效率… 13
5.3.1. 定長與變長表… 13
5.3.2. 運算與檢索… 13
5.3.3. 結構優化與索引優化… 14
5.3.4. 查詢優化… 14
5.3.5. 兼容性問題… 16
6. 模板設計…. 16
6.1. 代碼標記… 16
6.2. 書寫規則… 16
6.2.1. HTML. 16
6.2.2. 變數… 16
6.2.3. 語言元素… 17
6.2.4. 縮進… 17
7. 文件與目錄…. 17
7.1. 文件命名… 17
7.2. 目錄命名… 18
7.3. 空目錄索引… 18
1. 引言
本規范由編程原則組成,融合並提煉了開發人員長時間積累下來的成熟經驗,意在幫助形成良好一致的編程風格。以達到事半功倍的效果,如果有需要本文檔會不定期更新。
版權: 陝西玖肆陸陸網路科技有限公司,保留所有權利
最後更新日期:年11月20日 2006
2. 適用范圍
如無特殊說明,以下規則要求完全適用於phpcms項目,同時也可大部分適用於公司其他PHP項目。
3. 標准化的重要性和好處
當一個軟體項目嘗試著遵守公共一致的標准時,可以使參與項目的開發人員更容易了解項目中的代碼、弄清程序的狀況。使新的參與者可以很快的適應環境,防止部分參與者出於節省時間的需要,自創一套風格並養成終生的習慣,導致其它人在閱讀時浪費過多的時間和精力。而且在一致的環境下,也可以減少編碼出錯的機會。缺陷是由於每個人的標准不同,所以需要一段時間來適應和改變自己的編碼風格,暫時性的降底了工作效率。從使項目長遠健康的發展以及後期更高的團隊工作效率來考慮暫時的工作效率降低是值得的,也是必須要經過的一個過程。標准不是項目成功的關鍵,但可以幫助我們在團隊協作中有更高的效率並且更加順利的完成既定的任務。
1. 程序員可以了解任何代碼,弄清程序的狀況
2. 新人可以很快的適應環境
3. 防止新接觸PHP的人出於節省時間的需要,自創一套風格並養成終生的習慣
4. 防止新接觸PHP的人一次次的犯同樣的錯誤
5. 在一致的環境下,人們可以減少犯錯的機會
6. 程序員們有了一致的敵人
4. PHP編碼規范與原則
4.1.代碼標記
PHP程序可以使用或來界定 PHP 代碼,在HTML頁面中嵌入純變數時,可以使用這樣的形式。
近年來PHP開發組一直倡導代碼規范化和標准化,未來版本PHP可能會開始不建議使用甚至取消和這種速記形式,因此為了加強程序兼容性,在發布之前我們將統一把
4.2.注釋
注釋是對於那些容易忘記作用的代碼添加簡短的介紹性內容。請使用 C 樣式的注釋「」和標准 C++ 注釋「//」。
程序開發中難免留下一些臨時代碼和調試代碼,此類代碼必須添加註釋,以免日後遺忘。所有臨時性、調試性、試驗性的代碼,必須添加統一的注釋標記「//debug」並後跟完整的注釋信息,這樣可以方便在程序發布和最終調試前批量檢查程序中是否還存在有疑問的代碼。例如:
$num = 1;
$flag = TRUE; //debug 這里不能確定是否需要對$flag進行賦值
if(empty($flag)) {
//Statements
}
4.3.書寫規則
4.3.1. 縮進
每個縮進的單位約定是一個TAB(8個空白字元寬度),需每個參與項目的開發人員在編輯器(UltraEdit、EditPlus、ZendStudio等)中進行強制設定,以防在編寫代碼時遺忘而造成格式上的不規范。
本縮進規范適用於PHP、JavaScript中的函數、類、邏輯結構、循環等。
4.3.2. 大括弧{}、if和switch
首括弧與關鍵詞同行,尾括弧與關鍵字同列;
if結構中,if和elseif與前後兩個圓括弧同行,左右各一個空格,所有大括弧都單獨另起一行。另外,即便if後只有一行語句,仍然需要加入大括弧,以保證結構清晰;
switch結構中,通常當一個case塊處理後,將跳過之後的case塊處理,因此大多數情況下需要添加break。break的位置視程序邏輯,與case同在一行,或新起一行均可,但同一switch體中,break的位置格式應當保持一致。
以下是符合上述規范的例子:
If ($condition)
{
switch ($var)
{
case 1: echo 『var is 1』; break;
case 2: echo 『var is 2』; break;
default: echo 『var is neither 1 or 2』; break;
}
}
else
{
switch ($str)
{
case 『abc』:
$result = 『abc』;
break;
default:
$result = 『unknown』;
break;
}
}
4.3.3. 運算符、小括弧、空格、關鍵詞和函數
每個運算符與兩邊參與運算的值或表達式中間要有一個空格,唯一的特例是字元連接運算符號兩邊不加空格;
左括弧「(」 應和函數關鍵詞緊貼在一起,除此以外應當使用空格將「(」同前面內容分開;
右括弧「)」除後面是「)」或者「.」以外,其他一律用空格隔開它們;
除字元串中特意需要,一般情況下,在程序以及HTML中不出現兩個連續的空格;
任何情況下,PHP程序中不能出現空白的帶有TAB或空格的行,即:這類空白行應當不包含任何TAB或空格。同時,任何程序行尾也不能出現多餘的TAB或空格。多數編輯器具有自動去除行尾空格的功能,如果習慣養成不好,可臨時使用它,避免多餘空格產生;
每段較大的程序體,上、下應當加入空白行,兩個程序塊之間只使用1個空行,禁止使用多行。
程序塊劃分盡量合理,過大或者過小的分割都會影響他人對代碼的閱讀和理解。一般可以以較大函數定義、邏輯結構、功能結構來進行劃分。少於15行的程序塊,可不加上下空白行;
說明或顯示部分中,內容如含有中文、數字、英文單詞混雜,應當在數字或者英文單詞的前後加入空格。
根據上述原則,以下舉例說明正確的書寫格式:
$result = (($a + 1) * 3 / 2 + $num)).』Test』;
$condition ? func1($var) : func2($var);
$condition ? $long_statement
: $another_long_statement;
if ($flag)
{
//Statements
//More than 15 lines
}
Showmessage(『請使用 restore.php 工具恢復數據。』);
4.3.4. 函數定義
l 參數的名字和變數的命名規范一致;
l 函數定義中的左小括弧,與函數名緊挨,中間無需空格;
l 開始的左大括弧另起一行;
l 具有默認值的參數應該位於參數列表的後面;
l 函數調用與定義的時候參數與參數之間加入一個空格;
l 必須仔細檢查並切實杜絕函數起始縮進位置與結束縮進位置不同的現象。
例如,符合標準的定義:
function authcode($string, $operation, $key = '')
{
if($flag)
{
//Statement
}
//函數體
}
不符合標準的定義:
function authcode($string,$operation,$key = '') {
//函數體
}
4.3.5. 引號
PHP中單引號和雙引號具有不同的含義,最大的幾項區別如下:
單引號中,任何變數($var)、特殊轉義字元(如「\t \r\n」等)不會被解析,因此PHP的解析速度更快,轉義字元僅僅支持「\』」和「\\」這樣對單引號和反斜杠本身的轉義;
雙引號中,變數($var)值會代入字元串中,特殊轉義字元也會被解析成特定的單個字元,還有一些專門針對上述兩項特性的特殊功能性轉義,例如「\$」和「{$array[『key』]}。這樣雖然程序編寫更加方便,但同時PHP的解析也很慢;
數組中,如果下標不是整型,而是字元串類型,請務必用單引號將下標括起,正確的寫法為$array[『key』],而不是$array[key],因為不正確的寫法會使PHP解析器認為key是一個常量,進而先判斷常量是否存在,不存在時才以「key」作為下標帶入表達式中,同時出發錯誤事件,產生一條Notice級錯誤。
因此,在絕大多數可以使用單引號的場合,禁止使用雙引號。依據上述分析,可以或必須使用單引號的情況包括但不限於下述:
l 字元串為固定值,不包含「\t」等特殊轉義字元;
l 數組的固定下標,例如$array[『key』];
l 表達式中不需要帶入變數,例如$string = 『test』;,而非$string = 「test$var」;
例外的,在正則表達式(用於preg_系列函數和ereg系列函數)中,phpcms全部使用雙引號,這是為了人工分析和編寫的方便,並保持正則表達式的統一,減少不必要的分析混淆。
資料庫SQL語句中,所有數據都不得加單引號,但是在進行sql查詢之前都必須經過intval函數處理;所有字元串都必須加單引號,以避免可能的注入漏洞和SQL錯誤。正確的寫法為:
$catid = intval($catid);
SELECT * FROM phpcms_member WHERE username=』$_username』 ANDcatid=$catid;
所有數據在插入資料庫之前,均需要進行addslashes()處理,以免特殊字元未經轉義在插入資料庫的時候出現錯誤。phpcms中如果已經引入了文件common.inc.php,則所有通過 GET, POST,FILE,取得的變數默認情況下已經使用了addslashes()進行了轉義,不必重復進行。如果數據處理必要(例如用於直接顯示),可以使用stripslashes() 恢復,但數據在插入資料庫之前必須再次進行轉義。
緩存文件中,一般對緩存數據的值採用 addcslashes($string, '\'\\')進行轉義。
4.3.6.
4.4.命名原則
命名是程序規劃的核心。古人相信只要知道一個人真正的名字就會獲得凌駕於那個人之上的不可思議的力量。只要你給事物想到正確的名字,就會給你以及後來的人帶來比代碼更強的力量。
名字就是事物在它所處的生態環境中一個長久而深遠的結果。總的來說,只有了解系統的程序員才能為系統取出最合適的名字。如果所有的命名都與其自然相適合,則關系清晰,含義可以推導得出,一般人的推想也能在意料之中。
就一般約定而言,類、函數和變數的名字應該總是能夠描述讓代碼閱讀者能夠容易的知道這些代碼的作用。形式越簡單、越有規則,就越容易讓人感知和理解。應該避免使用模稜兩可,晦澀不標準的命名。
4.4.1. 變數、對象、函數名
變數、對象、函數名一律為小寫格式,除非必要,單詞之間一般不使用下劃線「_」進行分割;
以標准計算機英文為藍本,杜絕一切拼音、或拼音英文混雜的命名方式;
變數命名只能使用項目中有據可查的英文縮寫方式,例如可以使用$data而不可使用$data1、$data2這樣容易產生混淆的形式,應當使用$articledata、$userdata這樣一目瞭然容易理解的形式;
可以合理的對過長的命名進行縮寫,例如$bio($biography),$tpp($threadsPerPage),前提是英文中有這樣既有的縮寫形式,或字母符合英文縮寫規范;
必須清楚所使用英文單詞的詞性,在許可權相關的范圍內,大多使用$enable***、$is***、的形式,前者後面接動詞,後者後面接形容詞。
4.4.2. 常量
常量應該總是全部使用大寫字母命名,少數特別必要的情況下,可使用劃線來分隔單詞;
PHP 的內建值 TRUE、FALSE 和NULL必須全部採用大寫字母書寫。
4.5.變數的初始化與邏輯檢查
任何變數在進行累加、直接顯示或存儲前必需進行初使化,例如:
$number = 0; //數值型初始化
$string = 『』; //字元串初始化
$array = array(); //數組初始化
判斷一個無法確定(不知道是否已被賦值)的變數時,可用empty()或isset(),而不要直接使用if($switch)的形式,除非你確切的知道此變數一定已經被初始化並賦值。
empty()和isset()的區別為:
l bool empty(mixed var)
n 如果 var 是非空或非零的值,則 empty() 返回FALSE。換句話說,""、0、"0"、NULL、FALSE、array()、var $var;以及沒有任何屬性的對象都將被認為是空的,如果 var 為空,則返回 TRUE。
l bool isset(mixed var[, mixed var[, ...]])
n 如果 var 存在則返回 TRUE,否則返回 FALSE。
n 如果已經使用 unset() 釋放了一個變數之後,它將不再是 isset()。若使用 isset() 測試一個被設置成 NULL的變數,將返回 FALSE。同時要注意的是一個 NULL 位元組("\0")並不等同於 PHP 的 NULL 常數。
判斷一個變數是否為數組,請使用is_array(),這種判斷尤其適用於對數組進行遍歷的操作,例如foreach(),因為如果不事先判斷,foreach()會對非數組類型的變數報錯;
判斷一個數組元素是否存在,可使用isset($array[『key』]),也可使用empty(),兩者異同見上。
4.6.安全性
PHP中的變數不並不像C語言那樣需要事先聲明,解釋器會在第一次使用時自動創建他們,同樣類型也不需要指定,解釋器會根據上下文環境自動確定。從開發人員的角度來看,這無疑是一種極其方便的處理方法。一個變數被創建了,就可以在程序中的任何地方使用。這導致的結果就是開發人員工經常不注意初始化變數。因此,為了提高程序的安全性,我們不能相信任何沒有明確定義的變數。所有的變數在定義使用前要初使化以防止惡意構造提交的變數覆蓋程序中使用的變數。
細節可以閱讀(http://www.securereality.com.au/studyinscarlet.txt)這篇文檔,該文檔里羅列了PHP常見的安全問題,閱讀該文檔是非常有必要的!
4.7.兼容性
代碼設計應當兼顧PHP 高低版本的特性,當前,應仍然以PHP 4.3.0作為最低通過平台,盡量不使用高版本PHP新增的函數、常數或者常量。如果使用只在高版本才具備的函數,必須對其進行二次封裝,自動判斷當前PHP版本,並自行編寫低版本下的兼容代碼;
對於個別函數,參數要求或者代碼要求應當以較為嚴格的PHP版本為准;
除非必要,不要使用PHP擴展模塊中的函數。使用時應當加入必要的判斷,當伺服器環境不支持此函數的時候,進行必要的處理。文檔和程序中的功能說明中,也應加上兼容性說明。
4.8.代碼重用
代碼的有效重用可以減少效率的損失與資源的浪費。在開發軟體項目時為了避免重復勞動和浪費時間。開發人員應盡量提高現有代碼的重用率,同時將更多的精力用在新技術的應用和新功能的創新開發上面。
l 在需要多次使用代碼,並且對於您希望實現的任務沒有可用的內置 PHP函數時,不吝嗇定義函數或類。開發者須根據功能、調用情況,將函數放置於include目錄並以.func.php作為函數文件後綴,將類放置於include/class目錄。超過3行,實現相同功能的程序切勿在不同程序中多次出現,這是無法容忍和迴避的問題;
l在任何時候都不要出現同一個程序中出現兩段或更多的相似代碼或相同代碼,即便在不同程序中,也應盡力避免。開發者應當總是有能力找到避免代碼大段(超過10行)重復或類似的情況。
需要強調的是,本部分雖然篇幅較短,但卻是十分需要經驗,並將花費開發者大量時間和精力去進行優化的部分,任何產品開發者必須時刻清楚和理解代碼重用的重要性和必要性,切實在增強產品效率、邏輯性和可讀性上下功夫,這是一名優秀軟體開發者所必須具備的基本素質。
4.9.其他細節問題
4.9.1. 包含調用
包含調用程序文件,請全部使用require_once,以避免可能的重復包含問題;
包含調用緩存文件,由於緩存文件無法保證100%正確打開,請使用include_once或include。在必要時,可以使用@include_once或@include的方式,以忽略錯誤提示;
包含和調用代碼中,須以PHPCMS_ROOT.』/』開頭,應避免直接寫程序文件名(例如:require_once『x.php』;)的做法;
所有被包含和調用的程序文件,包括但不限於程序、緩存或模板,通常其不能被直接URL請求。phpcms通過在./include/common.inc.php中定義一個標記性常量IN_PHPCMS,來判斷程序是否被合法調用。因此,在除了./include/common.inc.php以外的任何一個被包含和調用的程序文件中,需要包含以下內容,以使得訪問者無法直接通過URL請求該文件:
defined('IN_PHPCMS') or exit('Access Denied');
4.9.2. 錯誤報告級別
在軟體開發和調試階段,請使用error_reporting(E_ALL);作為默認的錯誤報告級別,此級別最為嚴格,能夠報告程序中所有的錯誤、警告和提示信息,以幫助開發者檢查和核對代碼,避免大多數安全性問題和邏輯錯誤、拼寫錯誤。error_reporting()可以在./include/common.inc.php的頭幾行進行設置。
在軟體發布時,請使用error_reporting(E_ERROR | E_WARNING |E_PARSE);作為默認的錯誤報告級別,以利於用戶使用並將無謂錯誤提示信息降至最低。
5. 資料庫設計
5.1.欄位
5.1.1. 表和欄位命名
表和欄位的命名以前面《4.4命名原則》的約定為基本准則。
所有數據表名稱,只要其名稱是可數名詞,則必須以復數方式命名,例如:phpcms_member(用戶表);存儲多項內容的欄位,或代表數量的欄位,也應當以復數方式命名,例如:hits(查看次數)、items(內容數量)。
當幾個表間的欄位有關連時,要注意表與表之間關聯欄位命名的統一,如phpcms_article_1表中的articleid與phpcms_article_data_1表中的articleid。
代表id自增量的欄位,通常用以下幾種形式:
l 一般情況下,使用全稱的形式,例如userid、articleid;
l 沒有功能性作用,只為管理和維護方便而設的id,可以使用全稱的形式,也可只將其命名為id。
篇幅所限,無法一一贅述,但所有與表、欄位相關的命名,請務必大量參考phpcms現有欄位的命名方式,以保證命名的系統性和統一性。
5.1.2. 欄位結構
允許NULL值的欄位,資料庫在進行比較操作時,會先判斷其是否為NULL,非NULL時才進行值的必對。因此基於效率的考慮,所有欄位均不能為空,即全部NOTNULL;
預計不會存儲非負數的欄位,例如各項id、發帖數等,必須設置為UNSIGNED類型。UNSIGNED類型比非UNSIGNED類型所能存儲的正整數范圍大一倍,因此能獲得更大的數值存儲空間;
存儲開關、選項數據的欄位,通常使用tinyint(1)非UNSIGNED類型,少數情況也可能使用enum()結果集的方式。tinyint作為開關欄位時,通常1為打開;0為關閉;-1為特殊數據,例如N/A(不可用);高於1的為特殊結果或開關二進制數組合(詳見phpcms中相關代碼);
MEMORY/HEAP類型的表中,要尤其注意規劃節約使用存儲空間,這將節約更多內存。例如cdb_sessions表中,就將IP地址的存儲拆分為4個tinyint(3)UNSIGNED類型的欄位,而沒有採用char(15)的方式;
任何類型的數據表,欄位空間應當本著足夠用,不浪費的原則,數值類型的欄位取值范圍見下表:
欄位類型 存儲空間(b) UNSIGNED 取值范圍
tinyint 1 否 -128~127
是 0~255
smallint 2 否 -32768~32767
是 0~65535
mediumint 3 否 -8388608~8388607
是 0~16777215
int 4 否 -2147483648~2147483647
是 0~4294967295
bigint 8 否 -9223372036854775808
~9223372036854775807
是 0
~18446744073709551615
5.2.SQL語句
所有SQL語句中,除了表名、欄位名稱以外,全部語句和函數均需大寫,應當杜絕小寫方式或大小寫混雜的寫法。例如select * fromphpcms_member;是不符合規范的寫法。
很長的SQL語句應當有適當的斷行,依據JOIN、FROM、ORDER BY等關鍵字進行界定。
通常情況下,在對多表進行操作時,要根據不同表名稱,對每個表指定一個1~2個字母的縮寫,以利於語句簡潔和可讀性。
如下的語句範例,是符合規范的:
$result = $db->query(」SELECT m.*, i.*
FROM 「.TABLE_MEMBER.」 m, 「.TABLE_MEMBERINFO.」 i
WHERE m.userid=i.userid AND m.userid=』$_userid』);
望採納!
⑸ 如何快速學會PHP
php的概述
了解什麼是php,php語言有什麼優勢,php語言有哪些特性,php的發展趨勢,php應用的領域等等問題。