㈠ php 如何獲取gbk對應漢字編碼
16進制就是:
$s = '剝';
echo bin2hex($s);
10進制就是hexdec(bin2hex($s));
從編碼值轉為漢字:
$i = hexdec(bin2hex($s));
echo pack('N', $i);
㈡ PHP中文編碼~~
一、頁面編碼
1. 使用 <META http-equiv="content-type" content="text/html; charset=xxx"> 標簽設置頁面編碼
這個標簽的作用是聲明客戶端的瀏覽器用什麼字元集編碼顯示該頁面,xxx可以為GB2312,GBK,UTF-8(和MySQL不同,MySQL是 UTF8)等等。因此,大部分頁面可以採用這種方式來告訴瀏覽器顯示這個頁面的時候採用什麼編碼,這樣才不會造成編碼錯誤而產生亂碼。但是有的時候我們會發現有了這句還是不行,不管xxx是哪一種,瀏覽器採用的始終都是一種編碼,這個情況我後面會談到。
請注意,<meta>是屬於html信息的,僅僅是一個聲明,它起作用表明伺服器已經把HTML信息傳到了瀏覽器。
2. header("content-type:text/html; charset=xxx");
這個函數header()的作用是把括弧裡面的信息發到http標頭。
如果括弧裡面的內容為文中所說那樣,那作用和<META>標簽基本相同,大家對照第一個看發現字元都差不多的。但是不同的是如果有這段函數,瀏覽器就會永遠採用你所要求的xxx編碼,絕對不會不聽話,因此這個函數是很有用的。為什麼會這樣呢?那就得說說HTTPS標頭和HTML信息的差別了:
https標頭是伺服器以HTTP協議傳送HTML信息到瀏覽器前所送出的字串。
因為meta標簽是屬於html信息的,所以header()發送的內容先到達瀏覽器,通俗點就是header()的優先順序高於meta(不知道可不可以這樣講)。加入一個php頁面既有header("content-type:text/html; charset=xxx"),又有<META http-equiv="content-type" content="text/html; charset=xxx">,瀏覽器就只認前者http標頭而不認meta了。當然這個函數只能在php頁面內使用。
同樣也留有一個問題,為什麼前者就絕對起作用,而後者有時候就不行呢?這就是接下來要談的Apache的原因了。
3. AddDefaultCharset
Apache 根目錄的 conf 文件夾里,有整個Apache的配置文檔httpd.conf。
用文本編輯器打開httpd.conf,第708行(不同版本可能不同)有AddDefaultCharset xxx,xxx為編碼名稱。這行代碼的意思:設置整個伺服器內的網頁文件https標頭里的字元集為你默認的xxx字元集。有這行,就相當於給每個文件都加了一行header("content-type:text/html; charset=xxx")。這下就明白為什麼明明meta設置了是utf-8,可瀏覽器始終採用gb2312的原因。
如果網頁里有header("content-type:text/html; charset=xxx"),就把默認的字元集改為你設置的字元集,所以這個函數永遠有用。如果把AddDefaultCharset xxx前面加個「#」,注釋掉這句,而且頁面里不含header("content-type…"),那這個時候就輪到meta標簽起作用了。
4. default_charset
在 php.ini 文件中可以定義 php 的默認語言: default_charset = "xxx",xxx為編碼名稱。這行代碼的意思是設置所有 php 的輸出頁面編碼為 xxx。
總結:
以上 4 種編碼設置方法的優先順序如下:
header("content-type:text/html; charset=xxx")
default_charset xxx
AddDefaultCharset xxx
<META http-equiv="content-type" content="text/html; charset=xxx">
如果你是web程序員,給你的每個頁面都加個header("content-type:text/html; charset=xxx"),保證它在任何伺服器都能正確顯示,可移植性強。
至於那句AddDefaultCharset xxx,要不要注釋就仁者見仁了。反正我是注釋掉了,不過我寫頁子也要寫header(),便於放到伺服器上能正常顯示。
二、資料庫編碼
PHP 程序在查詢資料庫之前,首先執行 mysql_query(「SET NAMES xxxx」);其中 xxxx 是你網頁的編碼(charset=xxxx),如果網頁中 charset=utf8,則 xxxx=utf8,如果網頁中 charset=gb2312,則xxxx=gb2312,幾乎所有WEB程序,都有一段連接資料庫的公共代碼,放在一個文件里,在這文件里,加入mysql_query(「set names」)就可以了。
SET NAMES 顯示客戶端發送的 SQL 語句中使用什麼字元集。因此,SET NAMES 'utf-8'語句告訴伺服器「將來從這個客戶端傳來的信息採用字元集utf-8」。它還為伺服器發送回客戶端的結果指定了字元集。(例如,如果你使用一個SELECT語句,它表示列值使用了什麼字元集。)
三、中文文件名
默認情況下,文件名為中文時不能訪問。要使中文文件名能正常訪問,需進行如下設置:
在ie中選擇 工具 -> internet選項 -> 高級 -> 取消「總是以UTF-8發送URL」。
㈢ PHP 輸出簡單的中文 亂碼問題
解決php中中文亂碼問題方法
php文件本身的編碼與網頁的編碼應匹配
a. 如果欲使用gb2312編碼,那麼php要輸出頭:header(「Content-Type: text/html; charset=gb2312"),靜態頁面添加<metahttp-equiv="Content-Type" content="text/html; charset=gb2312">,所有文件的編碼格式為ANSI,可用記事本打開,另存為選擇編碼為ANSI,覆蓋源文件。
b. 如果欲使用utf-8編碼,那麼php要輸出頭:header(「Content-Type: text/html; charset=utf-8"),靜態頁面添加<metahttp-equiv="Content-Type" content="text/html; charset=utf-8">,所有文件的編碼格式為utf-8。保存為utf-8可能會有點麻煩,一般utf-8文件開頭會有BOM,如果使用session就會出問題,可用editplus來保存,在editplus中,工具->參數選擇->文件->UTF-8簽名,選擇總是刪除,再保存就可以去掉BOM信息了。
php本身不是Unicode的,所有substr之類的函數得改成mb_substr(需要裝mbstring擴展);或者用iconv轉碼。
如果你的HTML文件文件出現了亂碼問題,那麼你可以在head標簽裡面加入UTF8編碼(國際化編碼):UTF-8是沒有國家的編碼,也就是獨立於任何一種語言,任何語言都可以使用的。
(3)php漢字編碼擴展閱讀:
解決PHP 輸出簡單的中文 亂碼問題的其他方法:
在php的echo前面加入header("Content-Type:text/html;charset=gb2312")
把<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />中的UTF-8改成gb2312
㈣ 如何解決PHP中文亂碼問題
PHP中文亂碼主要是編碼不對,存在以下兩種情況,你以此檢查一下 ,改對編碼就行了
1、 php文件本身的編碼與網頁的編碼應匹配
a. 如果欲使用gb2312編碼,那麼php要輸出頭:header(「Content-Type: text/html; charset=gb2312"),靜態頁面添加<meta http-equiv="Content-Type" content="text/html; charset=gb2312">,所有文件的編碼格式為ANSI,可用記事本打開,另存為選擇編碼為ANSI,覆蓋源文件。
b. 如果欲使用utf-8編碼,那麼php要輸出頭 :header(「Content-Type: text/html; charset=utf-8"),靜態頁面添加<meta http-equiv="Content-Type" content="text/html; charset=utf-8">,所有文件的編碼格式為utf-8。保存為utf-8可能會有點麻煩,一般utf-8文件開頭會有BOM,如果使用 session就會出問題,可用editplus來保存,在editplus中,工具->參數選擇->文件->UTF-8簽名,選擇總 是刪除,再保存就可以去掉BOM信息了。
2. php本身不是Unicode的,所有substr之類的函數得改成mb_substr(需要裝mbstring擴展);或者用iconv轉碼。
㈤ PHP如何對漢字進行編碼
base64_encode
㈥ PHP 如何取得漢字的Unicode編碼 且相互轉換
sybase_connect
連上資料庫。
語法: int sybase_connect(string [servername], string [username], string [password]);
返回值: 整數
函數種類: 資料庫功能
本函數用來打開與 Sybase 資料庫的連接。參數 servername 為欲連上的資料庫伺服器名稱。參數 username 及 password 可省略,分別為連接使用的帳號及密碼。使用本函數需注意早點關閉資料庫,以減少系統的負擔。連接成功則返回資料庫的連接代號,失敗返回 false 值。
㈦ php 轉html漢字編碼
PHP 5.4.x或以上版本可以用html_entity_decode(' 32534; 30721');
解碼成UTF-8的『編碼』
大多數人在用的PHP 5.3.x或以下版本不能用html_entity_decode解碼拉丁字母以外的字元。
5.3以下可以載入mbstring多位元組字元庫,
echo mb_decode_numericentity(' 32534; 30721' ,array(0,0xffffff,0,0xffffff),'GBK');
顯示'編碼'
不能載入庫的就要自己寫函數實現這一過程了。需要我可以寫一個
㈧ php如何輸出gb2312編碼對應的漢字
用chr函數輸出。別聽1-2樓瞎說!他們都沒做過PHP開發。
漢字由於是雙位元組,所以要一個位元組一個位元組的輸出,並且編碼是16進制的,因此需要按下面這樣輸出。
復制下面的代碼運行:
<?php
$chars = '你好';
$text = '';
$codes = array ();
for ($i = 0; $i < strlen( $chars ); $i++) {
$c = ord ( substr ( $chars, $i, 1 ) );
$text .= chr ( $c );
$codes [] = $c;
}
echo ( $text );
?>
同時,請注意,php對於漢字的ASCII碼根據PHP文件的編碼不同,是不一樣的。要獲取其編碼,使用ord()函數,但是ord函數只返回首個字元的ASCII碼
如果你知道 ASCII碼,也可以通過 pack 函數打包以後作為字元串輸出
㈨ PHP中文亂碼怎麼解決
最好最快的解決辦法就是使頁面申明的編碼與資料庫內部編碼一致,如果頁面申請的編碼與資料庫內部的編碼不一致時,那就設定連接編碼。Mysql_query(「set
names
***」).
php文件本身的編碼與網頁的編碼應匹配,如果欲使用gb2312編碼,那麼php要輸出頭
代碼如下:
header(「Content-type:text/html;charset=gb2312」)
靜態頁面添加
代碼如下:
<meta
http-equiv=」Content-type」content=」text/html;
charset=gb2312」>,所有文件的編碼格式為ANSI,可用記事本打開,另存為選擇編碼為ANSI,覆蓋源文件。
如果欲使用uft-8編碼,那麼php要輸出頭
代碼如下:
header(「Content-type:text/html;
charset=utf-8」),
靜態頁面添加
代碼如下:
<meta
http-equiv=」Content-type」content=」text/html;
charset=utf-8」>,
所有文件的編碼格式為utf-8.保存為utf-8可能會有點麻煩,一般utf-8開頭會有BOM,如果使用
Session就會出現問題,可用editplus軟體來保存。
我也是從這里得知:
http://www.chinahost.org/page-320-1-1.html?fa=ss_php