javastring設置編碼_java里關於String的編碼與解碼

㈠ java怎麼對string編碼

參考如下代碼：

package com.qiu.lin.he;

import java.io.UnsupportedEncodingException;

public class Ceshi {

public static void main(String[] args) {

String name = "張三";

byte[] b1 = null;

try {

b1 = name.getBytes("UTF-8");

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

}

String name1 = "";

try {

name1 = new String(b1, "UTF-8");

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

} // 編碼解碼相同，正常顯示

System.out.println(name1);

String name2 = "";

try {

name2 = new String(b1, "GBK");

} catch (UnsupportedEncodingException e) {

e.printStackTrace();

} // 編碼解碼不同，亂碼

System.out.println(name2);

}

運行結果為：

㈡ java中的String的默認編碼是什麼

可以通過如下代碼獲得默認編碼：

System.out.println(Charset.defaultCharset());

字元編碼（英語：Character encoding）也稱字集碼，是把字元集中的字元編碼為指定集合中某一對象（例如：比特模式、自然數序列、8位組或者電脈沖），以便文本在計算機中存儲和通過通信網路的傳遞。常見的例子包括將拉丁字母表編碼成摩斯電碼和ASCII。其中，ASCII將字母、數字和其它符號編號，並用7比特的二進制來表示這個整數。通常會額外使用一個擴充的比特，以便於以1個位元組的方式存儲。
在計算機技術發展的早期，如ASCII（1963年）和EBCDIC（1964年）這樣的字元集逐漸成為標准。但這些字元集的局限很快就變得明顯，於是人們開發了許多方法來擴展它們。對於支持包括東亞CJK字元家族在內的寫作系統的要求能支持更大量的字元，並且需要一種系統而不是臨時的方法實現這些字元的編碼。

㈢ java里關於String的編碼與解碼

從語言編碼的角度，getBytes(charset)不是解碼、也不是編碼，是轉換。API 說的是針對數據的角度。把一個整體的String分解成byte[]了。

byte[] b2=s.getBytes("gbk");
String ss=new String(b2,"utf-8");

從GBK轉換成UTF-8。

UTF8包含更多的文字量。

㈣請問java如何改變字元串的編碼方式

byte[] b=string.getBytes("GB2312");//使用GB2312編碼方式對字元串string進行編碼
//這時要想將位元組數組b的內容正確解碼只能使用GB2312的編碼方式進行解碼，即
String str=new String(b,"GB2312");//這里若使用UTF-8編碼方式來進行解碼就會亂碼
//將eclipse默認的編碼方式改為UTF-8，只是用該編碼方式對.java源文件進行編碼保存
//這個對new String(string.getBytes("GB2312"),"UTF-8")沒啥影響的
//因為從java源文件獲取字元串string時，已經通過UTF-8編碼方式進行解碼了
//而string.getBytes("GB2312")是使用指定的編碼方式對字元串string進行從新編碼
//這兩者之間沒啥關系的

㈤ java中如何修改字元串編碼

StringBuilder
sb
=
new
StringBuilder();
//
創建URL
URL
url
=
new
URL("GBK
page
URL");
//
打開請求鏈接
URLConnection
page
=
url.openConnection();
//
以GBK格式讀取返迴流
BufferedReader
in
=
new
BufferedReader(new
InputStreamReader(page.getInputStream(),"GBK"));
//
讀取流內容
String
inputLine;
while
((inputLine
=
in.readLine())
!=
null)
{
sb.append(inputLine);
}
sb.toString();

㈥ Java怎麼將字元串轉換為GB2312原編碼

@Test
publicvoidtest333(){
		Stringa="青白";
		try{
			byte[]b=a.getBytes("GB2312");
			System.out.println(bytesToHexFun1(b));
			
		}catch(UnsupportedEncodingExceptione){
			e.printStackTrace();
		}
	}
	//將byte數組轉成16進制字元串
	(byte[]bytes){
		char[]HEX_CHAR={'0','1','2','3','4','5',
		'6','7','8','9','a','b','c','d','e','f'};
	//一個byte為8位，可用兩個十六進制位標識
	char[]buf=newchar[bytes.length*2];
	inta=0;
	intindex=0;
	for(byteb:bytes){//使用除與取余進行轉換
	if(b<0){
	a=256+b;
	}else{
	a=b;
	}
	buf[index++]=HEX_CHAR[a/16];
	buf[index++]=HEX_CHAR[a%16];
	}
	returnnewString(buf);
	}
	
中心思想就是先轉成GB2312的byte數組，再轉成16進制就可以了。

㈦ javastring編碼

從ISO-8859-1編碼轉為GBK編碼，因為所有的編碼底層都是Unicode編碼就是為了編碼的統一
最後是GBK編碼，默認看eclipse的配置，不該的情況是ISO-8859-1，最好改為UTF-8

㈧怎麼用java把一個字元串進行utf8編碼

String text = 「字元串」;

byte[] b_utf8 = text.getBytes("UTF-8"); //utf-8

byte[] b_iso88591 = text.getBytes("ISO8859-1"); //iso8859-1

byte[] b_gbk = text.getBytes("GBK"); //gbk

string unicode = getUnicode(text);//unicode

public static String getUnicode(String source) {

String result = "";

for (int i = 0; i < source.length(); i++) {

result += "\u"+Integer.toHexString((int) source.charAt(i));

}

return result;

}

㈨ java如何把string轉為utf-8

java不同編碼之間進行轉換，都需要使用unicode作為中轉。

String str = "任意字元串";

str = new String(str.getBytes("gbk"),"utf-8");

備注說明：

str.getBytes("UTF-8"); 意思是以UTF-8的編碼取得位元組

new String(XXX,"UTF-8"); 意思是以UTF-8的編碼生成字元串

舉例：

public static String getUTF8XMLString(String xml) {

// A StringBuffer Object

StringBuffer sb = new StringBuffer();

sb.append(xml);

String xmString = "";

String xmlUTF8="";

try {

xmString = new String(sb.toString().getBytes("UTF-8"));

xmlUTF8 = URLEncoder.encode(xmString, "UTF-8");

System.out.println("utf-8 編碼：" + xmlUTF8) ;

} catch (UnsupportedEncodingException e) {

// TODO Auto-generated catch block

e.printStackTrace();

}

// return to String Formed

return xmlUTF8;

(9)javastring設置編碼擴展閱讀:

UTF-8編碼規則：

如果只有一個位元組則其最高二進制位為0；如果是多位元組，其第一個位元組從最高位開始，連續的二進制位值為1的個數決定了其編碼的位元組數，其餘各位元組均以10開頭。

實際表示ASCII字元的UNICODE字元，將會編碼成1個位元組，並且UTF-8表示與ASCII字元表示是一樣的。所有其他的UNICODE字元轉化成UTF-8將需要至少2個位元組。每個位元組由一個換碼序列開始。第一個位元組由唯一的換碼序列，由n位連續的1加一位0組成，首位元組連續的1的個數表示字元編碼所需的位元組數。

Unicode轉換為UTF-8時，可以將Unicode二進制從低位往高位取出二進制數字，每次取6位，如上述的二進制就可以分別取出為如下示例所示的格式，前面按格式填補，不足8位用0填補。

㈩ java中文亂碼，能說下string.getBytes()和new String()轉碼是，具體點。

1、Java中，【String.getBytes(String decode)】的方法，會根據指定的decode，編碼返回某字元串在該編碼下的byte數組表示，例如：

byte[] b_gbk = "中".getBytes("GBK");
byte[] b_utf8 = "中".getBytes("UTF-8");
byte[] b_iso88591 = "中".getBytes("ISO8859-1")

上面三行代碼表示：分別返回「中」這個漢字在GBK、UTF-8和ISO8859-1編碼下的byte數組表示，此時b_gbk的長度為2，b_utf8的長度為3，b_iso88591的長度為1。

2、而通過【new String(byte[], decode)】的方式來還原這個「中」字時，實際是使用decode指定的編碼來將byte[ ]解析成字元串，例如：

String s_gbk = new String(b_gbk,"GBK");
String s_utf8 = new String(b_utf8,"UTF-8");
String s_iso88591 = new String(b_iso88591,"ISO8859-1");

s_gbk和s_utf8都是「中」，而只有s_iso88591是一個不認識的字元，因為ISO8859-1編碼的編碼表中，根本就沒有包含漢字字元，當然也就無法通過"中".getBytes("ISO8859-1")。

因此，通過【String.getBytes(String decode)】方法來得到byte[ ]時，要確定decode的編碼表中確實存在String表示的碼值，這樣得到的byte[ ]數組才能正確被還原。

(10)javastring設置編碼擴展閱讀

java中文編碼避免亂碼

1、為了讓中文字元適應某些特殊要求（如http header頭要求其內容必須為iso8859-1編碼），可能會通過將中文字元按照位元組方式來編碼的情況，比如：

String s_iso88591 = new String("中".getBytes("UTF-8"),"ISO8859-1")

2、上述例子中的s_iso8859-1字元串實際是三個在 ISO8859-1中的字元，在將這些字元傳遞到目的地後，目的地程序再通過相反的方式：

String s_utf8 = new String(s_iso88591.getBytes("ISO8859-1"),"UTF-8")

來得到正確的中文漢字。這樣就既保證了遵守協議規定、也支持中文。

3、String.getBytes(String decode)方法會根據指定的decode編碼返回某字元串在該編碼下的byte數組表示這里是encode ，not decode，從字元串到位元組數組是編碼的過程，從位元組數組到字元串（即 new String（byte[] , charsetname））才是解碼的過程。

導航:首頁 > 編程語言 > javastring設置編碼

javastring設置編碼

與javastring設置編碼相關的資料