⑴ java怎么把UTF-8字符串转成GBK字符串
java不同编码之间进行转换,都需要使用unicode作为中转。
以utf-8转gbk为例,示例代码如下:
Stringt="这是一个字符串aaa111";
Stringutf8=newString(t.getBytes("UTF-8"));
System.out.println(utf8);
Stringunicode=newString(utf8.getBytes(),"UTF-8");
System.out.println(unicode);
Stringgbk=newString(unicode.getBytes("GBK"));
System.out.println(gbk);
⑵ java中 unicode编码转换成UTF-8,请前辈指点,谢谢
看来你手里有这个代码喽。
我从来没仔细研究过具体如何转换的,只是知道,如果java里String str = 什么什么; 能够取到str值了,那么此时的str一定为unicode了,转换的时候一般用在输出上。
&是按位与,就是每一个二进制位分别对应进行与操作。
|是按位或,就是每一个二进制位分别对应进行或操作。
⑶ java中如何在中文字符和unicode编码之间进行转换
可以这样来重构字符串new String(“XXX".getByte(),”UTF-8“);后面加上编码方式
⑷ java怎么把汉字转化成unicode编码
中文转换成Unicode编码和Unicode编码转换成中文
importjava.util.Properties;
publicclassTest{
publicstaticvoidmain(String[]args){
Strings="简介";
Stringtt=gbEncoding(s);//Stringtt1="你好";
System.out.println(decodeUnicode("\u7b80\u4ecb"));//System.out.println(decodeUnicode(tt1));
System.out.println(HTMLDecoder.decode("中国"));
Strings1="u7b80u4ecb";
System.out.println(s.indexOf("\"));
}
publicstaticStringgbEncoding(finalStringgbString){
char[]utfBytes=gbString.toCharArray();
StringunicodeBytes="";
for(intbyteIndex=0;byteIndex<utfBytes.length;byteIndex++){
StringhexB=Integer.toHexString(utfBytes[byteIndex]);
if(hexB.length()<=2){
hexB="00"+hexB;
}
unicodeBytes=unicodeBytes+"\u"+hexB;
}
System.out.println("unicodeBytesis:"+unicodeBytes);
returnunicodeBytes;}
(finalStringdataStr){
intstart=0;
intend=0;
finalStringBufferbuffer=newStringBuffer();
while(start>-1){
end=dataStr.indexOf("\u",start+2);
StringcharStr="";
if(end==-1){
charStr=dataStr.substring(start+2,dataStr.length());
}else{
charStr=dataStr.substring(start+2,end);
}
charletter=(char)Integer.parseInt(charStr,16);//16进制parse整形字符串。
buffer.append(newCharacter(letter).toString());
start=end;
}
returnbuffer.toString();
}}
}
}
}
⑸ java怎么把字符串转换为UTF8的unicode码
String str="你好";
char[] ch=str.toCharArray();
String ss=null;
for (int i = 0; i <蚂和 ch.length; i++) {
ss="\闷世盯返启\u"+Integer.toHexString(ch[i]);
System.out.println(ss);
}
⑹ java怎么把UTF-8里面的汉字转成Unicode
string.getbytes("ISO646-US")
Unicode当然是一个很大的集合,现在的规模可以容纳100多万个符号。每个符号的编码都不一样,比如,U+0639表示阿拉伯字雹衫好母Ain,U+0041表示英语的大写字母A,“汉”这个字的Unicode编码是U+6C49。
Unicode固然统一了编码方式,但是它的效率不高,比如UCS-4(Unicode的标准之一)规定用4个字节存储一个符号,那么每个英文字母前都必然有三塌含个字源铅节是0,这对存储和传输来说都很耗资源。
⑺ Java如何将一段汉字变成unicode码 例如我随意输入几个字 让它输出Unicode 求代码
按照指定字符集读取乱旦文本(utf-8或者gbk)得到字符串,按照字符一个一个提取轮渣出来,转换成unicode字符哗桐扰集的字节数组,转成16进制输出即可。