⑴ java中編碼與解碼分別指什麼
java中編碼:URLEncoder.encode(strUri,"utf-8");
java中解碼碼:URLDecoder.decode(strUri,"utf-8");
⑵ java判斷文件編碼格式 怎麼判斷編碼格式
UTF-8編碼的文本文檔,有的帶有BOM (Byte Order Mark, 位元組序標志),即0xEF, 0xBB, 0xBF,有的沒有。Windows下的txt文本編輯器在保存UTF-8格式的文本文檔時會自動添加BOM到文件頭。在判斷這類文檔時,可以根據文檔的前3個位元組來進行判斷。然而BOM不是必需的,而且也不是推薦的。對不希望UTF-8文檔帶有BOM的程序會帶來兼容性問題,例如Java編譯器在編譯帶有BOM的UTF-8源文件時就會出錯。而且BOM去掉了UTF-8一個期望的特性,即是在文本全部是ASCII字元時UTF-8是和ASCII一致的,即UTF-8向下兼容ASCII。
在具體判斷時,如果文檔不帶有BOM,就無法根據BOM做出判斷,而且IsTextUnicode API也無法對UTF-8編碼的Unicode字元串做出判斷。那在編程判斷時就要根據UTF-8字元編碼的規律進行判斷了。
UTF-8是一種多位元組編碼的字元集,表示一個Unicode字元時,它可以是1個至多個位元組,在表示上有規律:
1位元組:0xxxxxxx
2位元組:110xxxxx 10xxxxxx
3位元組:1110xxxx 10xxxxxx 10xxxxxx
4位元組:11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
這樣就可以根據上面的特徵對字元串進行遍歷來判斷一個字元串是不是UTF-8編碼了。
舉例代碼:
java.io.File f=new java.io.File("待判定的文本文件名");
try{
java.io.InputStream ios=new java.io.FileInputStream(f);
byte[] b=new byte[3];
ios.read(b);
ios.close();
if(b[0]==-17&&b[1]==-69&&b[2]==-65)
System.out.println(f.getName()+"編碼為UTF-8");
else System.out.println(f.getName()+"可能是GBK");
}catch(Exception e){
e.printStackTrace();
}
⑶ Java鍐欏叆TXT鏂囦歡鏃朵繚瀛樹負Unicode錛屼絾鎵撳紑鏃跺欐樉紺虹紪鐮佷負Unicode big endian錛屾垜鍙闇瑕佺殑鏄疷nicode緙栫爜錛
榪囧幓鐨勬墍璋"Unicode緙栫爜"鍏跺疄鏄鎸嘦CS-16緙栫爜錛寀nicode鏄鎸囧瓧絎﹂泦錛岃繛gb18030閮芥槸unicode緙栫爜銆傝屸淯nicode big endian 鈥濇槸UTF-16BE緙栫爜錛屼篃灞炰簬unicode緙栫爜.
鍙浠ユ敼鎴
OutputStreamWriter out = new OutputStreamWriter(new FileOutputStream(file,true),"UTF-16LE");//搴旇ュ氨鏄浣犺佺殑涓嶄弗璋ㄧ殑"unicode"緙栫爜
⑷ java 寫入txt文件的中文亂碼是怎麼回事
原因是寫入時使用的字元編碼和期望的不一致導致的,因為JVM虛擬機啟動時會因不同的參數使用不同的預設字元編碼。
解決辦法:
如果你期望寫到文件中的漢字是 GBK編碼,可以:
1、寫文件時,將字元串准換成 GBK編碼的byte[], 如: myios.write( "漢字".getBytes("GBK"));
2、java 虛擬機啟動時,增加 -DFile.encode=GBK 選項。
⑸ java 寫入txt文件的中文亂碼問題
原因是寫入時使用的字元編碼和期望的不一致導致的,因為JVM虛擬機啟動時會因不同的參數使用不同的預設字元編碼。
解決辦法:
如果你期望寫到文件中的漢字是 GBK編碼,可以:
1、寫文件時,將字元串准換成 GBK編碼的byte[], 如: myios.write( "漢字".getBytes("GBK"));
2、java 虛擬機啟動時,增加 -DFile.encode=GBK 選項。