Ⅰ 有沒有將UTF-8-BOM批量轉為UTF-8的軟體
import java.io.*;
import java.util.ArrayList;
import java.util.List;
/**
* utf-8有bom 批量轉為 utf-8無bom 文件格式
*/
public class UTF8BOMConverter extends Reader {
private static final int BOM_SIZE = 4;
PushbackInputStream internalIn;//回退流對象
InputStreamReader internalIn2 = null;
String defaultEnc;//格式
/**
* @param in inputstream to be read
* @param defaultEnc default encoding if stream does not have
* BOM marker. Give NULL to use system-level default.
*/
UTF8BOMConverter(InputStream in, String defaultEnc) {
internalIn = new PushbackInputStream(in, BOM_SIZE);
this.defaultEnc = defaultEnc;
}
private static void (String filePath, String readEncoding, String saveEncoding) throws Exception {
saveContent(filePath, readContent
Ⅱ java 做web項目什麼時候用gbk什麼時候用utf-8
UTF-8:Unicode TransformationFormat-8bit,允許含BOM,但通常不含BOM。是用以解決國際上字元的一種多位元組編碼,它對英文使用8位(即一個位元組),中文使用24為(三個位元組)來編碼。UTF-8包含全世界所有國家需要用到的字元,是國際編碼,通用性強。UTF-8編碼的文字可以在各國支持UTF8字元集的瀏覽器上顯示。如,如果是UTF8編碼,則在外國人的英文IE上也能顯示中文,他們無需下載IE的中文語言支持包。
GBK是國家標准GB2312基礎上擴容後兼容GB2312的標准。GBK的文字編碼是用雙位元組來表示的,即不論中、英文字元均使用雙位元組來表示,為了區分中文,將其最高位都設定成1。GBK包含全部中文字元,是國家編碼,通用性比UTF8差,不過UTF8佔用的資料庫比GBD大。
對於一個網站、論壇來說,如果英文字元較多,則建議使用UTF-8節省空間。不過現在很多論壇的插件一般只支持GBK