⑴ 〈java〉怎么精确判断读取的任意文本的编码格式utf-i8, unicode,ansi等
new String(a.getBytes("ISO-8859-1"),"GB2312")
以单字节编码方式获取字符串流, 然后转中文格式,或者
new String(a.getBytes("ISO-8859-1"),"UTF-8")
GBK是中国的解析字符标准,UTF-8是世界标准
⑵ java中编码与解码分别指什么
java中编码:URLEncoder.encode(strUri,"utf-8");
java中解码码:URLDecoder.decode(strUri,"utf-8");
⑶ 如何解决java编译时编码问题造成的错误
Java源码文件这些文件可以是任意字符编码的,在Java的Class文件里存储的字符串是UTF-8编码的,所以如果在代码中有中文字符的话,就会导致乱码。当然,这只是众多原因中的一种,所以把编码设置统一是避免出现乱码的解决办法。
工具:
eclipse
方法如下:
点击window--Preferences
附:也可以选择Other,从Other中选择程序需要的编码格式。
⑷ java 怎么判断编码是utf-8 还是gbk
你是要判断字符还是判断文件的编码,若是字符:
String
str="123456";
String
type
=
"utf-8";
//更换这里进行其他编码判断
try
{
if
(str.equals(new
String(str.getBytes(type
),
type
)))
{
return
type;
}
}
catch
(Exception
e)
{
}
如果是文件,麻烦一些,可以使用一个开源项目cpdetector,这个我也没用过,你自己查一下吧
⑸ java判断文件编码格式 怎么判断编码格式
UTF-8编码的文本文档,有的带有BOM (Byte Order Mark, 字节序标志),即0xEF, 0xBB, 0xBF,有的没有。Windows下的txt文本编辑器在保存UTF-8格式的文本文档时会自动添加BOM到文件头。在判断这类文档时,可以根据文档的前3个字节来进行判断。然而BOM不是必需的,而且也不是推荐的。对不希望UTF-8文档带有BOM的程序会带来兼容性问题,例如Java编译器在编译带有BOM的UTF-8源文件时就会出错。而且BOM去掉了UTF-8一个期望的特性,即是在文本全部是ASCII字符时UTF-8是和ASCII一致的,即UTF-8向下兼容ASCII。
在具体判断时,如果文档不带有BOM,就无法根据BOM做出判断,而且IsTextUnicode API也无法对UTF-8编码的Unicode字符串做出判断。那在编程判断时就要根据UTF-8字符编码的规律进行判断了。
UTF-8是一种多字节编码的字符集,表示一个Unicode字符时,它可以是1个至多个字节,在表示上有规律:
1字节:0xxxxxxx
2字节:110xxxxx 10xxxxxx
3字节:1110xxxx 10xxxxxx 10xxxxxx
4字节:11110xxx 10xxxxxx 10xxxxxx 10xxxxxx
这样就可以根据上面的特征对字符串进行遍历来判断一个字符串是不是UTF-8编码了。
举例代码:
java.io.File f=new java.io.File("待判定的文本文件名");
try{
java.io.InputStream ios=new java.io.FileInputStream(f);
byte[] b=new byte[3];
ios.read(b);
ios.close();
if(b[0]==-17&&b[1]==-69&&b[2]==-65)
System.out.println(f.getName()+"编码为UTF-8");
else System.out.println(f.getName()+"可能是GBK");
}catch(Exception e){
e.printStackTrace();
}
⑹ java 如何判断字符串编码格式
给你搜索了下,这个比较全的编码转换类:2java.net/doc/1004/code2014190.html
⑺ java怎么获取文件编码格式
没错,就这样做,文件格式和文件内容,不是这样的。
普通文件,开始就是文件内容了。
有编码的,开头先是编码的定义,正如判断语句所写的那样
⑻ JAVA 编码 这是什么编码
编码就是对已有的数据进行安全重编译,比如说对于一个String字符串应用MD5加密 就会出现这种情况,比如字符串123456应用MD5加密编码就会变成gdyb21LQTcIANtvYMT7QVQ== 还有时候是为了程序前端和后端保持一致的对字符串的处理方式,因为同一个字符串,一旦前、后端处理编码不一致就会出现乱码,就会把汉子变成乱码输出。像你想把手机号编码成这种乱码 ,最好就是应用MD5加密
⑼ java如何判断txt文件是ansi编码
下载一个记事本增强软件notepad2
用它来打开文本,在“文件”菜单中有子级菜单“编码”,可以非常方便地查看到文本编码类型,支持的编码类型有:
ANSI
Unicode
Unicode Big Endian
UTF-8