『壹』 java幾種常見的編碼格式
學過計算機的人都知道 ASCII 碼,總共有 128 個,用一個位元組的低 7 位表示,0~31 是控制字元如換行回車刪除等;32~126 是列印字元,可以通過鍵盤輸入並且能夠顯示出來。
128 個字元顯然是不夠用的,於是 ISO 組織在 ASCII 碼基礎上又制定了一些列標准用來擴展 ASCII 編碼,它們是 ISO-8859-1~ISO-8859-15,其中 ISO-8859-1 涵蓋了大多數西歐語言字元,所有應用的最廣泛。ISO-8859-1 仍然是單位元組編碼,它總共能表示 256 個字元。
它的全稱是《信息交換用漢字編碼字元集 基本集》,它是雙位元組編碼,總的編碼范圍是 A1-F7,其中從 A1-A9 是符號區,總共包含 682 個符號,從 B0-F7 是漢字區,包含 6763 個漢字。
全稱叫《漢字內碼擴展規范》,是國家技術監督局為 windows95 所制定的新的漢字內碼規范,它的出現是為了擴展 GB2312,加入更多的漢字,它的編碼范圍是 8140~FEFE(去掉 XX7F)總共有 23940 個碼位,它能表示 21003 個漢字,它的編碼是和 GB2312 兼容的,也就是說用 GB2312 編碼的漢字可以用 GBK 來解碼,並且不會有亂碼。
全稱是《信息交換用漢字編碼字元集》,是我國的強制標准,它可能是單位元組、雙位元組或者四位元組編碼,它的編碼與 GB2312 編碼兼容,這個雖然是國家標准,但是實際應用系統中使用的並不廣泛。
UTF-16 統一採用兩個位元組表示一個字元,雖然在表示上非常簡單方便,但是也有其缺點,有很大一部分字元用一個位元組就可以表示的現在要兩個位元組表示,存儲空間放大了一倍,在現在的網路帶寬還非常有限的今天,這樣會增大網路傳輸的流量,而且也沒必要。而 UTF-8 採用了一種變長技術,每個編碼區域有不同的字碼長度。不同類型的字元可以是由 1~6 個位元組組成。
UTF-8 有以下編碼規則:
UTF-16 具體定義了 Unicode 字元在計算機中存取方法。UTF-16 用兩個位元組來表示 Unicode 轉化格式,這個是定長的表示方法,不論什麼字元都可以用兩個位元組表示,兩個位元組是 16 個 bit,所以叫 UTF-16。UTF-16 表示字元非常方便,每兩個位元組表示一個字元,這個在字元串操作時就大大簡化了操作,這也是 Java 以 UTF-16 作為內存的字元存儲格式的一個很重要的原因。
ISO 試圖想創建一個全新的超語言字典,世界上所有的語言都可以通過這本字典來相互翻譯。可想而知這個字典是多麼的復雜,關於 Unicode 的詳細規范可以參考相應文檔。Unicode 是 Java 和 XML 的基礎,下面詳細介紹 Unicode 在計算機中的存儲形式。
UTF-16
UTF-8
如果一個位元組,最高位(第 8 位)為 0,表示這是一個 ASCII 字元(00 - 7F)。可見,所有 ASCII 編碼已經是 UTF-8 了。
如果一個位元組,以 11 開頭,連續的 1 的個數暗示這個字元的位元組數,例如:110xxxxx 代表它是雙位元組 UTF-8 字元的首位元組。
如果一個位元組,以 10 開始,表示它不是首位元組,需要向前查找才能得到當前字元的首位元組
詳情傳送門至:網頁鏈接
『貳』 在Java中如何將字元轉換成ASCII碼
java中如何將一個字元轉換為ascii碼:x0dx0a方法1:x0dx0achar c = 'a '; x0dx0a byte b =(byte)c;x0dx0ax0dx0a 方法2:x0dx0a 直接將這個字元轉化為int型就可以得到ascii碼值x0dx0a char c = 'a '; x0dx0a int b = c; //字元的ascii碼值 x0dx0ax0dx0a同理將一個ascii碼轉換為相應的字元:x0dx0a 例如:字元ax0dx0a int d = 97; x0dx0achar e = (char)d;
『叄』 java輸入一個字元,如果是字母,則輸出相應的ASCII值,如果是數字字元,則轉換成相應的數值輸出
代碼如下:
System.out.print("輸入一個字元:");
Stringstr=input.next();
booleanisNumber=str.matches("^[-+]?(([0-9]+)([.]([0-9]+))?|([.]([0-9]+))?)$");
if(isNumber){
System.out.println("輸入的數字是:"+str);
}else{
System.out.println("輸入的ASCII碼是:"+(int)str.charAt(0));
}
運行結果是:
『肆』 在java中,\是什麼意思
:橫向製表(HT)(跳到下一個TAB位置)。
是補全當前字元串長度到8的整數倍,最少1個最多8個空格,補多少要看你 前字元串長度。
比如當前字元串長度10,那麼 後長度是16,也就是補6個空格。
如果當前字元串長度12,此時 後長度是16,補4個空格。
常用轉義字元表
『伍』 Java 獲得輸入字母的ASC碼
//輸入字元串轉換成數字的asc碼
char a = 'B';
char x = 'B';
int ina = (int)x;
System.out.println(a);
就是輸入一個自己 然後輸出它的ASC碼比如
public class Hw1 {
public static void main(String[] args) {
inta='國';
System.out.println(a);
這樣可以順利輸出ASC碼值
用Scanner輸入一個字元後變成ASC碼值
import java.uitl.Scanner;
public class Hw1 {
public static void main(String[] args) {
String s=(new Scanner(System.in)).next();
System.out.println((int)(s.charAt(0)));
}
}