天天看點

取得漢語拼音首個字母

byte數組轉float 以及byte轉其他類型時為什麼要&0xff

public static float getFloat(byte[] b) {  

      int accum = 0;  

       accum = accum|(b[0] & 0xff) << 0; 

       accum = accum|(b[1] & 0xff) << 8;  

       accum = accum|(b[2] & 0xff) << 16;  

      accum = accum|(b[3] & 0xff) << 24;  

       System.out.println(accum); 

       return Float.intBitsToFloat(accum);  

java中byte轉換int時為何與0xff進行與運算

在剖析該問題前請看如下代碼

 public static String bytes2HexString(byte[] b) {

   String ret = "";

   for (int i = 0; i < b.length; i++) {

     String hex = Integer.toHexString(b[i] & 0xFF);

     if (hex.length() == 1) {

       hex = ''0'' + hex;

     }

       ret += hex.toUpperCase();

    }

      return ret;

  }

上面是将byte[]轉化十六進制的字元串,注意這裡b[i] & 0xFF将一個byte和 0xFF進行了與運算,然後使用Integer.toHexString取得了十六進制字元串,可以看出

b[i] & 0xFF運算後得出的仍然是個int,那麼為何要和 0xFF進行與運算呢?直接 Integer.toHexString(b[i]);,将byte強轉為int不行嗎?答案是不行的.

其原因在于:

1.byte的大小為8bits而int的大小為32bits

 2.java的二進制采用的是補碼形式

在這裡先溫習下計算機基礎理論

byte是一個位元組儲存的,有8個位,即8個0、1。

8位的第一個位是符号位,

也就是說0000 0001代表的是數字1

 1000 0001代表的就是-1

是以正數最大位0111 1111,也就是數字127

負數最大為1111 1111,也就是數字-128

上面說的是二進制原碼,但是在java中采用的是補碼的形式,下面介紹下什麼是補碼

1、反碼:

        一個數如果是正,則它的反碼與原碼相同;

        一個數如果是負,則符号位為1,其餘各位是對原碼取反;

2、補碼:利用溢出,我們可以将減法變成加法

       對于十進制數,從9得到5可用減法:

       9-4=5    因為4+6=10,我們可以将6作為4的補數

       改寫為加法:

       9+6=15(去掉高位1,也就是減10)得到5.

       對于十六進制數,從c到5可用減法:

       c-7=5    因為7+9=16 将9作為7的補數

       改寫為加法:

       c+9=15(去掉高位1,也就是減16)得到5.

    在計算機中,如果我們用1個位元組表示一個數,一個位元組有8位,超過8位就進1,在記憶體中情況為(1 0000 0000),進位1被丢棄。

    ⑴一個數為正,則它的原碼、反碼、補碼相同

    ⑵一個數為負,剛符号位為1,其餘各位是對原碼取反,然後整個數加1

  - 1的原碼為                1000 0001 

  - 1的反碼為                1111 1110 

                                                    + 1

  - 1的補碼為                1111 1111 

  0的原碼為                 0000 0000

  0的反碼為                 1111 1111(正零和負零的反碼相同)

                                          +1

  0的補碼為               10000 0000(舍掉打頭的1,正零和負零的補碼相同)

Integer.toHexString的參數是int,如果不進行&0xff,那麼當一個byte會轉換成int時,由于int是32位,而byte隻有8位這時會進行補位。

例如補碼1111 1111的十進制數為-1轉換為int時變為11111111111111111111111111111111好多1啊,呵呵!即0xffffffff但是這個數是不對的,這種補位就會造成誤差。和0xff相與後,高24比特就會被清0了,結果就對了。

了解這個基礎後回歸正題:

public static String getPinYinHead(char c) {
        String s = String.valueOf(c);

        byte[] b;
        try {
            b = s.getBytes("GBK");
        } catch (UnsupportedEncodingException e) {
            b = s.getBytes();
        }

        if (b.length >= 2) {
            int b1 = b[0] & 0xff;
            int b2 = b[1] & 0xff;

            int value = b1 << 8 | b2;
            if (value >= 0xb0a1 && value <= 0xb0c4) {
                return "A";
            } else if (value >= 0xb0c5 && value <= 0xb2c0) {
                return "B";
            } else if (value >= 0xb2c1 && value <= 0xb4ed) {
                return "C";
            } else if (value >= 0xb4ee && value <= 0xb6e9) {
                return "D";
            } else if (value >= 0xb6ea && value <= 0xb7a1) {
                return "E";
            } else if (value >= 0xb7a2 && value <= 0xb8c0) {
                return "F";
            } else if (value >= 0xb8c1 && value <= 0xb9fd) {
                return "G";
            } else if (value >= 0xb9fe && value <= 0xbbf6) {
                return "H";
            } else if (value >= 0xbbf7 && value <= 0xbfa5) {
                return "J";
            } else if (value >= 0xbfa6 && value <= 0xc0ab) {
                return "K";
            } else if (value >= 0xc0ac && value <= 0xc2e7) {
                return "L";
            } else if (value >= 0xc2e8 && value <= 0xc4c2) {
                return "M";
            } else if (value >= 0xc4c3 && value <= 0xc5b5) {
                return "N";
            } else if (value >= 0xc5b6 && value <= 0xc5bd) {
                return "O";
            } else if (value >= 0xc5be && value <= 0xc6d9) {
                return "P";
            } else if (value >= 0xc6da && value <= 0xc8ba) {
                return "Q";
            } else if (value >= 0xc8bb && value <= 0xc8f5) {
                return "R";
            } else if (value >= 0xc8f6 && value <= 0xcbf9) {
                return "S";
            } else if (value >= 0xcbfa && value <= 0xcdd9) {
                return "T";
            } else if (value >= 0xcdda && value <= 0xcef3) {
                return "W";
            } else if (value >= 0xcef4 && value <= 0xd188) {
                return "X";
            } else if (value >= 0xd1b9 && value <= 0xd4d0) {
                return "Y";
            } else if (value >= 0xd4d1 && value <= 0xd7f9) {
                return "Z";
            }
        }

        return s;
    }      

下面隻是編碼表一部分: