天天看點

一個漢字占多少位元組?

原文:

一個漢字占多少位元組?

GBK編碼,一個漢字占兩個位元組。

UTF-16編碼,通常漢字占兩個位元組,CJKV擴充B區、擴充C區、擴充D區中的漢字占四個位元組(一般字元的Unicode範圍是U+0000至U+FFFF,而這些擴充部分的範圍大于U+20000,因而要用兩個UTF-16)。

UTF-8編碼是變長編碼,通常漢字占三個位元組,擴充B區以後的漢字占四個位元組。

作者:stevenliuyi

連結:https://www.zhihu.com/question/20451870/answer/15168034

來源:知乎

著作權歸作者所有。商業轉載請聯系作者獲得授權,非商業轉載請注明出處。