汉字以两个字节存储,称为“区位码”,高位叫区码,低位叫位码,有这俩字节组成汉字。假设有一张汉字表,横竖都是 94列,那么区码就相当于行,位码就相当于列,根据行列就可以确定一个汉字了,这有点像二位数组==,gb2312大致就是按照这种方式实现的,区码1~9即前9行放的是特殊字符,16~55区放的是一级汉字,56~87区放的是二级汉字,其余的暂时空余。为了区别中文与西文字母,在中文字符首位以1开头区分以0开头的ascii码,gb2312给每个中文字符加上0xa0,因此,区码从0xb0-0xf7 都是汉字,位码范围0xa0-0xfe 。