天天看点

中文首字母 排序

因项目需要对通讯录中的联系人进行排序,需要对中文字符进行拼音转换。其实这个转换并没有想象中的那么难(因为我们只是把中文转为拼音首字母而已,比如“王”转换为字母w就可以了,而不需要转换为完整的拼音wang)。对此,我们找到了一个简便的解决办法:一个老外(代码中签名的作者叫george)用c语言写了一个pinyinfirstletter函数用于获取中文拼音首字母。

这个函数主要基于一个巨大的c语言char数组,把unicode字符集中所有中文的拼音首字母都映射进去了。

pinyinfirstletter基于这么一个简单的原理:我们知道,在objective c语言中,字符串是以unicode进行编码的。在unicode字符集中,汉字的编码范围为4e00 到 9fa5 之间(即从第19968开始的20902个字符是中文简体字符)。我们把这些字符的拼音首字母按照顺序都存放在一个char数组中。当我们查找一个汉字的拼音首字母时,只需把这个汉字的unicode码(即char强制转换为int)减去19968,然后用这个数字作为索引去找char数组中存放的字母即可。

就这样,有这个char数组为基础,一切都变得非常简单:

char pinyinfirstletter(unsignedshort hanzi)

{

int index = hanzi - hanzi_start;

if (index >= 0&& index <= hanzi_count)

returnfirstletterarray[index];

}

else

return hanzi;

至于排序,我们可以把要排序的中文(为简便起见,我们假设这些要排序的中文都只有一个字)放到nsarray中,然后利用nsarray的sortedarrayusingcomparator:方法进行排序即可。sortedarrayusingcomparator:方法是nsarray内部元素的比较方法。你只需要为这个方法提供一个块作为参数即可。然后在这个块中,对两个元素的大小进行比较,并返回一个nscomparisonresult(nscomparisonresult枚举用于表示比较的结果:等于、小于、大于):

nsarray *sortedarray=[marray sortedarrayusingcomparator:^(id a, id b)

            char c1=pinyinfirstletter([(nsstring*)a characteratindex:0]);

            char c2=pinyinfirstletter([(nsstring*)b characteratindex:0]);

            nsstring* s1=[[nsstringstringwithformat:@"%c",c1] uppercasestring];

            nsstring* s2=[[nsstringstringwithformat:@"%c",c2] uppercasestring];

            return [s1 compare:s2];

        }];

继续阅读