Poco的幫助文檔:http://pocoproject.org/docs/index.html
在Poco中存在ASCII,Latin1,Latin9,Windows1252,UTF16,UTF8編碼。
1.不同字元集之間的轉換,實際上是不同字元原集的不同表示之間的轉換。如果兩個表示方法的原集相同,轉換起來自然友善一些。Poco中提供了UnicodeConverter類用于UTF8和UTF16之間的轉換。
Poco::UnicodeConverter::toUTF8(ws,uft8); // 把Unicode轉成utf8
Poco::UnicodeConverter::toUTF16(uft8,ws); //把uft8圍成Unicode
2. 如果兩個表示方法的原集不同,則要考慮轉換方向問題。比如說中文字元在ASCII碼中不存在,那麼毫無疑問,把中文字元轉換成ASCII碼自然無意義,這個方向的轉換注定要失敗。在Poco中,上述字元集之間的轉換是用類TextConverter來實作的。
下面是例子:
#include "stdafx.h"
#include "Poco/TextConverter.h"
#include "Poco/Latin1Encoding.h"
#include "Poco/UTF8Encoding.h"
#include "Poco/UTF16Encoding.h"
#include "Poco/UTF8String.h"
#include "Poco/TextIterator.h"
#include "Poco/UTF8Encoding.h"
#include "Poco/StreamConverter.h"
#include <iostream>
#include <assert.h>
using Poco::TextConverter;
using Poco::Latin1Encoding;
using Poco::UTF8Encoding;
using Poco::UTF16Encoding;
using Poco::UTF8;
using Poco::TextIterator;
using Poco::UTF8Encoding;
using Poco::OutputStreamConverter;
void TestConvert()
{
std::string latin1String("This is Latin-1 encoded text.");
std::string utf8String;
Latin1Encoding latin1;
UTF8Encoding utf8;
TextConverter converter(latin1, utf8);
converter.convert(latin1String, utf8String);
std::cout << utf8String << std::endl;
std::string latin1StringZ("中國.");
std::string utf8StringZ;
UTF16Encoding utf16;
UTF8Encoding utf8Z;
TextConverter converterZ(utf16, utf8Z);
converterZ.convert(latin1StringZ, utf8StringZ);
std::cout << utf8StringZ << std::endl;
}
void TestStream()
{
std::string latin1String("This is Latin-1 encoded text.");
Latin1Encoding latin1;
UTF8Encoding utf8;
OutputStreamConverter converter(std::cout, latin1, utf8);
converter << latin1String << std::endl; // console output will be UTF-8
}
void TestUTF8()
{
std::string s3("\303\274\303\266\303\244"); // "u"o"a
UTF8::toUpperInPlace(s3);
assert (s3 == "\303\234\303\226\303\204"); // "U"O"A
UTF8::toLowerInPlace(s3); assert (s3 == "\303\274\303\266\303\244"); // "u"o"a
}
void TestIterator()
{
std::string utf8String("This is UTF-8 encoded text.");
UTF8Encoding utf8;
TextIterator it(utf8String, utf8);
TextIterator end(utf8String);
int unicode;
for (; it != end; ++it)
{
unicode = *it;
}
}
int _tmain(int argc, _TCHAR* argv[])
{
TestLatinToUtf8();
TestStream();
TestUTF8();
TestIterator();
return 0;
}