天天看點

Poco庫下的編碼轉換

Poco的幫助文檔:http://pocoproject.org/docs/index.html

在Poco中存在ASCII,Latin1,Latin9,Windows1252,UTF16,UTF8編碼。

1.不同字元集之間的轉換,實際上是不同字元原集的不同表示之間的轉換。如果兩個表示方法的原集相同,轉換起來自然友善一些。Poco中提供了UnicodeConverter類用于UTF8和UTF16之間的轉換。

Poco::UnicodeConverter::toUTF8(ws,uft8);  // 把Unicode轉成utf8

 Poco::UnicodeConverter::toUTF16(uft8,ws); //把uft8圍成Unicode

2. 如果兩個表示方法的原集不同,則要考慮轉換方向問題。比如說中文字元在ASCII碼中不存在,那麼毫無疑問,把中文字元轉換成ASCII碼自然無意義,這個方向的轉換注定要失敗。在Poco中,上述字元集之間的轉換是用類TextConverter來實作的。

下面是例子:

#include "stdafx.h"
#include "Poco/TextConverter.h" 
#include "Poco/Latin1Encoding.h" 
#include "Poco/UTF8Encoding.h" 
#include "Poco/UTF16Encoding.h" 
#include "Poco/UTF8String.h" 
#include "Poco/TextIterator.h" 
#include "Poco/UTF8Encoding.h" 

#include "Poco/StreamConverter.h" 

#include <iostream> 
#include <assert.h>  

using Poco::TextConverter; 
using Poco::Latin1Encoding; 
using Poco::UTF8Encoding; 
using Poco::UTF16Encoding; 
using Poco::UTF8; 
using Poco::TextIterator; 
using Poco::UTF8Encoding;  
using Poco::OutputStreamConverter; 

void TestConvert() 
{ 
	std::string latin1String("This is Latin-1 encoded text."); 
	std::string utf8String; 
	Latin1Encoding latin1; 
	UTF8Encoding utf8; 
	TextConverter converter(latin1, utf8); 
	converter.convert(latin1String, utf8String); 
	std::cout << utf8String << std::endl;  

	std::string latin1StringZ("中國."); 
	std::string utf8StringZ; 
	UTF16Encoding utf16; 
	UTF8Encoding utf8Z; 
	TextConverter converterZ(utf16, utf8Z); 
	converterZ.convert(latin1StringZ, utf8StringZ); 
	std::cout << utf8StringZ << std::endl;

 } 
void TestStream() 
{ 
	std::string latin1String("This is Latin-1 encoded text."); 
	Latin1Encoding latin1; 
	UTF8Encoding utf8; 
	OutputStreamConverter converter(std::cout, latin1, utf8); 
	converter << latin1String << std::endl; // console output will be UTF-8
}  
void TestUTF8()
{ 
	std::string s3("\303\274\303\266\303\244"); // "u"o"a 
	UTF8::toUpperInPlace(s3);	 
	assert (s3 == "\303\234\303\226\303\204"); // "U"O"A 
	UTF8::toLowerInPlace(s3); assert (s3 == "\303\274\303\266\303\244"); // "u"o"a
}  
void TestIterator() 
{
	std::string utf8String("This is UTF-8 encoded text."); 
	UTF8Encoding utf8; 
	TextIterator it(utf8String, utf8); 
	TextIterator end(utf8String); 
	int unicode; 
	for (; it != end; ++it) 
	{
		unicode = *it; 
	} 
}  
int _tmain(int argc, _TCHAR* argv[]) 
{ 
	TestLatinToUtf8(); 
	TestStream();
	TestUTF8();
	TestIterator(); 
	return 0;
}
           

繼續閱讀