天天看點

C++中String類

之是以抛棄char*的字元串而選用C++标準程式庫中的string類,是因為他和前者比較起來,不必 擔心記憶體是否足夠、字元串長度等等,而且作為一個類出現,他內建的操作函數足以完成我們大多數情況下(甚至是100%)的需要。我們可以用 = 進行指派操作,== 進行比較,+ 做串聯(是不是很簡單?)。我們盡可以把它看成是C++的基本資料類型。

首先,為了在我們的程式中使用string類型,我們必須包含頭檔案 <string>。如下:

#include <string> //注意這裡不是string.h string.h是C字元串頭檔案

1.聲明一個C++字元串

聲明一個字元串變量很簡單:

string Str;

這樣我們就聲明了一個字元串變量,但既然是一個類,就有構造函數和析構函數。上面的聲明沒有傳入參數,是以就直接使用了string的預設的構造函數,這個函數所作的就是把Str初始化為一個空字元串。String類的構造函數和析構函數如下:

a) string s; //生成一個空字元串s

b) string s(str) //拷貝構造函數 生成str的複制品

c) string s(str,stridx) //将字元串str内"始于位置stridx"的部分當作字元串的初值

d) string s(str,stridx,strlen) //将字元串str内"始于stridx且長度頂多strlen"的部分作為字元串的初值

e) string s(cstr) //将C字元串作為s的初值

f) string s(chars,chars_len) //将C字元串前chars_len個字元作為字元串s的初值。

g) string s(num,c) //生成一個字元串,包含num個c字元

h) string s(beg,end) //以區間beg;end(不包含end)内的字元作為字元串s的初值

i) s.~string() //銷毀所有字元,釋放記憶體

2.字元串操作函數

a) =,assign()  //賦以新值

b) swap()   //交換兩個字元串的内容

c) +=,append(),push_back() //在尾部添加字元

d) insert()   //插入字元

e) erase()   //删除字元

f) clear()   //删除全部字元

g) replace()   //替換字元

h) + //串聯字元串

i) ==,!=,<,<=,>,>=,compare() //比較字元串

j) size(),length()  //傳回字元數量

k) max_size()  //傳回字元的可能最大個數

l) empty()   //判斷字元串是否為空

m) capacity()  //傳回重新配置設定之前的字元容量

n) reserve()   //保留一定量記憶體以容納一定數量的字元

o) [ ], at()   //存取單一字元

p) >>,getline()  //從stream讀取某值

q) <<    //将某值寫入stream

r) copy()   //将某值指派為一個C_string

s) c_str()   //将内容以C_string傳回

t) data()   //将内容以字元數組形式傳回

u) substr()   //傳回某個子字元串

v)查找函數

w) begin() end()  //提供類似STL的疊代器支援

x) rbegin() rend()  //逆向疊代器

y) get_allocator()  //傳回配置器

下面詳細介紹:

2.1 C++字元串和C字元串的轉換

C ++提供的由C++字元串得到對應的C_string的方法是使用data()、c_str()和copy(),其中,data()以字元數組的形式傳回字元串内容,但并不添加’\0’。c_str()傳回一個以‘\0’結尾的字元數組,而copy()則把字元串的内容複制或寫入既有c_string或字元數組内。C++字元串并不以’\0’結尾。

2.2 大小和容量函數

一個C++字元串存在三種大小:a)現有的字元數,函數是size()和length(),他們等效。Empty()用來檢查字元串是否為空。b)max_size() 這個大小是指目前C++字元串最多能包含的字元數,很可能和機器本身的限制或者字元串所在位置連續記憶體的大小有關系。我們一般情況下不用關心他,應該大小足夠我們用的。但是不夠用的話,會抛出length_error異常 c)capacity()重新配置設定記憶體之前 string所能包含的最大字元數。這裡另一個需要指出的是reserve()函數,這個函數為string重新配置設定記憶體。重新配置設定的大小由其參數決定,預設參數為0,這時候會對string進行非強制性縮減。

還有必要再重複一下C++字元串和C字元串轉換的問 題,許多人會遇到這樣的問題,自己做的程式要調用别人的函數、類什麼的(比如資料庫連接配接函數Connect(char*,char*)),但别人的函數參數用的是char*形式的,而我們知道,c_str()、data()傳回的字元數組由該字元串擁有,是以是一種const char*,要想作為上面提及的函數的參數,還必須拷貝到一個char*,而我們的原則是能不使用C字元串就不使用。那麼,這時候我們的處理方式是:如果此函數對參數(也就是char*)的内容不修改的話,我們可以這樣Connect((char*)UserID.c_str(),(char*)PassWD.c_str()),但是這時候是存在危險的,因為這樣轉換後的字元串其實是可以修改的(有興趣地可以自己試一試),是以我強調除非函數調用的時候不對參數進行修改,否則必須拷貝到一個char*上去。當然,更穩妥的辦法是無論什麼情況都拷貝到一個char*上去。

2.3元素存取

我們可以使用下标操作符[]和函數at()對元素包含的字元進行通路。但是應該注意的是操作符[]并不檢查索引是否有效(有效索引0~str.length()),如果索引失效,會引起未定義的行為。而at()會檢查,如果使用at()的時候索引無效,會抛出out_of_range異常。 有一個例外不得不說,const string a;的操作符[]對索引值是a.length()仍然有效,其傳回值是’\0’。其他的各種情況,a.length()索引都是無效的。舉例如下:

const string Cstr("const string");

string Str("string");

Str[3];    //ok

Str.at(3);    //ok

Str[100];    //未定義的行為

Str.at(100);    //throw out_of_range

Str[Str.length()]   //未定義行為

Cstr[Cstr.length()]   //傳回 ‘\0’

Str.at(Str.length()); //throw out_of_range

Cstr.at(Cstr.length())  ////throw out_of_range

我不贊成類似于下面的引用或指針指派:

char& r=s[2];

char* p= &s[3];

因為一旦發生重新配置設定,r,p立即失效。避免的方法就是不使用。

2.4比較函數

C ++字元串支援常見的比較操作符(>,>=,<,<=,==,!=),甚至支援string與C-string的比較(如str<"hello")。在使用>,>=,<,<=這些操作符的時候是根據"目前字元特性"将字元按字典順序進行逐一得比較。字典排序靠前的字元小,比較的順序是從前向後比較,遇到不相等的字元就按這個位置上的兩個字元的比較結果确定兩個字元串的大小。同時,string ("aaaa") <string(aaaaa)。

另一個功能強大的比較函數是成員函數compare()。他支援多參數處理,支援用索引值和長度定位子串來進行比較。他傳回一個整數來表示比較結果,傳回值意義如下:0-相等 >0-大于 <0-小于。舉例如下:

string s("abcd");

s.compare("abcd");   //傳回0

s.compare("dcba");   //傳回一個小于0的值

s.compare("ab");   //傳回大于0的值

s.compare(s);   //相等

s.compare(0,2,s,2,2);  //用"ab"和"cd"進行比較 小于零

s.compare(1,2,"bcx",2);  //用"bc"和"bc"比較。

2.5 更改内容

首先講指派,第一個指派方法當然是使用操作符=,新值可以是string(如:s=ns)c_string(如:s="gaint")甚至單一字元(如:s=’j’)。還可以使用成員函數assign(),這個成員函數可以使你更靈活的對字元串指派。還是舉例說明吧:

s.assign(str);    //不說

s.assign(str,1,3);   //如果str是"iamangel" 就是把"ama"賦給字元串

s.assign(str,2,string::npos); //把字元串str從索引值2開始到結尾賦給s

s.assign("gaint");    //不說

s.assign("nico",5);   //把’n’ ‘I’ ‘c’ ‘o’ ‘\0’賦給字元串

s.assign(5,’x’);   //把五個x賦給字元串

把字元串清空的方法有三個:s="";s.clear();s.erase();

string提供了很多函數用于插入(insert)、删除(erase)、替換(replace)、增加字元。

先說增加字元(這裡說的增加是在尾巴上),函數有 +=、append()、push_back()。舉例如下:

s+=str;    //加個字元串

s+="my name is jiayp";  //加個C字元串

s+=’a’;    //加個字元

s.append(str);

s.append(str,1,3);   //不解釋了 同前面的函數參數assign的解釋

s.append(str,2,string::npos); //不解釋了

s.append("my name is jiayp");

s.append("nico",5);

s.append(5,’x’);

s.push_back(‘a’);   //這個函數隻能增加單個字元 對STL熟悉的了解起來很簡單

也許你需要在string中間的某個位置插入字元串,這時候你可以用insert()函數,這個函數需要你指定一個安插位置的索引,被插入的字元串将放在這個索引的後面。

s.insert(0,"my name");

s.insert(1,str);

這 種形式的insert()函數不支援傳入單個字元,這時的單個字元必須寫成字元串形式(讓人惡心)。既然你覺得惡心,那就不得不繼續讀下面一段話:為了插 入單個字元,insert()函數提供了兩個對插入單個字元操作的重載函數:insert(size_type index,size_type num,chart c)和insert(iterator pos,size_type num,chart c)。其中size_type是無符号整數,iterator是char*,是以,你這麼調用insert函數是不行的:insert(0,1,’j’);這時候第一個參數将轉換成哪一個呢?是以你必須這麼寫:insert((string::size_type)0,1,’j’)!第二種形式指出了使用疊代器安插字元的形式,在後面會提及。順便提一下,string有很多操作是使用STL的疊代器的,他也盡量做得和STL靠近。删除函數erase()的形式也有好幾種(真煩!),替換replace()也有好幾個。舉例吧:

string s="il8n";

s.replace(1,2,"nternationalizatio"); //從索引1開始的2個替換成後面的C_string

s.erase(13);     //從索引13開始往後全删除

s.erase(7,5);     //從索引7開始往後删5個

2.6提取子串和字元串連接配接

提取子串的函數是:substr(),形式如下:

s.substr();     //傳回s的全部内容

s.substr(11);     //從索引11往後的子串

s.substr(5,6);    //從索引5開始6個字元

把兩個字元串結合起來的函數是+。