天天看點

Python資料結構——内建資料結構

一、清單(List)

list 是一個可以在其中存儲一系列項目的資料結構。list 的項目之間需用逗号分開,并用一對中括号括将所有的項目括起來,以表明這是一個 list 。下例用以展示 list 的一些基本操作:

# 定義一個 list 對象 class_list:
class_list = ['Michael', 'Bob', 'Tracy']
# 獲得一個 class_list 的長度
print 'class have', len(class_list), 'students'
# 通路class_list中的對象
print 'The 3rd student in class is', class_list[2]
# 往 class_list 中插入對象
class_list.append('Paul')
# 從 class_list 中删除一個項目
del class_list[0]
# 對 class_list 進行排序
class_list.sort()
# 周遊整個class_list中的項目
print 'These students are :',
for student in class_list:
    print student,
           

輸出結果為:

class have 3 students
The 3rd student in class is Tracy
These students are : Bob Paul Tracy
           

關于上面的代碼有幾點要注意的是:

  • 可以往 class_list 中加入任何類型的對象,也就是說,并不要求一個 list 中的項目具有相同類型。你甚至可以往 class_list 中插入一個list。
  • 排序函數作用于本身, 而不是傳回一個副本,這與字元串類型是不同的,因為字元串不可修改。
  • print 函數的end關鍵字參數用來指定輸入完成之後的輸出,預設是換行符,上面的代碼用空格符替代換行符。

二、元組(Tuple)

tuple 在用法與概念上與 list 沒有多大差别,可以将 tuple 看做是一個隻讀版list。也就是說tuple一經定義便不能被修改——不能添加和删除對象,也不能修改tuple中的對象。

tuple中的項同樣應該用逗号分開,并用圓括号将這些項目括起來以表是是一個tuple。這個圓括号是可選的,也就是說可以用以下兩種方式定義一個tuple:

t = 'Adam', 'Lisa', 'Bart'
t = ('Adam', 'Lisa', 'Bart')
           

不過省掉那對圓括号不見得是什麼好的習慣。另外當tuple隻有一個項時,第一項之後必須有一個逗号,該情況下應該這樣定義t = ('Adam',)。這似乎是一個古怪的限制,但是假如沒有這個逗号,不帶括号定義的tuple就變成了t = 'Adam'這明顯具有二義性。

三、字典(Dictionary)

字典可以看做是一組鍵-值(key-value)對的集合。鍵必須是唯一的,而每一個鍵關聯着一個值。key必須是一個不可變的對象(如:tuple、數值型、字元串)。還要注意的是,在字典中的鍵值對并沒有以任何方式進行排序。

一個字典的定義應該照這樣的格式d={key1 : value1, key2 : value2, key3 : value3}。鍵和值之間用冒号分隔,而鍵值對之間用逗号相隔,再用大括号将所有的鍵值對括起來。一些基本操作如下:

# 字典的定義
d = {
    'Adam': 95,
    'Lisa': 85,
    'Bart': 59
}
# 通過鍵來擷取值
print "Adam's score is", d['Adam']
# 删除一個鍵值對
del d['Bart']
# 周遊字典
for name, score in d.items():
    print '{0} is {1}'.format(name, score)
# 往字典中增加一個鍵值對
d['Paul'] = 72
# 判斷字典中是否存在某鍵,也可以用 if ab.has_key('Lisa')
if 'Lisa' in d:
    print "Lisa's address is", d['Lisa']
           

輸出的結果為:

Adam's score is 95
Lisa is 85
Adam is 95
Lisa's address is 85
           

四、序列(Sequences)

上面介紹的三種内建資料結構都是序列,索引操作是序列的一個基本操作。通過下标操作可以直接通路序列中的對象。上面雖然已經示範了下标操作——隊列和元組用數字下标,字典用關鍵字下标。

序列的下标是從0開始的,上面的例子中隻使用了下标為正數的情況,其實下标還可以為負數,如-1,-2,-3…。負數下标表示的意義為反方向的位置,如class_list[-1]傳回的是class_list的倒數第一個項目。

序列不但支援負數下标還支援雙下标,這對雙下标表示一個區間。如class_list[0:3]傳回的是一個class_list中從下标為1到下标為3之前的子序列副本。注意這個區間是一對半閉半開的區間。這種操作被稱作切片操作(slicing operation)。如果切片操作的第二個下标超出了序列的範圍,那麼切片操作會到序列的末尾終止。切片操作中的兩個下标都有預設值,第一個的預設值為0,第二個的大小為序列的長度。

還可以給切片操作提供第三個參數,第三個參數代表切片操作的步長,它的預設值是1。步長代表了項與項之間的間距,比方name[0:10:3],傳回的就是name中下标為0,3,6,9組成的子序列。

五、集合(Set)

集合是無序簡單對象的聚集。當你隻關注一個對象是否存在于聚集中,而不管它存在的順序或在出現的次數時,則适宜用集合。基本功能:判斷是否是集合的成員、一個集合是不是另一個集合的子集、擷取兩個集合的交集等等。執行個體:

s = set(['Adam', 'Lisa', 'Bart', 'Paul'])
# 判斷對象是否在集合中
if 'Bart' in s:
    print "Bart is in ?", 'Bart' in s
# 使用copy函數來拷貝一個set
sc = s.copy()
# 往集合中添加對象
sc.add('Bill')
# 從集合中删除對象
sc.remove('Adam')
# 求兩個集合的交集,也可以使用 s.intersection(sc)
print s & sc
           

輸出的結果:

Bart is in ? True
set(['Lisa', 'Paul', 'Bart'])