Python3 資料結構

本章節我們主要結合前面所學的知識點來介紹Python資料結構。


串列

Python中串列是可變的,這是它區別於字串和元組的最重要的特點,一句話概括即:串列可以修改,而字串和元組不能。

以下是 Python 中串列的方法:

方法 描述
list.append(x) 把一個元素新增到串列的結尾,相當於 a[len(a):] = [x]。
list.extend(L) 透過新增指定串列的所有元素來擴充串列,相當於 a[len(a):] = L。
list.insert(i, x) 在指定位置寫入一個元素。第一個引數是準備寫入到其前面的那個元素的索引,例如 a.insert(0, x) 會寫入到整個串列之前,而 a.insert(len(a), x) 相當於 a.append(x) 。
list.remove(x) 刪除串列中值為 x 的第一個元素。如果沒有這樣的元素,就會回傳一個錯誤。
list.pop([i]) 從串列的指定位置移除元素,並將其回傳。如果沒有指定索引,a.pop()回傳最後一個元素。元素隨即從串列中被移除。(方法中 i 兩邊的方括弧表示這個引數是可選的,而不是要求你輸入一對方括弧,你會經常在 Python 庫速查手冊中遇到這樣的標記。)
list.clear() 移除串列中的所有項,等於del a[:]。
list.index(x) 回傳串列中第一個值為 x 的元素的索引。如果沒有匹配的元素就會回傳一個錯誤。
list.count(x) 回傳 x 在串列中出現的次數。
list.sort() 對串列中的元素進行排序。
list.reverse() 倒排串列中的元素。
list.copy() 回傳串列的淺複製,等於a[:]。

下面示例演示了串列的大部分方法:

範例

>>> a = [66.25, 333, 333, 1, 1234.5]
>>> print(a.count(333), a.count(66.25), a.count('x'))
2 1 0
>>> a.insert(2, -1)
>>> a.append(333)
>>> a
[66.25, 333, -1, 333, 1, 1234.5, 333]
>>> a.index(333)
1
>>> a.remove(333)
>>> a
[66.25, -1, 333, 1, 1234.5, 333]
>>> a.reverse()
>>> a
[333, 1234.5, 1, 333, -1, 66.25]
>>> a.sort()
>>> a
[-1, 1, 66.25, 333, 333, 1234.5]

注意:類似 insert, remove 或 sort 等修改串列的方法沒有回傳值。


將串列當做堆疊使用

串列方法使得串列可以很方便的作為一個堆疊來使用,堆疊作為特定的資料結構,最先進入的元素最後一個被釋放(後進先出)。用 append() 方法可以把一個元素新增到堆疊頂。用不指定索引的 pop() 方法可以把一個元素從堆疊頂釋放出來。例如:

範例

>>> stack = [3, 4, 5]
>>> stack.append(6)
>>> stack.append(7)
>>> stack
[3, 4, 5, 6, 7]
>>> stack.pop()
7
>>> stack
[3, 4, 5, 6]
>>> stack.pop()
6
>>> stack.pop()
5
>>> stack
[3, 4]

將串列當作佇列使用

也可以把串列當做佇列用,只是在佇列里第一加入的元素,第一個取出來;但是拿串列用作這樣的目的效率不高。在串列的最後新增或者跳出元素速度快,然而在串列里寫入或者從頭部跳出速度卻不快(因為所有其他的元素都得一個一個地移動)。

範例

>>> from collections import deque
>>> queue = deque(["Eric", "John", "Michael"])
>>> queue.append("Terry")           # Terry arrives
>>> queue.append("Graham")          # Graham arrives
>>> queue.popleft()                 # The first to arrive now leaves
'Eric'
>>> queue.popleft()                 # The second to arrive now leaves
'John'
>>> queue                           # Remaining queue in order of arrival
deque(['Michael', 'Terry', 'Graham'])

串列推導式

串列推導式提供了從序列建立串列的簡單途徑。通常應用程式將一些操作應用於某個序列的每個元素,用其獲得的結果作為生成新串列的元素,或者根據確定的判定條件建立子序列。

每個串列推導式都在 for 之後跟一個運算式,然後有零到多個 for 或 if 子句。回傳結果是一個根據表達從其後的 for 和 if 上下文環境中生成出來的串列。如果希望運算式推匯出一個元組,就必須使用括弧。

這裡我們將串列中每個數值乘三,獲得一個新的串列:

>>> vec = [2, 4, 6]
>>> [3*x for x in vec]
[6, 12, 18]

現在我們玩一點小花樣:

>>> [[x, x**2] for x in vec]
[[2, 4], [4, 16], [6, 36]]

這裡我們對序列里每一個元素逐個呼叫某方法:

範例

>>> freshfruit = ['  banana', '  loganberry ', 'passion fruit  ']
>>> [weapon.strip() for weapon in freshfruit]
['banana', 'loganberry', 'passion fruit']

我們可以用 if 子句作為過濾器:

>>> [3*x for x in vec if x > 3]
[12, 18]
>>> [3*x for x in vec if x < 2]
[]

以下是一些關於迴圈和其它技巧的演示:

>>> vec1 = [2, 4, 6]
>>> vec2 = [4, 3, -9]
>>> [x*y for x in vec1 for y in vec2]
[8, 6, -18, 16, 12, -36, 24, 18, -54]
>>> [x+y for x in vec1 for y in vec2]
[6, 5, -7, 8, 7, -5, 10, 9, -3]
>>> [vec1[i]*vec2[i] for i in range(len(vec1))]
[8, 12, -54]

串列推導式可以使用複雜運算式或巢狀函式:

>>> [str(round(355/113, i)) for i in range(1, 6)]
['3.1', '3.14', '3.142', '3.1416', '3.14159']

巢狀串列解析

Python的串列還可以巢狀。

以下例項展示了3X4的矩陣串列:

>>> matrix = [
...     [1, 2, 3, 4],
...     [5, 6, 7, 8],
...     [9, 10, 11, 12],
... ]

以下例項將3X4的矩陣串列轉換為4X3串列:

>>> [[row[i] for row in matrix] for i in range(4)]
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

以下例項也可以使用以下方法來實現:

>>> transposed = []
>>> for i in range(4):
...     transposed.append([row[i] for row in matrix])
...
>>> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

另外一種實現方法:

>>> transposed = []
>>> for i in range(4):
...     # the following 3 lines implement the nested listcomp
...     transposed_row = []
...     for row in matrix:
...         transposed_row.append(row[i])
...     transposed.append(transposed_row)
...
>>> transposed
[[1, 5, 9], [2, 6, 10], [3, 7, 11], [4, 8, 12]]

del 敘述

使用 del 敘述可以從一個串列中依索引而不是值來刪除一個元素。這與使用 pop() 回傳一個值不同。可以用 del 敘述從串列中刪除一個切割,或清空整個串列(我們以前介紹的方法是給該切割賦一個空串列)。例如:

>>> a = [-1, 1, 66.25, 333, 333, 1234.5]
>>> del a[0]
>>> a
[1, 66.25, 333, 333, 1234.5]
>>> del a[2:4]
>>> a
[1, 66.25, 1234.5]
>>> del a[:]
>>> a
[]

也可以用 del 刪除實體變數:

>>> del a

元組和序列

元組由若干逗號分隔的值組成,例如:

>>> t = 12345, 54321, 'hello!'
>>> t[0]
12345
>>> t
(12345, 54321, 'hello!')
>>> # Tuples may be nested:
... u = t, (1, 2, 3, 4, 5)
>>> u
((12345, 54321, 'hello!'), (1, 2, 3, 4, 5))

如你所見,元組在輸出時總是有括弧的,以便於正確表達巢狀結構。在輸入時可能有或沒有括弧, 不過括弧通常是必須的(如果元組是更大的運算式的一部分)。


群集

群集是一個無序不重複元素的集。基本功能包括關係測試和消除重複元素。

可以用大括弧({})建立群集。注意:如果要建立一個空群集,你必須用 set() 而不是 {} ;後者建立一個空的字典,下一節我們會介紹這個資料結構。

以下是一個簡單的演示:

>>> basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
>>> print(basket)                      # 刪除重複的
{'orange', 'banana', 'pear', 'apple'}
>>> 'orange' in basket                 # 檢測成員
True
>>> 'crabgrass' in basket
False

>>> # 以下演示了兩個群集的操作
...
>>> a = set('abracadabra')
>>> b = set('alacazam')
>>> a                                  # a 中唯一的字母
{'a', 'r', 'b', 'c', 'd'}
>>> a - b                              # 在 a 中的字母,但不在 b 中
{'r', 'd', 'b'}
>>> a | b                              # 在 a 或 b 中的字母
{'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'}
>>> a & b                              # 在 a 和 b 中都有的字母
{'a', 'c'}
>>> a ^ b                              # 在 a 或 b 中的字母,但不同時在 a 和 b 中
{'r', 'd', 'b', 'm', 'z', 'l'}

群集也支援推導式:

>>> a = {x for x in 'abracadabra' if x not in 'abc'}
>>> a
{'r', 'd'}

字典

另一個非常有用的 Python 內建資料型態是字典。

序列是以連續的整數為索引,與此不同的是,字典以關鍵字為索引,關鍵字可以是任意不可變型別,通常用字串或數值。

理解字典的最佳方式是把它看做無序的鍵=>值對群集。在同一個字典之內,關鍵字必須是互不相同。

一對大括弧建立一個空的字典:{}。

這是一個字典運用的簡單範例:

>>> tel = {'jack': 4098, 'sape': 4139}
>>> tel['guido'] = 4127
>>> tel
{'sape': 4139, 'guido': 4127, 'jack': 4098}
>>> tel['jack']
4098
>>> del tel['sape']
>>> tel['irv'] = 4127
>>> tel
{'guido': 4127, 'irv': 4127, 'jack': 4098}
>>> list(tel.keys())
['irv', 'guido', 'jack']
>>> sorted(tel.keys())
['guido', 'irv', 'jack']
>>> 'guido' in tel
True
>>> 'jack' not in tel
False

建構函式 dict() 直接從鍵值對元組串列中構建字典。如果有固定的模式,串列推導式指定特定的鍵值對:

>>> dict([('sape', 4139), ('guido', 4127), ('jack', 4098)])
{'sape': 4139, 'jack': 4098, 'guido': 4127}

此外,字典推導可以用來建立任意鍵和值的運算式詞典:

>>> {x: x**2 for x in (2, 4, 6)}
{2: 4, 4: 16, 6: 36}

如果關鍵字只是簡單的字串,使用關鍵字引數指定鍵值對有時候更方便:

>>> dict(sape=4139, guido=4127, jack=4098)
{'sape': 4139, 'jack': 4098, 'guido': 4127}

遍歷技巧

在字典中遍歷時,關鍵字和對應的值可以使用 items() 方法同時解讀出來:

>>> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
>>> for k, v in knights.items():
...     print(k, v)
...
gallahad the pure
robin the brave

在序列中遍歷時,索引位置和對應值可以使用 enumerate() 函式同時得到:

>>> for i, v in enumerate(['tic', 'tac', 'toe']):
...     print(i, v)
...
0 tic
1 tac
2 toe

同時遍歷兩個或更多的序列,可以使用 zip() 組合:

>>> questions = ['name', 'quest', 'favorite color']
>>> answers = ['lancelot', 'the holy grail', 'blue']
>>> for q, a in zip(questions, answers):
...     print('What is your {0}?  It is {1}.'.format(q, a))
...
What is your name?  It is lancelot.
What is your quest?  It is the holy grail.
What is your favorite color?  It is blue.

要反向遍歷一個序列,首先指定這個序列,然後呼叫 reversed() 函式:

>>> for i in reversed(range(1, 10, 2)):
...     print(i)
...
9
7
5
3
1

要按順序遍歷一個序列,使用 sorted() 函式回傳一個已排序的序列,並不修改原值:

>>> basket = ['apple', 'orange', 'apple', 'pear', 'orange', 'banana']
>>> for f in sorted(set(basket)):
...     print(f)
...
apple
banana
orange
pear

參閱檔案