Python3 字串

字串是 Python 中最常用的資料型態。我們可以使用引號( '" )來建立字串。

建立字串很簡單,只要為變數分配一個值即可。例如:

var1 = 'Hello World!' var2 = "Twcode01"

Python 存取字串中的值

Python 不支援單字元型別,單字元在 Python 中也是作為一個字串使用。

Python 存取子字串,可以使用方括弧來擷取字串,如下例項:

範例(Python 3.0+)

#!/usr/bin/python3 var1 = 'Hello World!' var2 = "Twcode01" print ("var1[0]: ", var1[0]) print ("var2[1:5]: ", var2[1:5])

以上例項執行結果:

var1[0]:  H
var2[1:5]:  unoo

Python 字串更新

你可以擷取字串的一部分並與其他欄位拼接,如下例項:

範例(Python 3.0+)

#!/usr/bin/python3 var1 = 'Hello World!' print ("已更新字串 : ", var1[:6] + 'Twcode01!')

以上例項執行結果

已更新字串 :  Hello Twcode01!

Python跳脫字元

在需要在字元中使用特殊字元時,python用反斜杠(\)跳脫字元。如下表:

跳脫字元描述
\(在行尾時) 續行符
\\ 反斜杠符號
\' 單引號
\" 雙引號
\a 響鈴
\b 退格(Backspace)
\000
\n 換行
\v 縱向製表符
\t 橫向製表符
\r 回車
\f 換頁
\oyy 八進位數,yy 代表的字元,例如:\o12 代表換行,其中 o 是字母,不是數值 0。
\xyy 十六進位數,yy代表的字元,例如:\x0a代表換行
\other 其它的字元以普通格式輸出

Python字串運算子

下表例項變數a值為字串 "Hello",b變數值為 "Python":

運算子描述範例
+字串連接 a + b 輸出結果: HelloPython
*重複輸出字串 a*2 輸出結果:HelloHello
[]透過索引取得字串中字元 a[1] 輸出結果 e
[ : ]擷取字串中的一部分,遵循左閉右開原則,str[0,2] 是不包含第 3 個字元的。 a[1:4] 輸出結果 ell
in成員運算子 - 如果字串中包含給定的字元回傳 True 'H' in a 輸出結果 True
not in 成員運算子 - 如果字串中不包含給定的字元回傳 True 'M' not in a 輸出結果 True
r/R原始字串 - 原始字串:所有的字串都是直接按照字面的意思來使用,沒有轉義特殊或不能列印的字元。 原始字串除在字串的第一個引號前加上字母 r(可以大小寫)以外,與普通字串有著幾乎完全相同的語法。
print( r'\n' )
print( R'\n' )
%格式字串請看下一節內容。

範例(Python 3.0+)

#!/usr/bin/python3 a = "Hello" b = "Python" print("a + b 輸出結果:", a + b) print("a * 2 輸出結果:", a * 2) print("a[1] 輸出結果:", a[1]) print("a[1:4] 輸出結果:", a[1:4]) if( "H" in a) : print("H 在變數 a 中") else : print("H 不在變數 a 中") if( "M" not in a) : print("M 不在變數 a 中") else : print("M 在變數 a 中") print (r'\n') print (R'\n')

以上例項輸出結果為:

a + b 輸出結果: HelloPython
a * 2 輸出結果: HelloHello
a[1] 輸出結果: e
a[1:4] 輸出結果: ell
H 在變數 a 中
M 不在變數 a 中
\n
\n

Python字串格式化

Python 支援格式化字串的輸出 。儘管這樣可能會用到非常複雜的運算式,但最基本的用法是將一個值寫入到一個有字串格式符 %s 的字串中。

在 Python 中,字串格式化使用與 C 中 sprintf 函式一樣的語法。

範例(Python 3.0+)

#!/usr/bin/python3 print ("我叫 %s 今年 %d 歲!" % ('小明', 10))

以上例項輸出結果:

我叫 小明 今年 10 歲!

python字串格式化符號:

    符   號 描述
      %c 格式化字元及其ASCII碼
      %s 格式化字串
      %d 格式化整數
      %u 格式化無符號整型
      %o 格式化無符號八進位數
      %x 格式化無符號十六進位數
      %X 格式化無符號十六進位數(大寫)
      %f 格式化浮點數值,可指定小數點後的精度
      %e 用科學計數法格式化浮點數
      %E 作用同%e,用科學計數法格式化浮點數
      %g %f和%e的簡寫
      %G %f 和 %E 的簡寫
      %p 用十六進位數格式化變數的地址

格式化運算子輔助指令:

符號功能
*定義寬度或者小數點精度
-用做左對齊
+在正數前面顯示加號( + )
<sp>在正數前面顯示空白
# 在八進位數前面顯示零('0'),在十六進位前面顯示'0x'或者'0X'(取決於用的是'x'還是'X')
0 顯示的數值前面填充'0'而不是預設的空白
% '%%'輸出一個單一的'%'
(var)對映變數(字典引數)
m.n. m 是顯示的最小總寬度,n 是小數點後的位數(如果可用的話)

Python2.6 開始,新增了一種格式化字串的函式 str.format(),它增強了字串格式化的功能。


Python三引號

python三引號允許一個字串跨多行,字串中可以包含換行符、製表符以及其他特殊字元。例項如下

範例(Python 3.0+)

#!/usr/bin/python3 para_str = """這是一個多行字串的例項 多行字串可以使用製表符 TAB ( \t )。 也可以使用換行符 [ \n ]。 """ print (para_str)

以上例項執行結果為:

這是一個多行字串的例項
多行字串可以使用製表符
TAB (    )。
也可以使用換行符 [ 
 ]。

三引號讓程式設計師從引號和特殊字串的泥潭裡面解脫出來,自始至終保持一小塊字串的格式是所謂的WYSIWYG(所見即所得)格式的。

一個典型的用例是,當你需要一塊HTML或者SQL時,這時用字串組合,特殊字串轉義將會非常的繁瑣。

errHTML = ''' <HTML><HEAD><TITLE> Friends CGI Demo</TITLE></HEAD> <BODY><H3>ERROR</H3> <B>%s</B><P> <FORM><INPUT TYPE=button VALUE=Back ONCLICK="window.history.back()"></FORM> </BODY></HTML> ''' cursor.execute(''' CREATE TABLE users ( login VARCHAR(8), uid INTEGER, prid INTEGER) ''')

f-string

f-string 是 python3.6 之後版本新增的,稱之為字面量格式化字串,是新的格式化字串的語法。

之前我們習慣用百分號 (%):

範例

>>> name = 'Twcode01'
>>> 'Hello %s' % name
'Hello Twcode01'

f-string 格式話字串以 f 開頭,後面跟著字串,字串中的運算式用大括弧 {} 套件起來,它會將變數或運算式計算後的值取代進去,例項如下:

範例

>>> name = 'Twcode01'
>>> f'Hello {name}'  # 取代變數

>>> f'{1+2}'         # 使用運算式
'3'

>>> w = {'name': 'Twcode01', 'url': 'www.twcode01.com'}
>>> f'{w["name"]}: {w["url"]}'
'Twcode01: www.twcode01.com'

用了這種方式明顯更簡單了,不用再去判斷使用 %s,還是 %d。

在 Python 3.8 的版本中可以使用 = 符號來拼接運算運算式與結果:

範例

>>> x = 1
>>> print(f'{x+1}')   # Python 3.6
2

>>> x = 1
>>> print(f'{x+1=}')   # Python 3.8
'x+1=2'

Unicode 字串

在Python2中,普通字串是以8位ASCII碼進行儲存的,而Unicode字串則儲存為16位unicode字串,這樣能夠表示更多的編碼表。使用的語法是在字串前面加上前置詞 u

在Python3中,所有的字串都是Unicode字串。


Python 的字串內建函式

Python 的字串常用內建函式如下:

序號方法及描述
1

capitalize()
將字串的第一個字元轉換為大寫

2

center(width, fillchar)


回傳一個指定的寬度 width 居中的字串,fillchar 為填充的字元,預設為空白。
3

count(str, beg= 0,end=len(string))


回傳 str 在 string 裡面出現的次數,如果 beg 或者 end 指定則回傳指定範圍內 str 出現的次數
4

bytes.decode(encoding="utf-8", errors="strict")


Python3 中沒有 decode 方法,但我們可以使用 bytes 物件的 decode() 方法來解碼給定的 bytes 物件,這個 bytes 物件可以由 str.encode() 來編碼回傳。
5

encode(encoding='UTF-8',errors='strict')


以 encoding 指定的編碼格式編碼字串,如果出錯預設報一個ValueError 的異常,除非 errors 指定的是'ignore'或者'replace'
6

endswith(suffix, beg=0, end=len(string))
檢查字串是否以 obj 結束,如果beg 或者 end 指定則檢查指定的範圍內是否以 obj 結束,如果是,回傳 True,否則回傳 False.

7

expandtabs(tabsize=8)


把字串 string 中的 tab 符號轉為空白,tab 符號預設的空白數是 8 。
8

find(str, beg=0, end=len(string))


檢測 str 是否包含在字串中,如果指定範圍 beg 和 end ,則檢查是否包含在指定範圍內,如果包含回傳開始的索引值,否則回傳-1
9

index(str, beg=0, end=len(string))


跟find()方法一樣,只不過如果str不在字串中會報一個異常.
10

isalnum()


如果字串至少有一個字元並且所有字元都是字母或數值則返 回 True,否則回傳 False
11

isalpha()


如果字串至少有一個字元並且所有字元都是字母則回傳 True, 否則回傳 False
12

isdigit()


如果字串只包含數值則回傳 True 否則回傳 False..
13

islower()


如果字串中包含至少一個區分大小寫的字元,並且所有這些(區分大小寫的)字元都是小寫,則回傳 True,否則回傳 False
14

isnumeric()


如果字串中只包含數值字元,則回傳 True,否則回傳 False
15

isspace()


如果字串中只包含空白,則回傳 True,否則回傳 False.
16

istitle()


如果字串是標題化的(見 title())則回傳 True,否則回傳 False
17

isupper()


如果字串中包含至少一個區分大小寫的字元,並且所有這些(區分大小寫的)字元都是大寫,則回傳 True,否則回傳 False
18

join(seq)


以指定字串作為分隔符,將 seq 中所有的元素(的字串表示)合併為一個新的字串
19

len(string)


回傳字串長度
20

ljust(width[, fillchar])


回傳一個原字串左對齊,並使用 fillchar 填充至長度 width 的新字串,fillchar 預設為空白。
21

lower()


轉換字串中所有大寫字元為小寫.
22

lstrip()


截掉字串左邊的空白或指定字元。
23

maketrans()


建立字元對映的轉換表,對於接受兩個引數的最簡單的呼叫方式,第一個引數是字串,表示需要轉換的字元,第二個引數也是字串表示轉換的目標。
24

max(str)


回傳字串 str 中最大的字母。
25

min(str)


回傳字串 str 中最小的字母。
26

replace(old, new [, max])


把 將字串中的 str1 取代成 str2,如果 max 指定,則取代不超過 max 次。
27

rfind(str, beg=0,end=len(string))


類似於 find()函式,不過是從右邊開始搜尋.
28

rindex( str, beg=0, end=len(string))


類似於 index(),不過是從右邊開始.
29

rjust(width,[, fillchar])


回傳一個原字串右對齊,並使用fillchar(預設空白)填充至長度 width 的新字串
30

rstrip()


刪除字串字串末尾的空白.
31

split(str="", num=string.count(str))


num=string.count(str)) 以 str 為分隔符擷取字串,如果 num 有指定值,則僅擷取 num+1 個子字串
32

splitlines([keepends])


按照行('\r', '\r\n', \n')分隔,回傳一個包含各行作為元素的串列,如果引數 keepends 為 False,不包含換行符,如果為 True,則保留換行符。
33

startswith(substr, beg=0,end=len(string))


檢查字串是否是以指定子字串 substr 開頭,是則回傳 True,否則回傳 False。如果beg 和 end 指定值,則在指定範圍內檢查。
34

strip([chars])


在字串上執行 lstrip()和 rstrip()
35

swapcase()


將字串中大寫轉換為小寫,小寫轉換為大寫
36

title()


回傳"標題化"的字串,就是說所有單詞都是以大寫開始,其餘字母均為小寫(見 istitle())
37

translate(table, deletechars="")


根據 str 給出的表(包含 256 個字元)轉換 string 的字元, 要過濾掉的字元放到 deletechars 引數中
38

upper()


轉換字串中的小寫字母為大寫
39

zfill (width)


回傳長度為 width 的字串,原字串右對齊,前面填充0
40

isdecimal()


檢查字串是否只包含十進位字元,如果是回傳 true,否則回傳 false。