天天看點

好程式員Python教育訓練第10講:字元串的使用

  好程式員Python教育訓練第10講:字元串的使用,前面兩節課,我們介紹了函數和字元串。在講解今天的内容之前,先來回答一個可能會讓大家感到費解的問題:為什麼字元串類型(str)可以通過調用方法的方式進行操作,而之前我們用到的數值類型(如int、float)卻沒有可以調用的方法。在Python中,數值類型是标量類型,也就是說這種類型的變量沒有可以通路的内部結構;而字元串類型是一種結構化的、非标量類型,是以才會有一系列的方法可供調用。如果對這一點感到困惑,那就繼續學習吧,等學習完面向對象程式設計的知識後,你就能找到這些問題的答案了。

接下來我們通過一些案例來為大家講解函數和字元串的應用。

一些案例

例子1:設計一個生成指定長度驗證碼的函數。

說明:驗證碼由數字和英文大小寫字母構成。

import random

ALL_CHARS = '0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ'

def generate_code(code_len=4):

"""生成指定長度的驗證碼
:param code_len: 驗證碼的長度(預設4個字元)
:return: 由大小寫英文字母和數字構成的随機驗證碼字元串
"""
code = ''
for _ in range(code_len):
    # 産生0到字元串長度減1範圍的随機數作為索引
    index = random.randrange(0, len(ALL_CHARS))
    # 利用索引運算從字元串中取出字元并進行拼接
    code += ALL_CHARS[index]
return code           

我們用下面的代碼生成10組随機驗證碼來測試上面的函數。

for _ in range(10):

print(generate_code())           

上面的函數其實還有一種更為簡單的寫法,直接利用random子產品的随機抽樣函數從字元串中取出指定數量的字元,然後利用字元串的join方法将選中的那些字元拼接起來。此外,可以利用Python标準庫中的string 子產品來獲得數字和英文字母的字面常量。

import string

ALL_CHARS = string.digits + string.ascii_letters

"""生成指定長度的驗證碼
:param code_len: 驗證碼的長度(預設4個字元)
:return: 由大小寫英文字母和數字構成的随機驗證碼字元串
"""
return ''.join(random.choices(ALL_CHARS, k=code_len))           

說明:random子產品的sample和choices函數都可以實作随機抽樣,sample實作無放回抽樣,這意味着抽樣取出的字元是不重複的;choices實作有放回抽樣,這意味着可能會重複選中某些字元。這兩個函數的第一個參數代表抽樣的總體,而參數k代表抽樣的數量。

例子2:設計一個函數傳回給定檔案名的字尾名。

說明:檔案名通常是一個字元串,而檔案的字尾名指的是檔案名中最後一個.後面的部分,也稱為檔案的擴充名,它是某些作業系統用來标記檔案類型的一種機制,例如在Windows系統上,字尾名exe表示這是一個可執行程式,而字尾名txt表示這是一個純文字檔案。需要注意的是,在Linux和macOS系統上,檔案名可以以.開頭,表示這是一個隐藏檔案,像.gitignore這樣的檔案名,.後面并不是字尾名,這個檔案沒有字尾名或者說字尾名為''。

def get_suffix(filename):

"""擷取檔案名的字尾名
:param filename: 檔案名
:return: 檔案的字尾名
"""
# 從字元串中逆向查找.出現的位置
pos = filename.rfind('.')
# 通過切片操作從檔案名中取出字尾名
return filename[pos + 1:] if pos > 0 else ''           

可以用下面的代碼對上面的函數做一個簡單的測驗。

print(get_suffix('readme.txt')) # txt

print(get_suffix('readme.txt.md')) # md

print(get_suffix('.readme')) #

print(get_suffix('readme.')) #

print(get_suffix('readme')) #

上面的get_suffix函數還有一個更為便捷的實作方式,就是直接使用os.path子產品的splitext函數,這個函數會将檔案名拆分成帶路徑的檔案名和擴充名兩個部分,然後傳回一個二進制組(下節課會講到元組),二進制組中的第二個元素就是檔案的字尾名(包含.),如果要去掉字尾名中的.,可以做一個字元串的切片操作,代碼如下所示。

from os.path import splitext

return splitext(filename)[1][1:]           

例子3:在終端中顯示跑馬燈(滾動)文字。

說明:實作跑馬燈文字的原理非常簡單,把目前字元串的第一個字元放到要輸出的内容的最後面,把從第二個字元開始後面的内容放到要輸出的内容的最前面,通過循環重複這個操作,就可以看到滾動起來的文字。兩次循環之間的間隔可以通過time子產品的sleep函數來實作,而清除螢幕上之前的輸出可以使用os子產品的system函數調用系統清屏指令來實作。

import os

import time

content = '北 京 歡 迎 你 為 你 開 天 辟 地 '

while True:

# Windows清除螢幕上的輸出
# os.system('cls')  
# macOS清除螢幕上的輸出
os.system('clear')
print(content)
# 休眠0.2秒(200毫秒)
time.sleep(0.2)
content = content[1:] + content[0]           

提示:我們之前建議大家暫時用VS Code來編寫Python代碼,在“指令行提示符”或“終端”中來運作Python程式。如果你已經提前開始使用PyCharm了,需要提醒一句:PyCharm的運作視窗無用上面的方式做清屏處理。想看到上面代碼的運作效果,建議在“指令行提示符”或“終端”中運作程式。

簡單的總結

在寫代碼尤其是開發商業項目的時候,一定要有意識的将相對獨立且重複出現的功能封裝成函數,這樣不管是自己還是團隊的其他成員都可以通過調用函數的方式來使用這些功能。字元串是非常重要的資料類型,字元串的常用運算和方法需要掌握,因為一般的商業項目中,處理字元串比處理數值的操作要更多。