本節内容
- 函數基本文法及特性
- 參數與局部變量
- 傳回值
嵌套函數
4.遞歸
5.匿名函數
6.函數式程式設計介紹
7.高階函數
8.内置函數
溫故知新
- 集合
主要作用:
去重
關系測試, 交集\差集\并集\反向(對稱)差集
- View Code
- 元組
隻讀清單,隻有count, index 2 個方法
作用:如果一些資料不想被人修改, 可以存成元組,比如身份證清單
3. 字典
key-value對
特性:
無順序
去重
查詢速度快,比清單快多了
比list占用記憶體多
為什麼會查詢速度會快呢?因為他是hash類型的,那什麼是hash呢?
雜湊演算法将任意長度的二進制值映射為較短的固定長度的二進制值,這個小的二進制值稱為哈希值。哈希值是一段資料唯一且極其緊湊的數值表示形式。如果散列一段明文而且哪怕隻更改該段落的一個字母,随後的哈希都将産生不同的值。要找到散列為同一個值的兩個不同的輸入,在計算上是不可能的,是以資料的哈希值可以檢驗資料的完整性。一般用于快速查找和加密算法
dict會把所有的key變成hash 表,然後将這個表進行排序,這樣,你通過data[key]去查data字典中一個key的時候,python會先把這個key hash成一個數字,然後拿這個數字到hash表中看沒有這個數字, 如果有,拿到這個key在hash表中的索引,拿到這個索引去與此key對應的value的記憶體位址那取值就可以了。
上面依然沒回答這樣做查找一個資料為什麼會比清單快,對不對? 呵呵,等我課上揭曉。
4. 字元編碼
先說python2
py2裡預設編碼是ascii
檔案開頭那個編碼聲明是告訴解釋這個代碼的程式 以什麼編碼格式 把這段代碼讀入到記憶體,因為到了記憶體裡,這段代碼其實是以bytes二進制格式存的,不過即使是2進制流,也可以按不同的編碼格式轉成2進制流,你懂麼?
如果在檔案頭聲明了#_*_coding:utf-8*_,就可以寫中文了, 不聲明的話,python在處理這段代碼時按ascii,顯然會出錯, 加了這個聲明後,裡面的代碼就全是utf-8格式了
在有#_*_coding:utf-8*_的情況下,你在聲明變量如果寫成name=u"大保健",那這個字元就是unicode格式,不加這個u,那你聲明的字元串就是utf-8格式
utf-8 to gbk怎麼轉,utf8先decode成unicode,再encode成gbk
再說python3
py3裡預設檔案編碼就是utf-8,是以可以直接寫中文,也不需要檔案頭聲明編碼了,幹的漂亮
你聲明的變量預設是unicode編碼,不是utf-8, 因為預設即是unicode了(不像在py2裡,你想直接聲明成unicode還得在變量前加個u), 此時你想轉成gbk的話,直接your_str.encode("gbk")即可以
但py3裡,你在your_str.encode("gbk")時,感覺好像還加了一個動作,就是就是encode的資料變成了bytes裡,我擦,這是怎麼個情況,因為在py3裡,str and bytes做了明确的區分,你可以了解為bytes就是2進制流,你會說,我看到的不是010101這樣的2進制呀, 那是因為python為了讓你能對資料進行操作而在記憶體級别又幫你做了一層封裝,否則讓你直接看到一堆2進制,你能看出哪個字元對應哪段2進制麼?什麼?自己換算,得了吧,你連超過2位數的數字加減運算都費勁,還還是省省心吧。
那你說,在py2裡好像也有bytes呀,是的,不過py2裡的bytes隻是對str做了個别名(python2裡的str就是bytes, py3裡的str是unicode),沒有像py3一樣給你顯示的多出來一層封裝,但其實其内部還是封裝了的。 這麼講吧, 無論是2還是三, 從硬碟到記憶體,資料格式都是 010101二進制到-->b'\xe4\xbd\xa0\xe5\xa5\xbd' bytes類型-->按照指定編碼轉成你能看懂的文字
編碼應用比較多的場景應該是爬蟲了,網際網路上很多網站用的編碼格式很雜,雖然整體趨向都變成utf-8,但現在還是很雜,是以爬網頁時就需要你進行各種編碼的轉換,不過生活正在變美好,期待一個不需要轉碼的世界。
最後,編碼is a piece of fucking shit, noboby likes it.
1.函數基本文法及特性
背景提要
現在老闆讓你寫一個監控程式,監控伺服器的系統狀況,當cpu\memory\disk等名額的使用量超過閥值時即發郵件報警,你掏空了所有的知識量,寫出了以下代碼
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
while True:
if cpu使用率 > 90%:
#發送郵件提醒
連接配接郵箱伺服器
發送郵件
關閉連接配接
if 硬碟使用空間 > 90%:
#發送郵件提醒
連接配接郵箱伺服器
發送郵件
關閉連接配接
if 記憶體占用 > 80%:
#發送郵件提醒
連接配接郵箱伺服器
發送郵件
關閉連接配接
上面的代碼實作了功能,但即使是鄰居老王也看出了端倪,老王親切的摸了下你家兒子的臉蛋,說,你這個重複代碼太多了,每次報警都要重寫一段發郵件的代碼,太low了,這樣幹存在2個問題:
代碼重複過多,一個勁的copy and paste不符合高端程式員的氣質
如果日後需要修改發郵件的這段代碼,比如加入群發功能,那你就需要在所有用到這段代碼的地方都修改一遍
你覺得老王說的對,你也不想寫重複代碼,但又不知道怎麼搞,老王好像看出了你的心思,此時他抱起你兒子,笑着說,其實很簡單,隻需要把重複的代碼提取出來,放在一個公共的地方,起個名字,以後誰想用這段代碼,就通過這個名字調用就行了,如下
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
def 發送郵件(内容)
#發送郵件提醒
連接配接郵箱伺服器
發送郵件
關閉連接配接
while True:
if cpu使用率 > 90%:
發送郵件('CPU報警')
if 硬碟使用空間 > 90%:
發送郵件('硬碟報警')
if 記憶體占用 > 80%:
發送郵件('記憶體報警')
你看着老王寫的代碼,氣勢恢宏、磅礴大氣,代碼裡透露着一股内斂的傲氣,心想,老王這個人真是不一般,突然對他的背景更感興趣了,問老王,這些花式玩法你都是怎麼知道的? 老王親了一口你兒子,捋了捋不存在的胡子,淡淡的講,“老夫,年少時,師從京西沙河淫魔銀角大王 ”, 你一聽“銀角大王”這幾個字,不由的嬌軀一震,心想,真nb,怪不得代碼寫的這麼6, 這“銀角大王”當年在江湖上可是數得着的響當當的名字,隻可惜後期縱欲過度,卒于公元2016年, 真是可惜了,隻留下其哥哥孤守當年兄弟倆一起打下來的江山。 此時你看着的老王離開的身影,感覺你兒子跟他越來越像了。。。
函數是什麼?
函數一詞來源于數學,但程式設計中的「函數」概念,與數學中的函數是有很大不同的,具體差別,我們後面會講,程式設計中的函數在英文中也有很多不同的叫法。在BASIC中叫做subroutine(子過程或子程式),在Pascal中叫做procedure(過程)和function,在C中隻有function,在Java裡面叫做method。
定義: 函數是指将一組語句的集合通過一個名字(函數名)封裝起來,要想執行這個函數,隻需調用其函數名即可
特性:
減少重複代碼
使程式變的可擴充
使程式變得易維護
文法定義
1
2
3
4
def sayhi():#函數名
print(“Hello, I’m nobody!”)
sayhi() #調用函數
可以帶參數
1
2
3
4
5
6
7
8
9
10
11
12
13
#下面這段代碼
a,b = 5,8
c = a**b
print©
#改成用函數寫
def calc(x,y):
res = x**y
return res #傳回函數執行結果
c = calc(a,b) #結果指派給c變量
print©
2.函數參數與局部變量
形參變量隻有在被調用時才配置設定記憶體單元,在調用結束時,即刻釋放所配置設定的記憶體單元。是以,形參隻在函數内部有效。函數調用結束傳回主調用函數後則不能再使用該形參變量
實參可以是常量、變量、表達式、函數等,無論實參是何種類型的量,在進行函數調用時,它們都必須有确定的值,以便把這些值傳送給形參。是以應預先用指派,輸入等辦法使參數獲得确定值
預設參數
看下面代碼
1
2
3
4
5
6
7
8
9
10
def stu_register(name,age,country,course):
print("----注冊學生資訊------")
print(“姓名:”,name)
print(“age:”,age)
print(“國籍:”,country)
print(“課程:”,course)
stu_register(“王山炮”,22,“CN”,“python_devops”)
stu_register(“張叫春”,21,“CN”,“linux”)
stu_register(“劉老根”,25,“CN”,“linux”)
發現 country 這個參數 基本都 是"CN", 就像我們在網站上注冊使用者,像國籍這種資訊,你不填寫,預設就會是 中國, 這就是通過預設參數實作的,把country變成預設參數非常簡單
1
def stu_register(name,age,course,country=“CN”):
這樣,這個參數在調用時不指定,那預設就是CN,指定了的話,就用你指定的值。
另外,你可能注意到了,在把country變成預設參數後,我同時把它的位置移到了最後面,為什麼呢?
關鍵參數
正常情況下,給函數傳參數要按順序,不想按順序就可以用關鍵參數,隻需指定參數名即可,但記住一個要求就是,關鍵參數必須放在位置參數之後。
1
stu_register(age=22,name=‘alex’,course=“python”,)
非固定參數
若你的函數在定義時不确定使用者想傳入多少個參數,就可以使用非固定參數
1
2
3
4
5
6
7
8
9
10
def stu_register(name,age,*args): # *args 會把多傳入的參數變成一個元組形式
print(name,age,args)
stu_register(“Alex”,22)
#輸出
#Alex 22 () #後面這個()就是args,隻是因為沒傳值,是以為空
stu_register(“Jack”,32,“CN”,“Python”)
#輸出
Jack 32 (‘CN’, ‘Python’)
還可以有一個**kwargs
1
2
3
4
5
6
7
8
9
10
def stu_register(name,age,*args,**kwargs): # *kwargs 會把多傳入的參數變成一個dict形式
print(name,age,args,kwargs)
stu_register(“Alex”,22)
#輸出
#Alex 22 () {}#後面這個{}就是kwargs,隻是因為沒傳值,是以為空
stu_register(“Jack”,32,“CN”,“Python”,sex=“Male”,province=“ShanDong”)
#輸出
Jack 32 (‘CN’, ‘Python’) {‘province’: ‘ShanDong’, ‘sex’: ‘Male’}
局部變量
1
2
3
4
5
6
7
8
9
10
11
name = “Alex Li”
def change_name(name):
print(“before change:”,name)
name = “金角大王,一個有Tesla的男人”
print(“after change”, name)
change_name(name)
print(“在外面看看name改了麼?”,name)
輸出
1
2
3
before change: Alex Li
after change 金角大王,一個有Tesla的男人
在外面看看name改了麼? Alex Li
全局與局部變量
在子程式中定義的變量稱為局部變量,在程式的一開始定義的變量稱為全局變量。
全局變量作用域是整個程式,局部變量作用域是定義該變量的子程式。
當全局變量與局部變量同名時:
在定義局部變量的子程式内,局部變量起作用;在其它地方全局變量起作用。
3.傳回值
要想擷取函數的執行結果,就可以用return語句把結果傳回
注意:
函數在執行過程中隻要遇到return語句,就會停止執行并傳回結果,so 也可以了解為 return 語句代表着函數的結束
如果未在函數中指定return,那這個函數的傳回值為None
強行插入知識點: 嵌套函數
看上面的标題的意思是,函數還能套函數?of course
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
name = “Alex”
def change_name():
name = “Alex2”
def change_name2():
name = "Alex3"
print("第3層列印",name)
change_name2() #調用内層函數
print("第2層列印",name)
change_name()
print(“最外層列印”,name)
此時,在最外層調用change_name2()會出現什麼效果?
沒錯, 出錯了, 為什麼呢?
嵌套函數的用法會了,但它有什麼用呢?下節課揭曉。。。
- 遞歸
在函數内部,可以調用其他函數。如果一個函數在内部調用自身本身,這個函數就是遞歸函數。
1
2
3
4
5
6
7
8
9
10
11
12
13
def calc(n):
print(n)
if int(n/2) ==0:
return n
return calc(int(n/2))
calc(10)
輸出:
10
5
2
1
遞歸特性:
- 必須有一個明确的結束條件
- 每次進入更深一層遞歸時,問題規模相比上次遞歸都應有所減少
- 遞歸效率不高,遞歸層次過多會導緻棧溢出(在計算機中,函數調用是通過棧(stack)這種資料結構實作的,每當進入一個函數調用,棧就會加一層棧幀,每當函數傳回,棧就會減一層棧幀。由于棧的大小不是無限的,是以,遞歸調用的次數過多,會導緻棧溢出)
堆棧掃盲http://www.cnblogs.com/lln7777/archive/2012/03/14/2396164.html
遞歸函數實際應用案例,二分查找
- View Code
5. 匿名函數
匿名函數就是不需要顯式的指定函數
1
2
3
4
5
6
7
8
#這段代碼
def calc(n):
return n**n
print(calc(10))
#換成匿名函數
calc = lambda n:n**n
print(calc(10))
你也許會說,用上這個東西沒感覺有毛友善呀, 。。。。呵呵,如果是這麼用,确實沒毛線改進,不過匿名函數主要是和其它函數搭配使用的呢,如下
1
2
3
res = map(lambda x:x**2,[1,5,7,4,8])
for i in res:
print(i)
輸出
1
25
49
16
64
6.函數式程式設計介紹
函數是Python内建支援的一種封裝,我們通過把大段代碼拆成函數,通過一層一層的函數調用,就可以把複雜任務分解成簡單的任務,這種分解可以稱之為面向過程的程式設計。函數就是面向過程的程式設計的基本單元。
函數式程式設計中的函數這個術語不是指計算機中的函數(實際上是Subroutine),而是指數學中的函數,即自變量的映射。也就是說一個函數的值僅決定于函數參數的值,不依賴其他狀态。比如sqrt(x)函數計算x的平方根,隻要x不變,不論什麼時候調用,調用幾次,值都是不變的。
Python對函數式程式設計提供部分支援。由于Python允許使用變量,是以,Python不是純函數式程式設計語言。
一、定義
簡單說,“函數式程式設計"是一種"程式設計範式”(programming paradigm),也就是如何編寫程式的方法論。
主要思想是把運算過程盡量寫成一系列嵌套的函數調用。舉例來說,現在有這樣一個數學表達式:
(1 + 2) * 3 - 4
傳統的過程式程式設計,可能這樣寫:
var a = 1 + 2;
var b = a * 3;
var c = b - 4;
函數式程式設計要求使用函數,我們可以把運算過程定義為不同的函數,然後寫成下面這樣:
var result = subtract(multiply(add(1,2), 3), 4);
這段代碼再演進以下,可以變成這樣
add(1,2).multiply(3).subtract(4)
這基本就是自然語言的表達了。再看下面的代碼,大家應該一眼就能明白它的意思吧:
merge([1,2],[3,4]).sort().search("2")
是以,函數式程式設計的代碼更容易了解。
要想學好函數式程式設計,不要玩py,玩Erlang,Haskell, 好了,我隻會這麼多了。。。
7.高階函數
變量可以指向函數,函數的參數能接收變量,那麼一個函數就可以接收另一個函數作為參數,這種函數就稱之為高階函數。
1
2
3
4
5
6
def add(x,y,f):
return f(x) + f(y)
res = add(3,-6,abs)
print(res)
- 内置參數
内置參數詳解 https://docs.python.org/3/library/functions.html?highlight=built#ascii
幾個内置方法用法提醒
本節作業
有以下員工資訊表
當然此表你在檔案存儲時可以這樣表示
1
1,Alex Li,22,13651054608,IT,2013-04-01
現需要對這個員工資訊檔案,實作增删改查操作
可進行模糊查詢,文法至少支援下面3種:
select name,age from staff_table where age > 22
select * from staff_table where dept = "IT"
select * from staff_table where enroll_date like "2013"
查到的資訊,列印後,最後面還要顯示查到的條數
可建立新員工紀錄,以phone做唯一鍵,staff_id需自增
可删除指定員工資訊紀錄,輸入員工id,即可删除
可修改員工資訊,文法如下:
UPDATE staff_table SET dept="Market" WHERE where dept = "IT"
注意:以上需求,要充分使用函數,請盡你的最大限度來減少重複代碼!