Python之pickle

2018-03-03 15:04:00

Pickle子產品可以序列化對象并儲存到磁盤中，并在需要的時候讀取出來，任何對象都可以執行序列化操作。在機器學習中，我們常常需要把訓練好的模型存儲起來，這樣在進行決策時直接将模型獨處，而不需要重新訓練模型，這樣就大大節約了時間。

python3官方文檔：https://docs.python.org/3.5/library/pickle.html

pickle子產品常用函數

dump(obj,file,[,protocol])	将obj對象序列化存入已經打開的file中
load(file)	将file中的對象序列化讀出
dumps(obj,[,protocol])	将obj對象序列化為string形式，而不是存入檔案中
loads(string)	從string中讀出序列化前的obj對象

示例

#coding=utf-8

import pickle

datalist = [[1, 1, 'yes'],  
           [1, 1, 'yes'],  
           [1, 0, 'no'],  
           [0, 1, 'no'],  
           [0, 1, 'no']]  
           
datadict = { 0: [1, 2, 3, 4],  
            1: ('a', 'b'),  
            2: {'c':'yes','d':'no'}}  

with open("pickle_test.txt","wb") as writefp:
    pickle.dump(datalist, writefp)
    pickle.dump(datadict, writefp)
  
with open("pickle_test.txt", "rb") as readfp:
    data1 = pickle.load(readfp)
    data2 = pickle.load(readfp)
    print (data1)
    print (data2)

p = pickle.dumps(datalist)  
print( pickle.loads(p) )  
p = pickle.dumps(datadict)  
print( pickle.loads(p) )

　　>>> [[1, 1, 'yes'], [1, 1, 'yes'], [1, 0, 'no'], [0, 1, 'no'], [0, 1, 'no']]

　　>>> {0: [1, 2, 3, 4], 1: ('a', 'b'), 2: {'c': 'yes', 'd': 'no'}}

　　dump和load相比dumps和loads還有另外一種能力：dump()函數能一個接着一個的将幾個對象序列化存儲到同一個檔案中，随後調用load()來以同樣的順序反序列化讀出這些對象