資深入門者關于PyTorch和深度學習的碎碎念——訓練方法總結

2023-01-30 00:04:00

<<< (●′◡′●)點贊<(−●′◡′●)(●′◡′●)點贊<(−●′◡′●)

/\\       //>>>> 
   /__\\     //        關注加RP，AC更容易！
  /    \\   //>>>>>

<<< (●′◡′●)收藏<(−●′◡′●)(●′◡′●)收藏<(−●′◡′●)

使用GPU訓練

使用GPU訓練。隻考慮單卡訓練的模式。使用device可以選擇訓練的顯示卡。

首先在系統上通過nvidia-smi确認顯示卡資訊。通過CUDA_VISUABLE_DEVICES控制目前終端下可見的顯示卡。

pytorch.device子產品控制是否使用GPU，nn.model.to, tensor.to方法控制資料或模型存儲的裝置(GPU/CPU)。

device = pytorch.device('cuda:0') // GPU 第一張顯示卡
device = pytorch.device('cpu') // CPU

net = torch.nn.Model()
net.to(device) // 指定裝置上訓練

multitask訓練

多個模型共用一個backbone時，可以多個任務聯合訓練

backbone = BackBoneModel()
head1 = Task1Model()
head2 = Task2Model()
loss1 = Loss1()
loss2 = Loss2()
opt1 = optim.SomeMethod(head1.parameters(), ...)
opt2 = optim.SomeMethod(head2.parameters(), ...)
opt_backbone = optim.SomeMethod(backbone.parameters(), ..)
for X, y in data:
   feature = backbone(X)
   y1 = head1(feature)
   y2 = head2(feature)
   loss_a = loss1(y1, y)
   loss_b = loss2(y1, y)
   tot_loss = loss_a + loss_b
   head1.zero_grad()
   head2.zero_grad()
   back_bone.zero_grad()
   tot_loss.backward()
   opt1.step()
   opt2.step()
   opt_backbone.step()

也可以将兩個head合進backbone，用同樣的opt優化；

預訓練，微調，當機訓練

【預訓練】指的是在開源資料已經訓練好的模型，利用其中提取特征的結構直接提取特征；

這樣在目标任務資料集較小的時候可以不必從頭訓練，用較小的資料量達到較好的效果。

如果不希望backbone的參數改變，可以采用【當機訓練】。

載入預訓練參數代碼:

model_dict = model.state_dict()
pretrained_dict = torch.load(model_path, map_location = device)
pretrained_dict = {k: v for k, v in pretrained_dict.items() if np.shape(model_dict[k]) == np.shape(v)}
model_dict.update(pretrained_dict)
model.load_state_dict(model_dict)

當機訓練時可以利用parameters的requires_grad = false屬性，停止後向傳播；

for param in model.named_parameters():
    if param[0] in need_frozen_list:
        param[1].requires_grad = False
optimizer = torch.optim.SGD(filter(lambda p: p.requires_grad, model.parameters()), lr=args.lr,momentum=args.momentum, weight_decay=args.weight_decay)

也可以用with torch.no_grad()API, 在模型定義中包住backbone的代碼。

class xxnet(nn.Module):
    def __init__():
        ....
        self.layer1 = xx
        self.layer2 = xx
        self.fc = xx

    def forward(self.x):
        with torch.no_grad():
            x = self.layer1(x)
            x = self.layer2(x)
        x = self.fc(x)
        return x

資深入門者關于PyTorch和深度學習的碎碎念——訓練方法總結

使用GPU訓練

multitask訓練

預訓練，微調，當機訓練

繼續閱讀

簡單文檔分類——樸素貝葉斯算法樸素貝葉斯算法簡單文檔分類執行個體步驟總結樸素貝葉斯分類調用(sklearn)

考證大全 | 證券從業資格考試

敲黑闆！2021年證券從業考試考點預測

2021年銀行從業考試考情介紹,果斷收藏!

證券從業合格證書什麼時候列印？有哪些注意事項？

【幹貨滿滿】初級銀行從業考試《個人理财》重點梳理

2020年經濟師考試，難嗎？

初級銀行從業資格證有什麼用？

MBA提前面試純幹貨分享

MBA值得學麼

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

深度學習模型分析人類複雜疾病的準确性

【趨高機器視覺】機器視覺技術原了解析及解決方案

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡