如何在pytorch中自己實作softmax運算

2023-03-18 17:47:22

本文記錄如何實作softmax運算。

線性回歸模型适用于輸出為連續值的情景

softmax運算使輸出更适合離散值的預測和訓練

softmax用于分類問題：

如何在pytorch中自己實作softmax運算

預備知識：首先我們看看這個關于Tensor的運算：sum()函數

>>X = torch.tensor([1, 2, 3])

tensor([1, 2, 3])

>>X.sum(dim=1, keepdim=True)

tensor([ 6])

Sum函數将每一行的所有數相加，keepdim=True表示将總數保留在相應的dim軸，關于dim軸的問題看我這個部落格。點這裡

以及tensor.exp()函數：

>>torch.exp(torch.tensor([0, 2.0]))
tensor([1.0000, 7.3891])

它傳回的是tensor([e^0, e^2]), 注意這個的參數tensor必須是浮點數。

這樣我們就可以使用總數/每個數=占總數的百分比

1+2+3=6

如 X就變成了tensor([1/6, 2/6, 3/6])

這樣一行的數相加為1，至此實作softmax運算。

我們可以将這個運算封裝成一個方法

def softmax(X):

    X_exp = X.exp()

    partition = X_exp.sum(dim=1, keepdim=True)

    return X_exp / partition  # 這裡使用了numpy的廣播機制

現在來使用一下，建立一個tensor

>>X = torch.rand((1, 5))

tensor([[0.0160, 0.7090, 0.3592, 0.2295, 0.9136]])

>>X_prob = softmax(X)

>>X_prob

tensor([[0.1235, 0.2468, 0.1740, 0.1528, 0.3029]])

不用驗算，相加肯定為1

參考：https://tangshusen.me/Dive-into-DL-PyTorch/#/chapter03_DL-basics/3.4_softmax-regression

如何在pytorch中自己實作softmax運算

本文記錄如何實作softmax運算。

繼續閱讀

241 Different Ways to Add Parentheses（C代碼版）

【趨高機器視覺】機器視覺技術原了解析及解決方案

吳恩達 coursera ML 第七課總結+作業答案前言目錄正文模型表示作業答案

CSMA/CD1． CSMA/CD的概述2． CSMA 的工作原理3． CSMA/CD控制規程及特點4． CSMA/CD協定5． CSMA/CD的優點6．結束語

XGBoost Plotting API以及GBDT組合特征實踐 XGBoost Plotting API以及GBDT組合特征實踐

極大似然法(ML)與最大期望法(EM)

解碼器用于語義分割：資料依賴的解碼可以實作靈活的特征聚合

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

cs231n斯坦福基于卷積神經網絡的CV學習筆記（一）KNN和線性分類器/分類器損失/反向傳播一，KNN圖像分類算法二，線性分類器三，線性分類器損失四，反向傳播五，神經網絡

C++ 第十五周報告1--《冒泡法排序》

【Torch】最簡潔logging使用指南

筆試面試題目：滑動視窗(二)

資料結構與算法（27）——排序（二）

Dijkstra--簡易版（最短路徑）

GitHub連夜封殺！這份阿裡 10W 字内部 Java 字面試手冊到底有多強？

hdu7108哈希