極大似然估計（MLE）和最大後驗估計（MAP）

2023-08-01 16:35:36

1.極大似然估計

給定一堆資料，假如我們知道它是從某一種分布中随機取出來的，可是我們并不知道這個分布具體的參數，即“模型已知，參數未知”。例如，我們知道這個分布是正态分布，但是不知道均值和方差；或者是二項分布，但是不知道均值。極大似然估計（MLE，Maximum Likelihood Estimation）就可以用來估計模型的參數。MLE的目标是找出一組參數，使得模型産生出觀測資料的機率最大

即：

極大似然估計（MLE）和最大後驗估計（MAP）

MLE的具體算法由機率論的知識可以解決，此處略去。

2.最大後驗機率

MLE找的是一組能夠使似然函數最大的參數，而MAP給參數施加了一個先驗（例如在抛硬币的時候，我們認為出現正面的機率應該接近0.5）。

MAP試圖優化下式：

極大似然估計（MLE）和最大後驗估計（MAP）

兩個方法之間的關系可以由貝葉斯公式導出：

極大似然估計（MLE）和最大後驗估計（MAP）

當參數的後驗P(theta)服從均勻分布的時候，MLE=MAP。MAP可以看做是正則化後的MLE。

MLE（頻率學派）認為參數theta是一個未知的常量，需要從資料中估計出來。

MAP（貝葉斯學派）認為參數theta是一個随機變量，服從一個機率分布

MLE的缺點是如果資料集太小會出現過拟合。

MAP的缺點是使用不同的先驗會得到不同的結果。

極大似然估計（MLE）和最大後驗估計（MAP）

繼續閱讀

基于手寫數字識别資料集的機器學習方法對比研究

《統計機器學習與凸優化》教程 PPT 下載下傳

詳解支援向量機-軟間隔SVM-模型定義【白闆推導系列筆記】

論文筆記understanding black-box predictions via influence functions

python3 統計一個list的詞頻

統計學習方法筆記——第一章統計學習方法概論（3）

Andrew Ng機器學習筆記2——梯度下降法and最小二乘拟合

兩個多元高斯分布的Kullback-Leibler divergence(KL散度)

統計學習的基本概念

《統計學習方法》——學習總結（一）