天天看点

概率密度函数估计的引入概率密度函数估计的引入

概率密度函数估计的引入

采用贝叶斯决策需要已知两种知识:

  • 各类的先验概率 P ( w i ) P(w_i) P(wi​)
  • 各类的条件概率密度函数 ρ ( x ∣ w i ) \rho(x|w_i) ρ(x∣wi​)

在已知上述两种知识的前提下,才能够对未知样本进行分类。

我们希望:当样本数 N → ∞ N \rightarrow \infty N→∞时,得到的分类器能收敛于理论上的最优解。而在实际问题中,我们仅已知有限数目的样本。

类的先验概率的估计方法

:( P ( w i ) P(w_i) P(wi​))

  • 用训练数据中各类出现的频率来估计
  • 依靠经验

类条件概率密度函数的估计

:( ρ ( x ∣ w i ) \rho(x|w_i) ρ(x∣wi​))

  • 参数估计:概率密度函数的形式已知,参数未知,需要通过训练数据来估计(矩估计、最大似然估计、Bayes估计)
  • 非参数估计:概率密度函数的形式未知,利用训练数据直接对概率密度进行估计( k n kn kn-近邻法、Parzen窗法)

继续阅读