天天看点

朴素贝叶斯(1)

样本变量X,其中一个样本x,

n个属性 A_1,A_2,...A_n

样本的x的属性取值x=(x_1,x_2,...x_n)

样本有k个类别,C={c_1,c_2,...c_k}

则样本x属于类别c_i的概率为P(Y=c_i|X=x_i),即在样本x属性取值为x=(x_1,x_2,...x_n)的情况下属于类别c_i的概率

于此我们计算属于所有类别的概率取概率最大的情况,公式:

c=argmax_{c_i \in C}P(c_i|x)=argmax_{c_i \in C}P(c_i|x_1,x_2,...x_n)

其中argmax是取函数取最大值时的参数

使用贝叶斯公式:P(c_i|x)=\frac{P(x|c_i)P(c_i)}{p(x)}

得到

c=argmax_{c_i \in C}P(c_i|x)=argmax_{c_i \in C}P(x|c_i)P(c_i)\\P(x|c_i)=P(x_1,x_2,...x_n|c_i)\\=P(x_1|x_2,...x_n,c_i)P(x_2,x_3,...x_n|c_i)\\=P(x_1|x_2,...x_n,c_i)P(x_2|x_3,...x_n,c_i)P(x_3,...x_n|c_i)\\=...