定義
首先給出
貝葉斯網絡
的定義:
貝葉斯網絡
是一個
有向無環圖
(DAG: Direct Acyclic Graph),圖的節點表示随機變量X1, X2, …
圖中每個節點的
條件機率分布
(CPD: conditional probability distribution)為
P(Xi|ParG(Xi)))=P(Xi|X1,X2,...,Xn)
- 其中 ParG(Xi) 就表示除了 Xi 以外的所有節點。公式中的逗号表示“與”的關系。
是不是不太好了解?不用擔心,下面用執行個體告訴你怎麼了解個定義和公式。
一個活生生的 貝葉斯網絡
例子
貝葉斯網絡
下圖中的
有向無環圖
就是一個貝葉斯網絡。
圖中一共有5個随機變量:
- Difficulty:表示一門課程的難度
- d0 表示簡單, d1 表示難
- Intelligence:表示一個學生的智商
- i0 表示智商一般, i1 表示智商很高
- Grade:某門課程考試的成績
- g1(A) , g2(B) , g3(C) 分别表示成績為A,B,C(A表示成績最好)
- SAT:SAT考試成績
- s0 表示低分, s1 表示高分
- Letter:獲得推薦信
- l0 表示獲得一般的推薦信, l1 表示獲得很好的推薦信
從這個圖中,我們可以看出
- (1) 某門課程考試成績G,隻與課程的難度D和學生的智商I有關系,即
P(G|Par(G))=P(G|D,I,S,L)=P(G|D,I)
由這個結論,可以将貝葉斯網的鍊式法則簡化如下:
P(I,D,G,S,L)=P(I)P(D)P(G|I,D)P(S|I)P(L|G)
- (2) P(g1(A)|i1,d0)=0.9 說明,智商很好( i1 )的學生,在課程難度很低( d0 )的情況下,該門課程的考試成績得A( g1(A) )的機率較高(0.9)。
- (3) 聰明的學生( i1 ),在一門簡單課程( d0 )的考試中取得B( g2(B) ),還在SAT考試中取得高分( s1 ),并且獲得一般推薦信( l0 )的機率,用下式表示
P(i1,d0,g2(B),s1,l0)=P(i1)P(d0)P(g2(B)|i1,d0)P(s1|i1)P(l0|g2(B))
- (4) 從圖中可以看出,D與S是互相獨立的事件,即 P(D|S)=P(D) 。表示為 D⊥S 。
了解了這四個點,也就知道
貝葉斯網絡
能表示的内容了。
參考
- 機率圖模型:原理與技術。作者:Daphne Koller