通常随機實驗,建立在樣本空間上的随機變量不會隻有一個,比如研究一個家庭的生活水準,不但觀察月收入,還要觀察月支出。
一般,如果X,Y是定義在樣本空間S上的随機變量,那麼(X,Y)稱為二維随機變量(或稱二維随機向量),類似可以定義n維随機變量。
定義:設二維随機變量(X,Y)所有可能的取值為(xi,yj),(i,j=1,2,3…);(X,Y)取(xi,yj)的機率為pij,稱
P{X=xi,Y=yj}=pij為二維随機變量(X,Y)的分布律,也稱為X和Y的聯合分布律。
顯然pij>=0
∑ 1 ∞ ∑ 1 ∞ p i j = 1 \sum_{1}^{∞}\sum_{1}^{∞}p_{ij}=1 ∑1∞∑1∞pij=1
同理,對于連續型随機變量,有 ∬ − ∞ ∞ f ( x , y ) d x d y = 1 \iint_{-∞}^{∞}{f(x,y)dxdy}=1 ∬−∞∞f(x,y)dxdy=1
(X,Y)落在某一區域G的機率P{(X,Y)∈G}= ∬ G f ( x , y ) d x d y \iint_{G}^{}{f(x,y)dxdy} ∬Gf(x,y)dxdy
同理,可以定義二維連續随機變量的分布函數
F(x,y)=P{(X≦x)∩(Y≦y)}=P{X≦x,Y≦y}稱作二維随機變量的分布函數
F(x,y)值描述的是二維随機變量落在下圖陰影區的機率:
上面講的是聯合分布,對于二維随機變量,自然也會有X,Y各自單獨的分布,稱為邊緣分布。
對于離散型随機變量,由于可以看作一個矩陣:如圖:
Y/X | y1 | y2 | y3 | … | yn |
---|---|---|---|---|---|
x1 | p11 | p12 | p13 | … | p1n |
x2 | p21 | p22 | p23 | … | p2n |
x3 | p31 | p32 | p33 | … | p3n |
… | … | … | … | … | … |
xi | pi1 | pi2 | pi3 | … | pin |
… | … | … | … | … | … |
xm | pm1 | pm2 | pm3 | … | pmn |
很顯然,單純研究X=xi時候,P{X=xi}=pi1+pi2+pi3+…+pim= ∑ j = 1 m p i j \sum_{j=1}^{m}p_{ij} ∑j=1mpij
同理推出:
P{Y=yj}=p1j+p2j+p3j+…+pnj= ∑ i = 1 n p i j \sum_{i=1}^{n}p_{ij} ∑i=1npij
二維連續性随機變量也類似,隻不過連加變成積分而已。對于P{X=xi}是對y積分,P{Y=yj}是對x積分。比如,已知(X,Y)是連續型随機二維變量,而且其機率密度函數為f(x),求X在[a,b]區間的機率,計算公式為:
∫ a b [ ∫ − ∞ ∞ f ( x , y ) d y ] d x \int_{a}^{b}[\int_{-∞}^{∞} f(x,y)dy]dx ∫ab[∫−∞∞f(x,y)dy]dx
二維随機變量的條件分布
二維随機變量的條件分布從機率的條件分布而來,研究的是當xi或者yj已知的條件下,yj或xi的分布規律,借助機率的條件分布表達式,可以寫出形如下面的二維随機變量條件分布表達式:
P{Y=yj|X=xi}= P { X = x i , Y = y j } P { X = x i } ( j = 1 , 2 , 3... ) \frac{P\left \{ X=x_i,Y=y_j\right \}}{P\left \{ X=x_i \right \}} \quad \quad (j=1,2,3...) P{X=xi}P{X=xi,Y=yj}(j=1,2,3...)
以上公式描述為:設(X,Y)的機率密度為f(x,y),邊緣機率密度分别為fx(x)和fy(y),則條件機率密度fY|X(y|x)= f ( x , y ) f x ( x ) \frac{f(x,y)}{f_{x}(x)} fx(x)f(x,y),也即:f(x,y)=fx(x)*fY|X(y|x)=fy(y)*fX|Y(x|y)
上面的公式推導原理如下:
對于離散型随機變量,我們可以計算X=xi時候yj的機率,但是對于連續性随機變量,無論對于xi還是yj,由于積分都是0(由于是某一個點,積分區間是0,是以積分也是0)不是直接套用離散型的公式,但是借助微分和極限的方法,我們可以如下求近似值:P(a≦Y≦b,x≦X≦x+ε)ε→0= P ( x ⩽ X ⩽ x + ε , a ⩽ Y ⩽ b ) P { x ⩽ X ⩽ x + ε } \frac{P\left ( x\leqslant X\leqslant x+\varepsilon ,a\leqslant Y\leqslant b\right )}{P\left \{ x\leqslant X\leqslant x+\varepsilon\right \}} P{x⩽X⩽x+ε}P(x⩽X⩽x+ε,a⩽Y⩽b)=$$
公式編輯好麻煩好累啊。手寫看圖吧:
上圖中的F稱為已知X=x條件下Y的條件分布函數
我們可以推出FY|X(y|x)= ∫ − ∞ x f Y ∣ X ( y ∣ x ) d y \int_{-\infty }^{x}{f_{Y|X} \left ( y|x \right )}d_y ∫−∞xfY∣X(y∣x)dy
FY|X(y|x)=fy|x(y|x)對于y積分