天天看点

概率密度随笔分布函数与概率密度为什么使用概率密度边缘概率密度条件概率密度

分布函数与概率密度

在学习概率论与数理统计的时候,我始终没有搞明白分布函数和概率密度的意义。在这里趁着毕设的时候,做一次复习。

概率密度表示了随机变量的一个分布趋势,而分布函数表示概率密度的一个变上限积分。在下图中, f ( x ) f(x) f(x)就表示了一个概率密度函数,我们能从图中很明显看出原点两侧有两个峰值分布。设分布函数是 F ( x ) F(x) F(x),那么两者的关系是:

F ( x ) = ∫ − ∞ x f ( x ) d x + C F(x) = \int_{-\infty}^{x}f(x)dx + C F(x)=∫−∞x​f(x)dx+C

而且有 F ( + ∞ ) = 1 F(+\infty)=1 F(+∞)=1这个性质。

同样的,对于二维随机变量有:

F ( x , y ) = ∫ − ∞ + ∞ ∫ − ∞ + ∞ f ( x , y ) d x d y + C F(x,y) = \int_{-\infty}^{+\infty}\int_{-\infty}^{+\infty}f(x,y)dxdy+C F(x,y)=∫−∞+∞​∫−∞+∞​f(x,y)dxdy+C

其中 F ( + ∞ , + ∞ ) = 1 F(+\infty,+\infty)=1 F(+∞,+∞)=1

概率密度随笔分布函数与概率密度为什么使用概率密度边缘概率密度条件概率密度

如上图右侧所示,如果想要求解连续性变量在某个区间内概率,只需要利用概率密度在区间内积分即可。

为什么使用概率密度

在一维的情况下,可能我们认为有了分布函数,好像概率除了能象征性的表示一下分布的特征之外没有其他的用处。可是如果推广到高维,情况就不一样了。有很多情况下,只有分布函数是无法计算概率的。很简单,在二维随机变量分布中,二维随机变量与XOY平面围成的体积是1,即整个的概率分布。如果我们要计算一个环形区域的积分,那么这个区域是无法通过分布函数进行计算的,只能通过概率密度对这个区域进行积分才可以。随意某种意义上讲,概率密度更常用。

边缘概率密度

边缘概率密度表示我们只关心其中的一个自变量的变化范围,忽略另一个的影响。

F X ( x ) = F ( x , + ∞ ) = ∫ − ∞ x ∫ − ∞ + ∞ f ( x , y ) d y d x + C F_X(x) = F(x,+\infty) = \int_{-\infty}^{x}\int_{-\infty}^{+\infty}f(x,y)dydx+C FX​(x)=F(x,+∞)=∫−∞x​∫−∞+∞​f(x,y)dydx+C

那么对于概率密度来说:

f X ( x ) = ∫ − ∞ + ∞ f ( x , y ) d y f_X(x)=\int_{-\infty}^{+\infty}f(x,y)dy fX​(x)=∫−∞+∞​f(x,y)dy

对于 y y y的只需与 x x x交换位置即可。

如果 X X X与 Y Y Y相互独立,那么有

f ( x , y ) = f X ( x ) f Y ( y ) f(x,y)=f_X(x)f_Y(y) f(x,y)=fX​(x)fY​(y)

条件概率密度

这一点类比之前的条件概率

f X ∣ Y ( x ∣ y ) = f ( x , y ) f Y ( y ) f_{X|Y}(x|y)=\frac{f(x,y)}{f_Y(y)} fX∣Y​(x∣y)=fY​(y)f(x,y)​

继续阅读