天天看点

假设检验 - 参数检验 非参数检验 - 置信区间

  1. 假设检验

    小概率事件和反证法的应用。

    H0:原假设

    H1:备选假设

    解释:假设在H0前提下,我们得到目前手头上的样本,定义为一个概率事件,概率为α(0.05, 0.01, 0.001),是小概率事件。通过公式计算P值,P<α, 则确认我们得到目前手头上的样本是一个小概率事件,而小概率事件在一次试验中是不可能发生的,但事实发生了,则原假设错误,接受备选假设。

    正经解释:

    H0:只存在抽样误差,不存在系统误差

    H1: 存在抽样误差和系统误差

    在只存在抽样误差的前提下,我们得到目前样本的概率为P,如果P<α,则证明不只是存在抽样误差,还存在系统误差。

在参数检验中,像t分数,F统计量,卡方统计量等,它的分布是什么形式的,统计学家已经算出来。之所以有分布,是因为变异的存在,分布就是描述变异的规律。

Z分布是均值,率分布规律

T分布是均值差的分布规律

F分布是方差比的分布规律

x2是方差、实际频数和理论频数的分布规律

接着来:

1. 参数检验思想

以 t 分布为例,t 分布是说从均值为u, 方差为 sigma方的正态分布总体中,随机抽取样本量为n的样本,用均值差 / 标准误,抽一次得到一个 t 分数,抽一万次得到一万个 t 分数(这只是描述,实际密度函数是人家推导出来的),从而得到 t 分布规律。

这就是说,在只有抽样误差的时候(因为这就是进行的反复抽样,像正态分布是对样本不停抽样,计算均值一样),95% 的 t 分数是( x1, x2)之间。

提前设定一个拒绝水平(也就是概率值),也就是犯错概率,就是阿尔法,当 t 分数落到拒绝域对应的区间,我们认为只有抽样误差的时候,我们认为 t 是不可能落在这个范围。alpha这么小,如果我们还犯错,我们认了。

95%解释:

  1. 在只有抽样误差的时候,抽样一百次,95个 t 分数是( x1, x2)之间。如果样本 t 分数不属于这95个之一,我们拒绝原假设。

95%置信区间:

在拒绝原价设的前提下,我们用固定的试验方法做一百次试验,计算100个计算区间,有95个包含总体均值。

其实这有两个95%,第一个是拒绝原假设时,我们有5%几率犯错,第二个是在我们这次试验中,我们计算出一个置信区间,也有5%几率犯错。

本文来自博客园,作者:Iving,转载请注明原文链接:https://www.cnblogs.com/SAS-T/p/15544948.html

继续阅读