天天看点

统计学基础(四)

数据分布的特征可以从哪些方面描述?

集中趋势,数据像中心值靠拢的程度。

离散程度,数据与中心值的远近程度。

分布形状,偏峰和蜂态。

比率数据为何选择几何平均数?

比率数据属于相对数据,不能像绝对数据那样相加,只能对其进行连乘。

如:产量去年比前年增长10%,今年比去年增长20%,今年相对去年的增长率=(1+10%)*(1+20)-1,如果用加法是没有意义的。

众数、中位数、平均数如何选择?

众数:不受极值影响,不具有唯一性,可能有多个或者0个众数。数据少时不适合使用。

中位数:中间位置的代表值,不受极值影响,分布偏斜程度大的时候使用更好。

平均数:数据对称或偏于正态分布时使用最好。缺点是容易受极端数据影响。偏态分布时候,可考虑中位数或者众数。

标准分数的作用?

1.Z分数给出数据的相对位置,不同量纲的数据进行处理时,需要使用标准化。

2.标准分数的平均数为0,标准差为1.

为什么有离散系数?

1.方差,标准差容易受到平均值的影响。容易受到水平高低的影响。如对比儿童身高,大人身高哪一组差异更大的时候。

2.方差、标准差与原变量的计量单位相同,如果是不同组别不同计量单位的数据无法进行对比。