天天看點

統計學基礎(四)

資料分布的特征可以從哪些方面描述?

集中趨勢,資料像中心值靠攏的程度。

離散程度,資料與中心值的遠近程度。

分布形狀,偏峰和蜂态。

比率資料為何選擇幾何平均數?

比率資料屬于相對資料,不能像絕對資料那樣相加,隻能對其進行連乘。

如:産量去年比前年增長10%,今年比去年增長20%,今年相對去年的增長率=(1+10%)*(1+20)-1,如果用加法是沒有意義的。

衆數、中位數、平均數如何選擇?

衆數:不受極值影響,不具有唯一性,可能有多個或者0個衆數。資料少時不适合使用。

中位數:中間位置的代表值,不受極值影響,分布偏斜程度大的時候使用更好。

平均數:資料對稱或偏于正态分布時使用最好。缺點是容易受極端資料影響。偏态分布時候,可考慮中位數或者衆數。

标準分數的作用?

1.Z分數給出資料的相對位置,不同量綱的資料進行處理時,需要使用标準化。

2.标準分數的平均數為0,标準差為1.

為什麼有離散系數?

1.方差,标準差容易受到平均值的影響。容易受到水準高低的影響。如對比兒童身高,大人身高哪一組差異更大的時候。

2.方差、标準差與原變量的計量機關相同,如果是不同組别不同計量機關的資料無法進行對比。