資料分布的特征可以從哪些方面描述?
集中趨勢,資料像中心值靠攏的程度。
離散程度,資料與中心值的遠近程度。
分布形狀,偏峰和蜂态。
比率資料為何選擇幾何平均數?
比率資料屬于相對資料,不能像絕對資料那樣相加,隻能對其進行連乘。
如:産量去年比前年增長10%,今年比去年增長20%,今年相對去年的增長率=(1+10%)*(1+20)-1,如果用加法是沒有意義的。
衆數、中位數、平均數如何選擇?
衆數:不受極值影響,不具有唯一性,可能有多個或者0個衆數。資料少時不适合使用。
中位數:中間位置的代表值,不受極值影響,分布偏斜程度大的時候使用更好。
平均數:資料對稱或偏于正态分布時使用最好。缺點是容易受極端資料影響。偏态分布時候,可考慮中位數或者衆數。
标準分數的作用?
1.Z分數給出資料的相對位置,不同量綱的資料進行處理時,需要使用标準化。
2.标準分數的平均數為0,标準差為1.
為什麼有離散系數?
1.方差,标準差容易受到平均值的影響。容易受到水準高低的影響。如對比兒童身高,大人身高哪一組差異更大的時候。
2.方差、标準差與原變量的計量機關相同,如果是不同組别不同計量機關的資料無法進行對比。