目錄
- 寫在前面
- 概述
-
- 什麼是統計?
- 統計.計算機與統計軟體
- (重點)變量及其分類
- 資料收集
- 第二章
-
- 問卷的組成和結構
- 幾種典型的問卷題型:
- 第三章:資料的錄入和清理
-
- 資料的錄入
- 資料的清理
- 3.4在Excel中核對資料
-
-
- 建立調查問卷的SPSS資料檔案
-
- 第4章單變量的一維頻率分析
-
- 利用SPSS對單選題進行一維頻率分析
- 利用Excel對單選題進行一維頻率分析(重點)
-
- 1.在Excel中,将SPSS格式的一維頻率分析表轉換為調查報告所需的格式
- 2.在Excel中根據頻率進行排名
- 1.圖形化操作
- 2.使用函數進行排名(rank函數)
- 如何使用Word編輯一維頻率分布表(重點)
- 在Excel中繪制一維頻率分布統計圖(重點)
- 利用SPSS對填空題進行一維頻率分析
- 利用Excel對填空題進行一維頻率分析(重點)
- 根據頻率排名
- 撰寫調查報告
- 第5章雙變量的交叉表分析
-
- 在SPSS中進行兩個單選題的交叉表分析
- 在Excel中繪制兩個單選題的交叉表統計圖
- 在Excel中利用資料透視表實作一維頻率分析和交叉表分析
-
- 在SPSS中使用資料透視表實作一維頻率分析
- 在SPSS中使用資料透視表實作雙變量交叉表分析
- 第6章多選變量的一維頻率分析和交叉表分析
-
- 多選變量使用二分法進行一維頻率分析
- 多選變量使用分類法進行一維頻率分析
- SPSS中實作多選題的交叉表分析
- 在Excel中對多選變量進行一維頻率分析
-
- 在Excel中對多選變量使用分類法進行一維頻率分析
- 在Excel實作二分法編碼多選題的一維頻率分析
- Excel中對使用分類法編碼多選變量的交叉表分析
- Excel中對使用二分法編碼多選變量的交叉變分析
- 第7章描述統計分析
-
- 描述統計分析
-
- 均值
- 衆數
-
- 在Excel中來統計衆數
- 中位數
-
- 在Excel中求中位數
-
- 奇數個資料求中位數
- 偶數個資料求中位數
- 不論資料的個數,直接求中位數
- 離散程度
- 極差
- 标準差
-
- 在Excel中求标準差
- 方差
- 資料的标準得分
- 利用SPSS實作`定量變量的`描述統計分析
- 利用SPSS實作`定量變量`的多組均值比較
- 利用SPSS實作`有序變量的`描述統計分析
- 利用SPSS實作`有序變量`的多組均值比較
- 利用Excel"描述統計"分析工具實作矩陣題的統計分析描述
寫在前面
本篇文章介紹的是基于Excel和SPSS的資料分析和資料可視化操作.大資料時代,我們每天接受的資料量是巨大的,隻有分析資料之間的聯系進而才可能得到商機和"錢"途,本篇文章将從最基礎的概念入手到實際的對資料的分析實戰,從Excel和SPSS兩個方面對資料進行分析.
概述
基于SPSS和Excel寫了的調查資料分析
什麼是統計?
統計學
是用已收集資料.分析資料并進而由資料得出結論的一組概念.原則和方法,因而也有人稱統計學為統計方法
統計.計算機與統計軟體
SPSS和Excel
(重點)變量及其分類
變量:用來描述總體中成員的某一特性
資料收集
第二章
問卷的組成和結構
問卷組成:封面信(目的).指導語(如何填寫問卷).問題.答案.編碼幾個部分組成
問題可分為開放式問題和封閉式問題:
編碼:指的是将問題和答案用一個字母或者數字來代替
問卷的結構:開頭,正文(調查資訊和背景資料)和結尾(可以設定開放題,征詢被調查者的意見或者感受,也可以是感謝語以及其他補充說明)三部分組成
幾種典型的問卷題型:
1填空題(一般就是填數字的填空題,讓調查者容易回答,容易填寫的問題可以設定為填空題)
2.二項單選題:
問題的答案隻有是和不是(或其他形式但是隻有肯定和否定兩種形式)
回答者根據自己的情況選擇其一
3.多項單選題
給出的答案至少在兩個以上,回答者根據自己的情況選擇其中一種作為回答,這是各種社會調查問卷中采用最多的一種問題形式,其答案特别适合進行頻率分析和交叉分析,在設計上,這種問題形式的關鍵之處是保證答案的窮盡性和互斥性
4.多項限選題
多項限選也稱為限選不排序,與多項選一(多項單選題)有所不同的是,可以在所列舉的多個答案中,要求回答者根據自己的情況選擇若幹個
5.多項排序選(後面處理這種問題是需要權重值進行處理的)
多項排序選也稱為限選排序,這種題目可以是針對多項限選題(限選不排序)的不足而出現的一種問題類型,在一定程度上可以看成是多項單選題和多項限選題的一種結合.
6.多項任選題
多項任選也稱為不限選.多項任選題是在所提供的的答案中,被調查者可以任意選擇各種不同答案的一種問題形式.
7.矩陣題(表格題)
采用矩陣(表格)的形式将同一類型的若幹個問題集中在一起,構成一個"大"問題矩陣題通常采用李克特量表
8.相倚問題
答案的設計
窮盡性和互斥性
窮盡性:表示了答案包括了所有可能的情況
互斥性:指的是答案之間不能交叉重疊或互相包含
量表
量表主要是用來測量人們的感覺或者主觀判斷,它的測量邏輯是假定有相同主觀感覺的人會在一個由弱到強的連續線段(次元)的相同位置,标出自己的感覺.
(1)李克特量表 (答案類型在4~8個之間)
(2)博加德斯社會距離量表
(3)語義差異量表(要确定的是人們對于某一事件或者事務的感覺,先找到最強和最弱,然後分為不同的等級,一般為7分等級)
第三章:資料的錄入和清理
資料的錄入
在統計分析之前,必須将問卷資料錄入計算機,而在錄入之前需要對錄入的資料進行核對和清理
Excel技巧:
要改動多個單元格的值為同一個值時
在Ctrl選擇多個單元格,寫要修改的值然後按Ctrl+Enter确定.
1.單選題的錄入(注意題目和答案都用字母或者數字表示)
2.多項單選題
3.多項限選題(兩種處理方式:二分法和分類法):建議使用分類法,這樣變量的取值比較少
二分法
二分法的關鍵是:把每個小答案都分為兩份,選或者不選(選擇這個小選項則用1表示,否則置空表示不選)
二分法:有幾個選項就取多少個變量,每個變量有兩個取值,一個是1,一個是空,做多限選的個數就是變量中最多能選擇的個數.
分類法:
分類法:是隻有三個(幾項限選就是幾個)變量,每個變量的取值都可以是任意的一個答案選項代表的數字或者字母.
相當于把答案分為了n類,每個變量的取值都可以是任意一個選項
二分法相當于把每個選項分為兩類,選或者不選
4.多項不限選(推薦使用二分法)
在Excel中求均值.最大值.最小值
均 值 : = a v e r a g e ( 單 元 格 範 圍 ) 最 大 值 = m a x ( 單 元 格 範 圍 ) 最 小 值 = m i n ( 單 元 格 範 圍 ) 均值: = average(單元格範圍) \\最大值 = max(單元格範圍) \\最小值 = min(單元格範圍) 均值:=average(單元格範圍)最大值=max(單元格範圍)最小值=min(單元格範圍)
如果是處理填空題中的求均值,一般把一組資料中的組中值作為該組的度量的标準參與計算,這裡可能會使用到if函數
在Excel中使用if函數
= i f ( 函 數 條 件 , 真 值 , 假 值 ) 注 意 : i f 函 數 是 可 以 嵌 套 的 = if(函數條件,真值,假值) \\注意:if函數是可以嵌套的 =if(函數條件,真值,假值)注意:if函數是可以嵌套的
量表:
排序題:
資料的清理
- 資料有效範圍的清理
- 對資料中的奇異值進行清理,例如:在資料錄入中,性别男用1,女用2,那麼3就屬于奇異值
- 資料邏輯一緻性的清理
- 在相倚問題和多項限選題中出現較多,如有問題1:您是否有手機,問題2:您的手機平均月費,那麼就不能沒有手機還有月費
- 資料品質的抽查
3.4在Excel中核對資料
- 篩選出範圍不合理的單列
- 在Excel中核對"大小适中"的資料
- 用自動篩選找出不合理的關聯題
- “是否有手機"和"平均月費”
- 用進階篩選找出重複的記錄
- 重複記錄
簡單篩選:僅僅隻篩選出一個選項不符合範圍的問卷(這樣可能會導緻我們需要多次篩選才能得到所有的不符合範圍的問卷的編号)
步驟:
- 點選篩選
- 在标題中選擇不合理的範圍或者自己定義不合理範圍的篩選條件
進階篩選出所有不符合範圍的問卷
分為兩種,
條件是或還是與(不符合一個就篩選出來還是全部不符合才篩選出來)
步驟:
- 複制要篩選的部分的列标題,粘貼(細節:和本來的資料之間至少隔3行)
- 寫條件
- 與(全部不符合才篩選出來):與條件寫在一行
- 或(不符合一個就篩選出來):不能寫在同一行
- 點選進階篩選:将篩選結果複制到其他位置
- 清單區域:選擇的就是我們原資料區域的(所有原資料區域)
- 條件區域:點選選擇我們寫的條件區域
- 複制到:指的是篩選結果複制到,點選選擇一個單元格(因為我們不知道我們的篩選結果到底有多少),注意和條件區域也最少隔3行
避免錄入資料時超出有效範圍
- 選中要輸入資料的區域
- 點選資料---->資料有效性(設定合适的資料有效性的允許值)
- 點選來源------>選中我們資料的來源
這樣在資料錄入時,我們就隻能輸入規定的數值
同時還可以設定出錯警告來給出友好的提示資訊.
對于"沒有手機’'和"有平均月費"的問題,
1.我們可以通過多次普通篩選(在篩選基礎上篩選)來得出結果
2.通過if函數标記處奇異值
=if(and(b2=2,F3<>""),“F”,""):表示的是如果B2的列的值為2且F3的列的值不為空,就用F标記,否則用空标記
解決有邏輯錯誤的重複值(多項限選題的邏輯不一緻性的解決靠函數)
如:你購買的原因1和購買原因2相同,就是邏輯錯誤的
也可以适用多重篩選來得到結果,但是如果答案的選項很多,就很複雜
我們同樣使用函數來解決這個問題
主要是學習or函數的使用
=IF(COUNT(C2:E2)<2,"",IF(OR(C2=D2,D2=E2,C2=E2),“F”,"")):
表示的含義是:從外層開始解釋
如果C2到E2的數小于2,即填寫的原因隻填寫了1個,或者沒填寫,這時置空,否則:
判斷如果C2=D2,D2=E2,E2=C2中有一個符合就置為"F",都不符合就置為空
篩選出重複的記錄
有的記錄是完全重複的記錄,我們需要将其删除
建立調查問卷的SPSS資料檔案
- 在變量視圖中建立變量充當問題,值填寫(選項)
- 不同種類的問題,在SPSS中使用不同的政策,比如:
- 單選題:直接在值中輸入不同選項的答案
- 多項限選題:采用分類法,限選幾項就建立幾個變量,變量的值是所有的選項
- 多項任意選:采用二分法,為為每一個選項建立一個變量,值可以是兩種,選中或者不選中(比如1代表選中而空代表未選中----這樣設定之後儲存為Excel檔案時,打開檔案空的地方會顯示#Null,這時可使用替換所有來把#Null替換為空 ----操作:開始 ----查找替換)
- 當建立錄入了SPSS檔案時,這時我們就可以對SPSS檔案進行儲存和另存為.SPSS檔案的字尾是.sav
第4章單變量的一維頻率分析
- 頻率分析是所有問卷調查中最廣泛使用的分析技巧
- 因為頻率分布表的建表方式簡單,分析容易,閱讀容易
- 基本統計分析往往從頻率分析開始
- 通過頻率分析,能夠在一定程度上反映出樣本是否具有總體代表性,抽樣是否存在系統偏差
- 頻率分析的基本任務:
- 1.編制頻率分布表
- 2.繪制統計圖(最直接的資料刻畫方式)
利用SPSS對單選題進行一維頻率分析
分析菜單-------描述統計------頻率------具體操作
區分概念:
在SPSS中生成的頻率分布表中有百分比,有效百分比,累計百分比
- 頻數/問卷數===百分比
- 頻數/有效問卷數(部分問卷可能對該問題沒有回答)===有效百分比 我們在調查報告中的百分比指的就是有效百分比
- 累計百分比是根據我們分析的順序對百分比進行累加
利用Excel對單選題進行一維頻率分析(重點)
兩個步驟:
1.在Excel中,将SPSS格式的一維頻率分析表轉換為調查報告所需的格式
在已生成的SPSS的一維頻率分析表上單擊右鍵----複制------在Excel中粘貼
把我們需要的資料摘抄和進行資料格式的轉換(百分數)
2.在Excel中根據頻率進行排名
1.圖形化操作
左鍵單擊選中要排序的資料列-----在資料頁籤------排序-----在
或者:
資料------排序------操作選擇要排序的列
2.使用函數進行排名(rank函數)
rank(參數1,參數2,參數3):進行排序的函數
- 第一個參數:需要排序的單項列:如C2
- 第二個參數:需要排序的列的範圍,如:C2:C8,為了使用排序函數時排序區間不發生變化,這時我們要使用單元格的絕對引用方式------選中C2:C8按下F4将單元格變成$C 2 : 2: 2:C48
- 第三個參數:排序時使用的排序順序0代表降序(預設),1代表升序排序
=RANK(C2,$C 2 : 2: 2:C$8,0):需要排序根據的是C2的列(單項),排序範圍是C2:C8,使用的排序方式是降序排列
注意這種排序的方式使用的是:美式排序,如果有相同的排名就會頂替掉一些排名,如:1,2,2,4,5
COUNTIF(範圍(為了範圍不發生變化,使用絕對引用),表達式)函數,統計函數:能夠統計在某一範圍中,表達式出現的次數
如:COUNTIF($B 2 : 2: 2:B$1001,E2)
如何使用Word編輯一維頻率分布表(重點)
在Excel中繪制一維頻率分布統計圖(重點)
單選題的一維頻率統計圖可以是餅圖,柱形圖,條形圖,但是優選餅圖,因為單選題的頻率之和為100%
繪制單選題的一維頻率分布圖餅圖
(1)選取要繪制餅圖的資料來源同時Ctrl選中資料對應的百分比
(2)插入-----餅圖
(3)可以修改圖表的标題名稱和字型大小
(4)不顯示圖例
(5)點選餅圖-----布局----資料标簽-----設定資料标簽格式(顯示類别名稱和值):選擇資料标簽外和按照分行符的格式來顯示
(6)設定圖表樣式—其中樣式26是立體的樣式
柱形圖和條形圖的繪制方法基本上和餅圖的方法相同
在Excel中繪制的圖表會和我們的資料相關聯,當我們的資料發生變化時,圖表的資訊也會發生變化,可實作實時資料的可視化顯示
利用SPSS對填空題進行一維頻率分析
因為填空題所填的數字(數值)的可能性很多,我們不能使用分類法來對所填的資料進行統計一維頻率分析,也不能使用二分法進行一維頻率分析.是以,我們需要先在SPSS中對資料進行分組和轉換.
轉換----------重新編碼為不同的變量------具體操作
轉換後我們可能需要在變量視圖中對值的标簽中填充我們的值内容
然後點選分析------一維頻率分析------選擇新編碼出來的變量進行分析
就可以得到分析出來的結果
利用Excel對填空題進行一維頻率分析(重點)
2.使用Excel計算學生的期末的最終成績
計算百分總成績:=B220%+C2505+D2*30%
最終成績是使用了一個用于四舍五入的ROUND(範圍單列,保留小數位數):=ROUND(E2,0)
需要突出分數<60分的成績:開始------條件格式-------突出或建立規則------具體操作
完成最終的成績統計
1.使用COUNTIF函數來做:符合條件就統計(可以用多條件來實作複合條件)
=COUNTIF(範圍,條件)
=COUNTIF($F 2 : 2: 2:F$69,"<=60")
使用多條件來實作複合條件的篩選
=COUNTIF($F 2 : 2: 2:F 69 , " < = 90 " ) − C O U N T I F ( 69,"<=90")-COUNTIF( 69,"<=90")−COUNTIF(F 2 : 2: 2:F$69," >=80")
需要注意條件要用雙引号括起來,範圍為了拖動時不發生錯誤要使用絕對位置
2.使用COUNTIFS函數來做:符合複合條件就統計
=COUNTIFS($F 2 : 2: 2:F 69 , " < = 90 " , 69,"<=90", 69,"<=90",F 2 : 2: 2:F$6," >=80")
根據頻率排名
前面介紹過了RANK函數
撰寫調查報告
标題小三的字型大小(宋體)
正文小四的字型大小(宋體)
1.5倍行距(在段落中設定)
表例和圖例的字型大小一般比正文小一号字(一般為五号字)
注意表例要在表的上方
圖例要在圖的下方
在word中我們的單詞可能會下面有紅線,找到審閱------拼寫和文法-----選擇忽略所有
在word中撰寫調查報告時插入的表格中列有表格對不齊的情況:選中對不齊的列,按下ALT鍵進行微調對準
在word中插入我們在Excel中制作好的統計圖時,我們選擇粘貼的方式如果是圖檔,那麼在Excel中資料發生變化時,我們在word中插入的統計圖是不會發生變化的,但是預設的粘貼的方式是,粘貼為圖形對象,就是在Excel中的資料發生變化,在word中的統計圖表也會發生變化
第5章雙變量的交叉表分析
市場調查和民意調查,經常利用交叉表來分析兩個分類(定性)變量之間的關系,比如:性别與品牌偏好.教育程度(學曆)與使用品牌.收入與是否有數位相機.性别與行動電話類型偏好.地區與行動電話類型偏好,等等
在SPSS中進行兩個單選題的交叉表分析
分析-------描述統計-------交叉表------選擇行----選擇列------單元格中百分比選擇行
要注意是描述的是誰和誰的關系的分析,性别與幸福感,則性别作為交叉表的行變量
然後将表複制到Exce中,進行簡單的處理
然後使用Ctrl選中綠色和藍色來繪制圖表,我們在Excel中繪制圖表,不同的圖表的差別很大,我們首選繪制的是百分比堆積柱狀圖-------簇狀柱形圖-------簇狀條形圖
在Excel中繪制兩個單選題的交叉表統計圖
經過在SPSS中進行交叉表的分析和在Excel中對統計圖的簡單繪制我們得到了如下的結果
接下來,我們需要調整圖表的系列
設計------切換行/列
将資料标簽顯示在圖表的内部:布局------資料标簽----選擇資料标簽内
删除網格線:單擊網格線,按下DEL鍵
設定坐标軸格式:單擊選擇設定坐标軸格式------坐标軸選項----選擇固定填寫0.2
設定立體感:設計—樣式—選擇立體的樣式
設定一個圖表标題:布局----圖表标題----圖表上方–輸入标題(修改字型大小)
最終效果:
在Excel中利用資料透視表實作一維頻率分析和交叉表分析
在SPSS中使用資料透視表實作一維頻率分析
插入-----資料透視圖—選擇資料範圍----選擇放置資料透視表的位置(一般選擇新的工作表)
關于資料透視表的操作:
概念:
- 行标簽:行标簽
- 列标簽:列标簽
- 數值:選擇要添加到資料透視表的字段(BH)到數值就可以分析字段
- BH表示計數項
- 可選的BH的計算項類型:在計數項上單擊----選擇值字段設定:求和,求平均值,最大值,最小值,乘積計數等
- 其中百分比的生成可以依靠在選擇字段設定時選擇計數再選擇值顯示方式中選擇占同列資料綜合的百分比
再對資料透視表進行操作:
複制篩選合适的資料,使用函數或者圖形化操作生成表格.
根據表格就可以生成統計圖
在SPSS中使用資料透視表實作雙變量交叉表分析
雙變量交叉表分析在Excel中分析就是在透視表中不僅有行标簽而且有列标簽,這樣就實作了行列雙變量,而數值就是實作的是對雙變量的交叉分析.
第6章多選變量的一維頻率分析和交叉表分析
多選變量使用二分法進行一維頻率分析
多選變量:指的就是我們之前所遇到的那種多項不限選題和多項限選題
我們要處理這些問題的資料,我們需要先在SPSS中對資料進行處理
我們這裡舉例說明一個多項不限選問題的一維頻率分析和交叉表分析
首先看一維頻率分析,對于多項不限選,現在SPSS中
- 首先要将該問題的所有選項定義成一個變量集(不論是做一維頻率分析還是交叉表分析都需要先定義變量集)
- 分析--------多重響應---------定義變量集---------把選項都拖進去----------要注意将變量轉化為(如果我們的選項的處理方式是二分法(也就是我們的題目是多項不限選),就選擇二分法計數值填寫1,如果我們的問題是分類法處理的,我們就選擇類别,然後确定範圍[ ]到[ ])-------名稱寫我們變量集的名稱
- 生成了我們的變量集之後:我們對多項不限選問題進行一維頻率分析
- 分析-------參數響應------頻率----------具體操作
注意變量的含義
- N都表示的是回答的次數(選擇這個選項的次數)
- 百分比是N回答次數(比如559)占總回答次數(1108)的百分比
- 個案百分比:該選項被選擇次數()559在總個案數(總回答人數,714)中所占的百分比
這樣就在SPSS中生成了對多項不限選題的一維頻率分析
接下來就要把SPSS中的一維頻率分析的結果在Excel中轉化為調查報告所需的格式.
- 排序可使用rank函數或者圖形化操作
- 排名可以簡單生成:(就是在排序後,數字1然後簡單拖動),或者直接使用rank函數
接下來我們需要根據圖表對多項不限選題進行繪制統計圖
注意:多項不限選題目我們繪制統計圖時首先推薦繪制條形圖和柱形圖,而不能繪制餅圖,因為我們的百分比超過了100%(我們需要分析的是個案百分比)
格式調整之後:
最後就可以在word中做調查報告
多選變量使用分類法進行一維頻率分析
多選變量使用分類法是多項限選題
對于使用分類法的多選題的一維頻率分析,我們
- 先定義變量集(和使用二分法重新定義變量集的方式相同)
- 需要注意的是将變量編碼為選擇**類别:**然後填寫類别
- 然後得到了頻率分析的結果,然後就在Excel中進行操作
SPSS中實作多選題的交叉表分析
- 先檢視要分析的交叉表的問題選項的最大值和最小值
- 分析-------------多重響應----------交叉表------------選擇分析的行(這裡要填寫行的最大值和最小值)--------填寫列(列就是我們重新編碼的變量集)
- 在選項中選擇:---------單元格百分比(選擇行)---------百分比基于(個案)
就得到了多選題的交叉表分析:
然後将表格複制到Excel中進行操作
複制後我們要重新建構表,技巧:原來的表頭是橫着排列的,我們需要其豎着排列.複制原表頭,選擇性粘貼中選擇轉置,對于其他的有橫豎轉換的粘貼,都可以使用到轉置的技巧
在Excel中對多選變量進行一維頻率分析
在Excel中對多選變量使用分類法進行一維頻率分析
在Excel中要求能向下拖動而保證範圍不變,一般改變的是第二個參數,要保證橫向拖動而範圍不變,一般改變的是第一個參數
在Excel實作二分法編碼多選題的一維頻率分析
Excel中對使用分類法編碼多選變量的交叉表分析
Excel中對使用二分法編碼多選變量的交叉變分析
方法和分類法的方法相同.
第7章描述統計分析
描述統計分析
問卷回收後,對于數值型資料(定量資料),通常會以均值.中位數.衆數等統計量來描述其集中趨勢,也會以标準差.最小值.最大值.極差等統計量老描述其離散程度
均值
- 描述的是統計量的集中趨勢
- 樣本值的平均值.均值是度量資料集中趨勢的常用統計量.在參數估計及假設檢驗中經常用到
衆數
- 統計學名詞,在統計分布上具有明顯集中趨勢點的數值,代表資料的一般水準(衆數不存在或者多餘一個)
- 當數值或觀察者沒有明顯的順序時,使用衆數很有用
在Excel中來統計衆數
- x選中要求衆數的資料--------資料标題欄-----排序(升序降序無所謂,要求資料的衆數,先要對資料進行排序,才能便于我們進行分類彙總)
- 資料标題欄---------分類彙總(對誰進行排序就對誰進行分類彙總)
中位數
- 一組資料排序後位于中間位置上的數
- 中位數是用中間位置上的數值(求出均值)代表資料的集中趨勢,其特點是不易受極端值的影響,是以中位數比均值
穩健
在Excel中求中位數
注意
- 中位數在資料的個數是奇數和偶數時是不同的
- 在Excel中求中位數,我們資料得出的中位數的位置都需要加1才是真實的資料位置,因為我們的标題通常要占據一行
分析了在資料是偶數個和奇數個時求中位數的方法,得出了一個統一的方法是:(資料個數+1)/2
奇數個資料求中位數
- 用到的函數:COUNT()函數,用于求出公式中的中位數的位置(非在Excel中真實的位置)
- address()函數,需要三個參數
- 第一個參數:表示行
- 第二個參數:表示列
- 第三個參數:表示資料是絕對引用還是混和引用
- indirect(取資料的位置坐标):用于取出數值代表的坐标的數值
圖中第二個函數寫錯了,應該是=ADDRESS(B13+1,2,4)
偶數個資料求中位數
- 用到的函數:COUNT()函數,用于求出公式中的中位數的位置(非在Excel中真實的位置)為了确切函數的位置我們在COUNT函數的外面嵌套int函數()
- 例題中的函數為=INT((COUNT(B2:B11)+1)/2)
- 偶數中求具體的位置和數值的方法和奇數中一樣,這裡我們把函數進行一個嵌套,直接得出中位數的數值
- 例題中求一個中位數使用的函數為:=INDIRECT(ADDRESS(B13+1,2,4))
- 例題中求第二個中位數使用的函數為:=INDIRECT(ADDRESS(B13+2,2,4))
- 求出最終的中位數
- 例題中最後一個中位數使用的函數為:=(B14+B15)/2
不論資料的個數,直接求中位數
這裡使用到了mod函數(範圍,對誰求餘數):求餘數函數
離散程度
離散程度描述的是資料散布,即描述集中與離散程度的度量
一般來說,資料越分散,離散程度統計量的值越大
極差
- 極端值之差.即一組資料的極大值和極小值之差,也稱全距
- 因為極差隻是利用了一組資料兩端的資訊,因而容易受極端值的影響,不能全面反映差異狀況
在Excel中求極差就是求出最大值和最小值然後求差.
用到的函數是max函數和min函數
标準差
- 樣本中各個數值到均值的距離的一種平均
- 标準差實際上的方差的平方根
标 準 差 s = 1 n ∑ i = 0 n ( n i − x ˉ ) 2 标準差s=\sqrt{\frac{1}{n}\sum_{i=0}^n(n_i-\bar{x})^2} 标準差s=n1i=0∑n(ni−xˉ)2
在Excel中求标準差
- 求平均值的函數AVERACE(資料範圍)
- 在例題中的函數為:AVERACE(B2:B7)
- 然後求離差的平方,(資料坐标-均值資料坐标)^2這裡的文法和markdown中求平方的文法很像
- 在例題中的函數為:=(B2-$B$10)^2這裡使用了坐标的絕對引用是因為我們需要拖動資料,為了使列坐标保持不變
- 求方差:就是離差的平方求均值,AVERACE(資料範圍)
- 在例題中的函數為:=AVERACE(C2:C7)
- 求标準差:資料坐标^(1/2)
- 在例題中的函數為:=B11^(1/2)
- 也可以使用函數sqrt(資料範圍):=sqrt(B11)
方差
- 各點到均值距離的平方的平均
- 方差由于和資料的量綱不同,因而在實際應用中使用得不如标準差那麼普遍
s 2 = 1 n ∑ i = 0 n ( n i − x ˉ ) 2 = ( x 1 − x ˉ ) 2 + ( x 2 − x ˉ ) 2 + … + ( x n − x ˉ ) 2 n s^2=\frac{1}{n}\sum_{i=0}^n(n_i-\bar{x})^2=\frac{(x_1-\bar{x})^2+(x_2-\bar{x})^2+\ldots+(x_n-\bar{x})^2}{n} s2=n1i=0∑n(ni−xˉ)2=n(x1−xˉ)2+(x2−xˉ)2+…+(xn−xˉ)2
資料的标準得分
因為評分标準不同導緻的最終得分不同,那麼不同标準不同得分的資料怎麼進行比較呢?
就用到了資料的标準得分,資料标準化之後,再比較标準化之後的資料
- 标準化的方法:把原始觀測值(亦稱得分,score)和均值之差除以标準差得到的度量稱為
:(x-m)/s(m表示均值,x表示原始資料,s表示标準差)标準得分(standard score)
分析标準化得分時要分别讨論:
比如題中的得分85和得分73
85分的成績在1班的成績中屬于中等成績
73分的成績在2班的成績中屬于較高的成績
但是如果是同一份試卷,那麼85分的成績是高于得分74的成績的
利用SPSS實作 定量變量的
描述統計分析
定量變量的
分析------描述統計------描述------選項(添加要分析的項)-----選擇顯示順序(一般選擇按均值的升序排序)
将描述統計結果複制到Excel中進行轉換和繪制統計圖
轉換方式和繪圖方式在前面的章節中有具體的操作,這裡不做贅述.
利用SPSS實作 定量變量
的多組均值比較
定量變量
多組均值意思就是在資料之前有不同的分類,比如醫院(私人醫院,公立醫院,學院醫院)在分類的情況下讨論其他值的均值的關系,在本例中工作.工資,升職機會都是度量類型的資料.
在SPSS中操作
分析-----比較均值----均值-----自變量清單就是就是分類的變量-----而因變量的類型就是我們的定量變量(變量的類型是度量類型的變量)-------選項中選擇要分析的标準(一般為個案數,标準差,均值)
然後将在SPSS中的分析結果複制到Excel中進行資料的轉換和統計圖的繪制
利用SPSS實作 有序變量的
描述統計分析
有序變量的
有序變量指的是:在統計的調查問卷中,我們有時會設定這樣的問題:比如你對某幾個方面的重要程度進行排序,假如說3個方面,1代表非常重要,2表示無所謂,3表示一點不重要.那麼這個變量就是有序變量,
有序變量問題我們在SPSS中把每個選項都使用的是分類法來進行變量的描述
現在我們就要讨論對有序變量的描述統計分析
分析------描述統計------描述------把要分析的多個方面都添加到分析變量中-------選項(一般隻選擇均值,并選擇按照均值的升序排序)
然後将在SPSS中的分析結果複制到Excel中進行資料的轉換和統計圖的繪制
然後進行調查報告的編寫(這裡截取了書中标準的模闆,這個也是調查報告的标準模闆)
利用SPSS實作 有序變量
的多組均值比較
有序變量
和多組定量變量同樣也就存在多組有序變量,意思就是在原本有序變量的基礎上加上了分組(或者稱為分類)
分析-------比較均值---------均值-------添加類别變量到自變量菜單---------添加因變量(也就是那些我們要分析的定序變量)----------選項(這裡我們隻分析均值,也可以添加上個案數)
然後将在SPSS中的分析結果複制到Excel中進行資料的轉換和統計圖的繪制
這是最終結果
我們在自己繪制統計圖時可能會因為建表不同而導緻和規定的圖表不同
這是我們要點選設計-------切換行/列來轉換統計圖的行列的格式
利用Excel"描述統計"分析工具實作矩陣題的統計分析描述
矩陣題:
多個題目都有同一分類度量的标準
資料頁籤----資料分析----描述統計--------選擇資料區域-----逐列分組-------選中标志位于第一行-----選擇輸出區域(隻能選取一個單元格)------選中彙總統計
圖表進行處理
排序(根據滿意度)
繪制統計圖調整統計圖的格式
最終結果
我是一個
普通二本
的學生,可能寫的有不周到之處,希望各位大佬指點.讓我們一起努力,不過平庸的生活.
如果您感覺`我寫的不錯麻煩點個贊.
如果有什麼
,可以留言我們一起
問題
如果有什麼
探讨
建議
,也可以留言給我,我會虛心的接收,
最後
,看完了我的文章
謝謝您