資料挖掘之評價模型

層次分析法(AHP)

基本思想：

是定性與定量相結合的多準則決策、評價方法。将決策的有關元素分解成目标層、準則層和方案層，并通過人們的判斷對決策方案的優劣進行排序，在此基礎上進行定性和定量分析。它把人的思維過程階層化、數量化，并用數學為分析、決策、評價、預報和控制提供定量的依據。

基本步驟：

建構層次結構模型；建構成對比較矩陣；層次單排序及一緻性檢驗（即判斷主觀建構的成對比較矩陣在整體上是否有較好的一緻性）；層次總排序及一緻性檢驗（檢驗層次之間的一緻性）。

優點：

它完全依靠主觀評價做出方案的優劣排序，所需資料量少，決策花費的時間很短。從整體上看，AHP在複雜決策過程中引入定量分析，并充分利用決策者在兩兩比較中給出的偏好資訊進行分析與決策支援，既有效地吸收了定性分析的結果，又發揮了定量分析的優勢，進而使決策過程具有很強的條理性和科學性，特别适合在社會經濟系統的決策分析中使用。

缺點：

用AHP進行決策主觀成分很大。當決策者的判斷過多地受其主觀偏好影響，而産生某種對客觀規律的歪曲時，AHP的結果顯然就靠不住了。

适用範圍：

尤其适合于人的定性判斷起重要作用的、對決策結果難于直接準确計量的場合。要使AHP的決策結論盡可能符合客觀規律，決策者必須對所面臨的問題有比較深入和全面的認識。另外，當遇到因素衆多，規模較大的評價問題時，該模型容易出現問題，它要求評價者對問題的本質、包含的要素及其互相之間的邏輯關系能掌握得十分透徹，否則評價結果就不可靠和準确。

改進方法：

(1)成對比較矩陣可以采用德爾菲法獲得。

(2)如果評價名額個數過多（一般超過9個），利用層次分析法所得到的權重就有一定的偏差，繼而組合評價模型的結果就不再可靠。可以根據評價對象的實際情況和特點，利用一定的方法，将各原始名額分層和歸類，使得每層各類中的名額數少于9個。

灰色綜合評價法（灰色關聯度分析）

基本思想：

灰色關聯分析的實質就是，可利用各方案與最優方案之間關聯度大小對評價象進行比較、排序。關聯度越大，說明比較序列與參考序列變化的态勢越一緻，反之，變化态勢則相悖。由此可得出評價結果。

基本步驟：

建立原始名額矩陣；确定最優名額序列；進行名額标準化或無量綱化處理；求差序列、最大差和最小差；計算關聯系數；計算關聯度。

優點：

是一種評價具有大量未知資訊的系統的有效模型，是定性分析和定量分析相結合的綜合評價模型，該模型可以較好地解決評價名額難以準确量化和統計的問題，可以排除人為因素帶來的影響，使評價結果更加客觀準确。整個計算過程簡單，通俗易懂，易于為人們所掌握;資料不必進行歸一化處理，可用原始資料進行直接計算，可靠性強；評價名額體系可以根據具體情況增減；無需大量樣本，隻要有代表性的少量樣本即可。

缺點：

要求樣本資料且具有時間序列特性；隻是對評判對象的優劣做出鑒别，并不反映絕對水準，故基于灰色關聯分析綜合評價具有“相對評價”的全部缺點。

适用範圍：

對樣本量沒有嚴格要求，不要求服從任何分布，适合隻有少量觀測資料的問題；應用該種方法進行評價時，名額體系及權重配置設定是一個關鍵的題，選擇的恰當與否直接影響最終評價結果。

改進方法：

(1)采用組合賦權法：根據客觀賦權法和主觀賦權法綜合而得權系數。

(2)結合TOPSIS法：不僅關注序列與正理想序列的關聯度，而且關注序列與負理想序列的關聯度，依據公式計算最後的關聯度。

模糊綜合評價法

基本思想：是以模糊數學為基礎，應用模糊關系合成的原理，将一些邊界不清、不易定量的因素定量化，從多個因素對被評價事物隸屬等級（或稱為評語集）狀況進行綜合性評價的一種方法。綜合評判對評判對象的全體，根據所給的條件，給每個對象賦予一個非負實數評判名額，再據此排序擇優。

基本步驟：确定因素集、評語集；構造模糊關系矩陣；确定名額權重；進行模糊合成和做出評價。

優點：

:數學模型簡單，容易掌握，對多因素、多層次的複雜問題評判效果較好。模糊評價模型不僅可對評價對象按綜合分值的大小進行評價和排序，而且還可根據模糊評價集上的值按最大隸屬度原則去評定對象所屬的等級，結果包含的資訊量豐富。評判逐對進行，對被評對象有唯一的評價值，不受被評價對象所處對象集合的影響。接近于東方人的思維習慣和描述方法，是以它更适用于對社會經濟系統問題進行評價。

缺點：

并不能解決評價名額間相關造成的評價資訊重複問題，隸屬函數的确定還沒有系統的方法，而且合成的算法也有待進一步探讨。其評價過程大量運用了人的主觀判斷，由于各因素權重的确定帶有一定的主觀性，是以，總的來說，模糊綜合評判是一種基于主觀資訊的綜合評價方法。

應用範圍：

廣泛地應用于經濟管理等領域。綜合評價結果的可靠性和準确性依賴于合理選取因素、因素的權重配置設定和綜合評價的合成算子等。

改進方法：

(1)采用組合賦權法：根據客觀賦權法和主觀賦權法綜合而得權系數。

BP神經網絡綜合評價法

基本思想：

是一種互動式的評價方法，它可以根據使用者期望的輸出不斷修改名額的權值，直到使用者滿意為止。是以，一般來說，人工神經網絡評價方法得到的結果會更符合實際情況。

優點：

神經網絡具有自适應能力，能對多名額綜合評價問題給出一個客觀評價，這對于弱化權重确定中的人為因素是十分有益的。在以前的評價方法中，傳統的權重設計帶有很大的模糊性，同時權重确定中人為因素影響也很大。随着時間、空間的推移，各名額對其對應題的影響程度也可能發生變化，确定的初始權重不一定符合實際情況。再者，考慮到整個分析評價是一個複雜的非線性大系統，必須建立權重的學習機制，這些方面正是人工神經網絡的優勢所在。針對綜合評價模組化過程中變量選取方法的局限性，采用神經網絡原理可對變量進行貢獻分析，進而剔除影響不顯著和不重要的因素，以建立簡化模型，可以避免主觀因素對變量選取的幹擾。

缺點：

ANN在應用中遇到的最大問題是不能提供解析表達式，權值不能解釋為一種回歸系數，也不能用來分析因果關系，目前還不能從理論上或從實際出發來解釋ANN的權值的意義。需要大量的訓練樣本，精度不高，應用範圍是有限的。最大的應用障礙是評價算法的複雜性，人們隻能借助計算機進行處理，而這方面的商品化軟體還不夠成熟。

适用範圍：

神經網絡評價模型具有自适應能力、可容錯性，能夠處理非線性、非局域性的大型複雜系統。在對學習樣本訓練中，無需考慮輸入因子之間的權系數，ANN通過輸入值與期望值之間的誤差比較，沿原連接配接權自動地進行調節和适應，是以該方法展現了因子之間的互相作用。

改進方法：

(1)采用組合評價法：對用其它評價方法得出的結果，選取一部分作為訓練樣本，一部分作為待測樣本進行檢驗，如此對神經網絡進行訓練，知道滿足要求為止，可得到更好的效果。

資料包絡法(DEA)

通過明确地考慮多種投入（即資源）的運用和多種産出（即服務）的産生，它能夠用來比較提供相似服務的多個服務機關之間的效率，這項技術被稱為資料包絡線分析（DEA）。它避開了計算每項服務的标準成本，因為它可以把多種投入和多種産出轉化為效率比率的分子和分母，而不需要轉換成相同的貨币機關。是以，用DEA衡量效率可以清晰地說明投入和産出的組合，進而，它比一套經營比率或利潤名額更具有綜合性并且更值得信賴。

DEA是一個線形規劃模型，表示為産出對投入的比率。通過對一個特定機關的效率和一組提供相同服務的類似機關的績效的比較，它試圖使服務機關的效率最大化。在這個過程中，獲得100%效率的一些機關被稱為相對有效率機關，而另外的效率評分低于100%的機關本稱為無效率機關。

這樣，企業管理者就能運用DEA來比較一組服務機關，識别相對無效率機關，衡量無效率的嚴重性，并通過對無效率和有效率機關的比較，發現降低無效率的方法。

DEA線形規劃模型建立如下：

1) 定義變量

設Ek（k=1，2，……， K）為第k個機關的效率比率，這裡K代表評估機關的總數。

設uj（j=1，2，……， M）為第j種産出的系數，這裡M代表所考慮的産出種類的總數。變量uj用來衡量産出價值降低一個機關所帶來的相對的效率下降。

設vI（I=1，2，……，N）為第I種投入的系數，這裡N代表所考慮的投入種類的綜合素。變量vI用來衡量投入價值降低一個機關帶來的相對的效率下降。

設Ojk為一定時期内由第k個服務機關所創造的第j種産出的觀察到的機關的數量。

設Iik為一定時期内由第k個服務機關所使用的第i種投入的實際的機關的數量。

2) 目标函數

目标是找出一組伴随每種産出的系數u和一組伴随每種投入的系數ν，進而給被評估的服務機關最高的可能效率。

（*）

式中，e是被評估機關的代碼。這個函數滿足這樣一個限制條件，當同一組投入和産出的系數（uj和vi）用于所有其他對比服務機關時，沒有一個服務機關将超過100%的效率或超過1.0的比率。

3) 限制條件

（**）

k=1,2,……,K

式中所有系數值都是正的且非零。

為了用标準線性規劃軟體求解這個有分數的線性規劃，需要進行變形。要注意，目标函數和所有限制條件都是比率而不是線性函數。通過把所評估機關的投入人為地調整為總和1.0，這樣等式（*）的目标函數可以重新表述為：

滿足以下限制條件：

對于個服務機關，等式（**）的限制條件可類似轉化為：

k=1,2,…,K

式中 uj≥0 j=1，2，…，M vi≥0 i=1，2，…，N

關于服務機關的樣本數量問題是由在分析種比較所挑選的投入和産出變量的數量所決定的。下列關系式把分析中所使用的服務機關數量K和所考慮的投入種類數N與産出種類數M聯系出來，它是基于實證發現和DEA實踐的經驗：

組合評價法

首先闡述問題，包括識别突出的屬性以及規定這些屬性的水準。用這些屬性的水準構造組合，以突出刺激因素，供被調查者作評價。被調查者利用适當的量表給這些組合形式評分或排序，然後對這些資料進行分析。最後解釋分析的結果并評價其信度和效度。

（1）确認問題的屬性和水準

研究者必須首先識别并确定構造該研究問題的重要刺激因素，即所謂屬性。該屬性應該是影響消費者喜好的突出屬性，例如，在選擇汽車品牌時，價格、排量、油耗、車内空間等等比較敏感。從經濟管理的角度說，屬性和屬性的水準應該都是可操作的。你必須用精力所能控制的屬性來定義、識别和确定屬性，典型的組合分析一般可以涉及6-7個屬性（也可以叫做變量）。

确定了突出的屬性之後就是選擇水準。為減輕被調查者的負擔，同時又使參數估計保證一定的精度，需要認真考慮屬性水準的個數。

（2）構成組合形式

屬性及水準用于構成組合形式，以突出激勵因素。構成組合形式的方法主要有配對法和全輪廓法。

配對法也叫雙因子評價，一般采用循環設計來減少配比比較的個數。

全輪廓法也叫多因子評價，常常借助由于正交表進行設計。

（3）決定輸入資料的形式

輸入資料主要有兩種形式：排序或評分。排序法是要對刺激因素集合中的所有屬性水準作相對的評價，要求對每個組合給出一個不同的等級（秩）。評分法是要對每一個組合獨立地進行評價。有人認為評分法更加便于被調查者作評價，所得的資料也比排序法更易于分析。近年來評分法用得更為普遍。

（4）選擇組合分析的具體方法

基本的組合分析模型可以用下面的公式表示：

m ki

U（X）=∑ ∑aij xi

j=i j=i

其中，U（X）代表方案的總效用等

aij代表第i個屬性（i,i=1,2,……m）的第j個水準的分值貢獻或者效用。

ki代表屬性的水準個數

m代表屬性個數

xij=l 如果第i個屬性的第j個水準出現

xij=0 其他

屬性的重要性定義為該屬性水準的最大分值與最小分值之差：

Li={max(aij)-min(aij)}

對每個i屬性的重要性是經标準化的數字處理。經此表示其對别的屬性的重要性。

（5）解釋結果

為了更直覺地解釋結果，一般借助于分值（效用）函數的圖形，将每個屬性的分值函數作圖。

（6) 評估信度和效度

評價組合分析結果的信度和效度，有多種方法，常用的有：

1.評價估計模型的拟合優度；

2.用檢驗-再檢驗法來評價信度；

3.用估計出來的分值函數作為評價的預測值，計算該預測值與被調查的實際評估值之間的相關，用以确定内部效度；

4.如果資料是按集合進行分析的，那麼可以将樣本分别分割成幾個部分，再對每個子樣本實施組合分析。比較這些子樣本的結果就可以評價組合分析的解的穩定性。

優點

組合分析的主要優點就是為新産品或各種市場營銷方案提供決策的參考資訊。

評價模型資料挖掘之評價模型資料挖掘之評價模型

資料挖掘之評價模型

層次分析法(AHP)

灰色綜合評價法（灰色關聯度分析）

模糊綜合評價法

BP神經網絡綜合評價法

資料包絡法(DEA)

組合評價法