概要
本文用 R 程式設計語言極值理論 (EVT) 以确定 10 隻股票指數的風險價值(和條件 VaR)。使用 Anderson-Darling 檢驗對 10 隻股票的組合資料進行正态性檢驗,并使用 Block Maxima 和 Peak-Over-Threshold 的 EVT 方法估計 VaR/CvaR。最後,使用條件異向性 (GARCH) 處理的廣義自回歸來預測未來 20 天後指數的未來值。本文将确定計算風險因素的不同方法對模型結果的影響。
極值理論(最初由Fisher、Tippett和Gnedenko提出)表明,獨立同分布(iid)變量樣本的分塊最大值的分布會收斂到三個極值分布之一。
最近,統計學家對極端值模組化的興趣又有了新的變化。極限值分析已被證明在各種風險因素的案例中很有用。在1999年至2008年的金融市場動蕩之後,極值分析獲得了有效性,與之前的風險價值分析不同。極限值代表一個系統的極端波動。極限值分析提供了對極端事件的機率、規模和保護成本的關系進行模組化的能力。
參考
https://arxiv.org/pdf/1310.3222.pdf
https://www.ma.utexas.edu/mp_arc/c/11/11-33.pdf
http://evt2013.weebly.com/uploads/1/2/6/9/12699923/penalva.pdf
Risk Measurement in Commodities Markets Using Conditional Extreme Value Theory
第 1a 部分 - 工作目錄、所需的包和會話資訊
為了開始分析,工作目錄被設定為包含股票行情的檔案夾。然後,安裝所需的 R 程式設計語言包并包含在包庫中。R 包包括極值理論函數、VaR 函數、時間序列分析、定量交易分析、回歸分析、繪圖和 html 格式的包。
library(ggplot2)
library(tseries)
library(vars)
library(evd)
library(POT)
library(rugarch)
第 1b 節 - 格式化專有資料
用于此分析的第一個檔案是“Data_CSV.csv”。該檔案包含在 DAX 證券交易所上市的 15 家公司的股票代碼資料,以及 DAX 交易所的市場投資組合資料。從這個資料檔案中選出了 10 家公司,這些公司最近十年的股價資訊是從谷歌财經下載下傳的。
第 1c 節 - 下載下傳股票代碼資料
股票價格資料下載下傳并讀入 R 程式設計環境。收益率是用“開盤價/收盤價 ”計算的,十家公司的資料合并在一個資料框中,(每家公司一列)。
結果資料幀的每一行代表記錄股價的 10 年中的一個工作日。然後計算資料幀中每一行的均值。一列 10 年的日期被附加到資料框。還建立了僅包含行均值和日期資訊的第二個資料框。
alDat <- cbind(retursDaa, returnDta_A,
retrnsata_Ss, reunsataDB,
retunsDta_H, reurnsDta_S, rtunsDaaA,
retrnsaa_senus,reursDtaAlnz,
reurnsData_ailer)
第 2a 節 - 探索性資料分析
建立一個資料框統計表,其中包含每列(或公司)的最小值、中值、平均值、最大值、标準偏差、1% 分位數、5% 分位數、95% 分位數、99% 分位數。分位數百分比适用于極值。還建立了所有收益率均值的時間序列圖表。
taeSs<- c(min(x), medan(x), man(x),
max(x), sd(x), quntile(x, .01),
quanile(x, .05), qunile(x, .95),
quatile(x, .99), lngth(x))
第 2b 節 - 10 隻股票指數的 VaR 估計
all_va.2 <- VAR(lDvarts, p = 2, tpe= "cnst")
# 預測未來125天、250天和500天
aDFva100 <- pdc(alDva.c, n.aea = 100, ci = 0.9)
為了開始估算資料所隐含的未來事件,我們進行了初步的風險值估算。首先,所有行的平均值和日期資訊的資料架構被轉換為時間序列格式,然後從這個時間序列中計算出風險值。根據VaR計算對未來100天和500天的價值進行預測。在随後的預測圖中,藍色圓圈代表未來100天的數值,紅色圓圈代表500天的回報值。
plot(ap0$t$Tme[1:1200],
alF_ar.d.$fst[1:1200])
第 2c 部分 - 估計期望shortfall(ES),條件VAR(CvaR) 10 股票指數
為便于比較,計算了10隻股票指數資料的條件風險值(CvaR或估計虧損)。首先,利用資料的時間序列,找到最差的0.95%的跌幅的最大值。然後,通過 "高斯 "方法計算出估計虧損,這兩種計算的結果都以表格形式呈現。
ES(s(lD1:2528, 2, rp=FAE]),p=0.95, mho="gausn")
第 2d 節 - 10 隻股票指數的希爾Hill估計
由于假設10股指數資料為重尾分布,資料極少變化,是以采用Hill Estimation對尾指數進行參數估計。目的是驗證 10 隻股票資料是否為極值分布。Hill Estimation 生成的圖證明了。
hil(orvtis, otio="x", trt=15, nd=45)
第 2e 節 - 正态分布的 Anderson-Darling 檢驗
Anderson-Darling 檢驗主要用于分布族,是分布非正态性的決定因素。在樣本量較大的情況下(如在 10 股指數中),小于 0.05 的 P 值表明分布與正态性不同。這是極值分布的預期。使用 Anderson-Darling 檢驗發現的機率值為 3.7^-24,是以證明了非正态性。
第 2f 節 - 結果表
最後,給出了10個股票指數未來價值的估計結果表。3 個 VaR 估計值(和估計差額)的點估計值和範圍被制成表格以比較。
VaRES[3,] <- c("ES", etFbl[1], 4)
eSFbe[2], estFtbl[3],
rond(eSab[4], 4))
第 3a 節 - 10 個股票指數的 EVT 分塊最大值估計
極值理論中的 Block Maxima 方法是 EVT 分析的最基本方法。Block Maxima 包括将觀察期劃分為相同大小的不重疊的時期,并将注意力限制在每個時期的最大觀察值上。建立的觀察遵循吸引條件的域,近似于極值分布。然後将極值分布的參數統計方法應用于這些觀察。
極值理論家開發了廣義極值分布。GEV 包含一系列連續機率分布,即 Gumbel、Frechet 和 Weibull 分布(也稱為 I、II 和 III 型極值分布)。
在以下 EVT Block Maxima 分析中,10 股指數資料拟合 GEV。繪制得到的分布。建立時間序列圖以定位時間軸上的極端事件,從 2006 年到 2016 年。然後建立四個按 Block Maxima 資料順序排列的圖。最後,根據 gev() 函數建立 Block Maxima 分析參數表。
gev(ltMeans, x=0.8, m=0)
plt(alVF)
第 3b 節 - 分塊最大值的 VaR 預測
為了從 Block Maxima 資料中建立風險價值 (VaR) 估計,将 10 股指數 GEV 資料轉換為時間序列。VaR 估計是根據 GEV 時間序列資料進行的。未來值的預測(未來 100 天和 500 天)是從 VaR 資料推斷出來的。在結果圖中,藍色圓圈表示未來 100 天的值,紅色圓圈表示 500 天的收益率值。
# 預測未來500天
aGE500<- preit(aG_va.c, n.ad = 500, ci = 0.9)
plot(aGE500pd.500)
第 3c 部分 - 分塊最大值的期望損失ES (CvaR)
10隻股票指數GEV資料的條件風險值("CvaR "或 "期望損失")被計算。首先,利用資料的時間序列,找到最差的0.95%的縮水的最大值。然後,通過極端分布的 "修正 "方法來計算 "估計虧損",這兩種計算的結果都以表格形式呈現。
# 條件縮減是最差的0.95%縮減的平均值
ddGV <- xdrow(aEVts[,2])
# CvaR(預期虧損)估計值
CvaR(ts(alE), p=0.95, meho="miie")
第 3d 節 - 分塊極大值的 Hill 估計
希爾估計(用于尾部指數的參數估計)驗證 10 隻股票的 GEV 資料是極值分布。
第 3e 節 - 正态分布的 Anderson-Darling 檢驗
Anderson-Darling 檢驗是确定大樣本數量分布的非正态性的有力決定因素。如果 P 值小于 0.05,則分布與正态性不同。通過該測試發現了一個微小的機率值 3.7^-24。
第 3f 節 - 結果表
最後,給出了對 10 股指數 GEV 未來價值的估計結果表。3 個 GEV VaR 估計值(和 GEV 期望損失)的點估計值和範圍制成表格比較。
G_t[3,] <- c("GEV ES",sFale[1],
sStble[2], SEble[3],
"NA")
GRst
第 3g 節 - 分塊極大值的 100 天 GARCH 預測
通過将 Block Maxima GEV 分布(10 隻股票的指數)拟合到 GARCH(1,1)(廣義自回歸條件異型)模型,對 Block Maxima EVT 資料進行預測。顯示預測公式參數表。建立一個“自相關函數”(ACF) 圖,顯示随時間變化的重要事件。然後,顯示拟合模型結果的一組圖。建立對未來 20 天(股票指數表現)的預測。最後,20 天的預測顯示在 2 個圖中。
spec(aanc.ol = list(mel = 'eGARCH',
garer= c(1, 1)),
dirion = 'sd')
# 用廣義自回歸條件異質性拟合模型
alimol = ugct(pec,allV, sovr = 'ybi')
cofale <- dtafe(cof(litol))
oeBal
plt(l.itodl)
第 4a 節 - 峰值超過門檻值估計 - 10 個股票指數
在 EVT 中的峰值超過門檻值方法中,選擇超過某個高門檻值的初始觀測值。這些標明觀測值的機率分布近似為廣義帕累托分布。通過拟合廣義帕累托分布來建立最大似然估計 (mle)。MLE 統計資料以表格形式呈現。然後通過 MLE 繪圖以圖形方式診斷所得估計值。
plot(Dseans, u.rg=c(0.3, 0.35))
第 4b 節 - POT 的 VaR 預測
POT 資料的風險價值 (VaR) 估計是通過将 10 個股票指數 MLE 資料轉換為時間序列來建立的。VaR 估計是根據 MLE 時間序列資料進行的。未來值的預測(未來 100 天和 500 天)是從 MLE VaR 資料推斷出來的。在結果圖中,藍色圓圈表示未來 100 天的值,紅色圓圈表示 500 天的收益值。
VAR(merts, p = 2, tp = "cost")
# 預測未來125天、250天和500天
mle_r.pd <- prect(e.ar, n.ahad = 100, ci = 0.9)
plot(mea.prd)
第 4c 部分 - POT 的期望損失ES (CvaR) 預測
然後計算10隻股票指數MLE資料的條件風險值("CvaR "或 "期望損失ES")。資料的時間序列被用來尋找最差的0.95%的跌幅的最大值。通過極端分布的 "修正 "方法,計算出 "期望損失ES",兩種計算的結果都以表格形式呈現。
# 最差的0.95%最大回撤的平均值
mdM <- maxdadw(mlvs[,2])
CvaR(ldaa), p=0.95, meto="mdii",
pimeod = "comnen", weghts)
第 4d 節 - 峰值超過門檻值的 Hill 估計
Hill 估計(用于尾部指數的參數估計)驗證 10 隻股票的 MLE 資料是一個極值分布。
第 4e 節 - 正态分布的 Anderson-Darling 檢驗
Anderson-Darling 檢驗是确定大樣本數量分布的非正态性的有力決定因素。如果 P 值小于 0.05,則分布與正态性不同。此測試的結果 P 值為 3.7^-24。
第 4f 節 - 結果表
最後,給出了 10 個股票指數 MLE 未來價值的估計結果表。3 個 MLE VaR 估計值(和 MLE 期望損失ES)的點估計值和範圍被制成表格來比較。
第 4g 節 - 峰值超過門檻值的 100 天 GARCH 預測
通過将 MLE(10 隻股票指數的最大似然估計)拟合到 GARCH(1,1)(廣義自回歸條件異型性)模型,對峰值超過門檻值 EVT 資料進行預測。顯示預測公式參數表。建立了一個“自相關函數”(ACF)圖,顯示了随時間變化的重要事件。然後,顯示拟合模型結果的一組圖。然後建立對接下來 20 天(股票指數表現)的預測。最後,20 天的預測(來自峰值超過門檻值 EVT extimation)顯示在 2 個圖中。
fit(ec,ta, slvr = 'hybrid')
plot(pot.fite.ol)
第 5a 節 - 估計方法影響表
下表彙總了檢驗 極值分布的 10 個股票的四種方法的結果。第一列包含四種估計方法的名稱。提供了 VaR、ES、mu統計量和 Anderson-Darling P 值的統計量。
c("VaR",
round(mean(cofets),4),
"NA", "NA", p.vau)
c("Block Maxm", round(mean(coffies),4),
MES, pr.ss[3],.vle)
c("POT",
round(mean(cofies), 4),
MES, fitdaes, p.ale)
第 5b 節 - 結論
在對 10 家公司(在 DAX 證券交易所上市)的 10 年股票收益率進行檢查後,确認将收益率百分比的變化表征為極值分布的有效性。四種分析方法的拟合值的所有 Anderson-Darling 檢驗都顯示分布具有正态性或所有非極值值的機率不顯着。這些方法在收益資料中的風險價值方面是一緻的。Block Maxima 方法會産生 VaR 估計的輕微偏差。傳統的 VaR 估計和 POT 估計産生相同的風險價值。與股票收益率資料的傳統 CvaR 估計相比,這 2 種 EVT 方法預測的預期缺口較低。标準 QQ 圖表明峰值超過門檻值是最可靠的估計方法,
在對10家公司(在德國DAX證券交易所上市)10年的股票收益率進行檢查後,證明了将收益率變化定性為極值分布的有效性。對四種分析方法的拟合值進行的所有安德森-達林測試顯示,分布具有正态性或所有非極值的機率不大。這些方法在收益資料的風險值方面是一緻的。分塊最大值方法産生了一個風險值估計的偏差。傳統的VaR估計和POT估計産生相同的風險值。相對于傳統的股票收益率資料的CvaR估計,兩種EVT方法預測的期望損失較低。标準Q-Q圖表明,在10隻股票的指數中,Peaks-Over-Threshold是最可靠的估計方法。
最受歡迎的見解
1.R語言基于ARMA-GARCH-VaR模型拟合和預測實證研究
2.R語言時變參數VAR随機模型
3.R語言估計時變VAR模型時間序列的實證研究
4.R語言基于ARMA-GARCH過程的VAR拟合和預測
5.GARCH(1,1),MA以及曆史模拟法的VaR比較
6.R語言用向量自回歸(VAR)進行經濟資料脈沖響應
7.R語言實作向量自動回歸VAR模型