R語言極值理論 EVT、POT超門檻值、GARCH 模型分析股票指數VaR、條件CVaR：多元化投資組合預測風險測度分析

概要

本文用 R 程式設計語言極值理論 (EVT) 以确定 10 隻股票指數的風險價值（和條件 VaR）。使用 Anderson-Darling 檢驗對 10 隻股票的組合資料進行正态性檢驗，并使用 Block Maxima 和 Peak-Over-Threshold 的 EVT 方法估計 VaR/CvaR。最後，使用條件異向性 (GARCH) 處理的廣義自回歸來預測未來 20 天後指數的未來值。本文将确定計算風險因素的不同方法對模型結果的影響。

極值理論（最初由Fisher、Tippett和Gnedenko提出）表明，獨立同分布（iid）變量樣本的分塊最大值的分布會收斂到三個極值分布之一。

最近，統計學家對極端值模組化的興趣又有了新的變化。極限值分析已被證明在各種風險因素的案例中很有用。在1999年至2008年的金融市場動蕩之後，極值分析獲得了有效性，與之前的風險價值分析不同。極限值代表一個系統的極端波動。極限值分析提供了對極端事件的機率、規模和保護成本的關系進行模組化的能力。

參考

https://arxiv.org/pdf/1310.3222.pdf

https://www.ma.utexas.edu/mp_arc/c/11/11-33.pdf

http://evt2013.weebly.com/uploads/1/2/6/9/12699923/penalva.pdf

Risk Measurement in Commodities Markets Using Conditional Extreme Value Theory

第 1a 部分 - 工作目錄、所需的包和會話資訊

為了開始分析，工作目錄被設定為包含股票行情的檔案夾。然後，安裝所需的 R 程式設計語言包并包含在包庫中。R 包包括極值理論函數、VaR 函數、時間序列分析、定量交易分析、回歸分析、繪圖和 html 格式的包。

library(ggplot2)
library(tseries)
library(vars)
library(evd)
library(POT)
library(rugarch)

第 1b 節 - 格式化專有資料

用于此分析的第一個檔案是“Data_CSV.csv”。該檔案包含在 DAX 證券交易所上市的 15 家公司的股票代碼資料，以及 DAX 交易所的市場投資組合資料。從這個資料檔案中選出了 10 家公司，這些公司最近十年的股價資訊是從谷歌财經下載下傳的。

R語言極值理論 EVT、POT超門檻值、GARCH 模型分析股票指數VaR、條件CVaR：多元化投資組合預測風險測度分析

第 1c 節 - 下載下傳股票代碼資料

股票價格資料下載下傳并讀入 R 程式設計環境。收益率是用“開盤價/收盤價 ”計算的，十家公司的資料合并在一個資料框中，（每家公司一列）。

結果資料幀的每一行代表記錄股價的 10 年中的一個工作日。然後計算資料幀中每一行的均值。一列 10 年的日期被附加到資料框。還建立了僅包含行均值和日期資訊的第二個資料框。

alDat <- cbind(retursDaa, returnDta_A,
                 retrnsata_Ss, reunsataDB,
                 retunsDta_H, reurnsDta_S, rtunsDaaA,
                 retrnsaa_senus,reursDtaAlnz,
                 reurnsData_ailer)

第 2a 節 - 探索性資料分析

建立一個資料框統計表，其中包含每列（或公司）的最小值、中值、平均值、最大值、标準偏差、1% 分位數、5% 分位數、95% 分位數、99% 分位數。分位數百分比适用于極值。還建立了所有收益率均值的時間序列圖表。

taeSs<- c(min(x), medan(x), man(x),
                    max(x), sd(x), quntile(x, .01),
                    quanile(x, .05), qunile(x, .95),
                    quatile(x, .99), lngth(x))

第 2b 節 - 10 隻股票指數的 VaR 估計

all_va.2 <- VAR(lDvarts, p = 2, tpe= "cnst")

# 預測未來125天、250天和500天
aDFva100 <- pdc(alDva.c, n.aea = 100, ci = 0.9)

為了開始估算資料所隐含的未來事件，我們進行了初步的風險值估算。首先，所有行的平均值和日期資訊的資料架構被轉換為時間序列格式，然後從這個時間序列中計算出風險值。根據VaR計算對未來100天和500天的價值進行預測。在随後的預測圖中，藍色圓圈代表未來100天的數值，紅色圓圈代表500天的回報值。

plot（ap0$t$Tme[1:1200],
     alF_ar.d.$fst[1:1200]）

第 2c 部分 - 估計期望shortfall(ES),條件VAR(CvaR) 10 股票指數

為便于比較，計算了10隻股票指數資料的條件風險值（CvaR或估計虧損）。首先，利用資料的時間序列，找到最差的0.95%的跌幅的最大值。然後，通過 "高斯 "方法計算出估計虧損，這兩種計算的結果都以表格形式呈現。

ES(s(lD1:2528, 2, rp=FAE]),p=0.95, mho="gausn")

第 2d 節 - 10 隻股票指數的希爾Hill估計

由于假設10股指數資料為重尾分布，資料極少變化，是以采用Hill Estimation對尾指數進行參數估計。目的是驗證 10 隻股票資料是否為極值分布。Hill Estimation 生成的圖證明了。

hil(orvtis, otio="x", trt=15, nd=45)

第 2e 節 - 正态分布的 Anderson-Darling 檢驗

Anderson-Darling 檢驗主要用于分布族，是分布非正态性的決定因素。在樣本量較大的情況下（如在 10 股指數中），小于 0.05 的 P 值表明分布與正态性不同。這是極值分布的預期。使用 Anderson-Darling 檢驗發現的機率值為 3.7^-24，是以證明了非正态性。

第 2f 節 - 結果表

最後，給出了10個股票指數未來價值的估計結果表。3 個 VaR 估計值（和估計差額）的點估計值和範圍被制成表格以比較。

VaRES[3,] <- c("ES", etFbl[1], 4)
                        eSFbe[2], estFtbl[3],
                        rond(eSab[4], 4))

第 3a 節 - 10 個股票指數的 EVT 分塊最大值估計

極值理論中的 Block Maxima 方法是 EVT 分析的最基本方法。Block Maxima 包括将觀察期劃分為相同大小的不重疊的時期，并将注意力限制在每個時期的最大觀察值上。建立的觀察遵循吸引條件的域，近似于極值分布。然後将極值分布的參數統計方法應用于這些觀察。

極值理論家開發了廣義極值分布。GEV 包含一系列連續機率分布，即 Gumbel、Frechet 和 Weibull 分布（也稱為 I、II 和 III 型極值分布）。

在以下 EVT Block Maxima 分析中，10 股指數資料拟合 GEV。繪制得到的分布。建立時間序列圖以定位時間軸上的極端事件，從 2006 年到 2016 年。然後建立四個按 Block Maxima 資料順序排列的圖。最後，根據 gev() 函數建立 Block Maxima 分析參數表。

gev(ltMeans, x=0.8, m=0)


plt(alVF)

第 3b 節 - 分塊最大值的 VaR 預測

為了從 Block Maxima 資料中建立風險價值 (VaR) 估計，将 10 股指數 GEV 資料轉換為時間序列。VaR 估計是根據 GEV 時間序列資料進行的。未來值的預測（未來 100 天和 500 天）是從 VaR 資料推斷出來的。在結果圖中，藍色圓圈表示未來 100 天的值，紅色圓圈表示 500 天的收益率值。

# 預測未來500天
aGE500<- preit(aG_va.c, n.ad = 500, ci = 0.9)

plot(aGE500pd.500)

第 3c 部分 - 分塊最大值的期望損失ES (CvaR)

10隻股票指數GEV資料的條件風險值（"CvaR "或 "期望損失"）被計算。首先，利用資料的時間序列，找到最差的0.95%的縮水的最大值。然後，通過極端分布的 "修正 "方法來計算 "估計虧損"，這兩種計算的結果都以表格形式呈現。

# 條件縮減是最差的0.95%縮減的平均值
ddGV <- xdrow(aEVts[,2])
# CvaR（預期虧損）估計值
CvaR(ts(alE), p=0.95, meho="miie")

第 3d 節 - 分塊極大值的 Hill 估計

希爾估計（用于尾部指數的參數估計）驗證 10 隻股票的 GEV 資料是極值分布。

第 3e 節 - 正态分布的 Anderson-Darling 檢驗

Anderson-Darling 檢驗是确定大樣本數量分布的非正态性的有力決定因素。如果 P 值小于 0.05，則分布與正态性不同。通過該測試發現了一個微小的機率值 3.7^-24。

第 3f 節 - 結果表

最後，給出了對 10 股指數 GEV 未來價值的估計結果表。3 個 GEV VaR 估計值（和 GEV 期望損失）的點估計值和範圍制成表格比較。

G_t[3,] <- c("GEV ES",sFale[1],
                     sStble[2], SEble[3],
                     "NA")
GRst

第 3g 節 - 分塊極大值的 100 天 GARCH 預測

通過将 Block Maxima GEV 分布（10 隻股票的指數）拟合到 GARCH(1,1)（廣義自回歸條件異型）模型，對 Block Maxima EVT 資料進行預測。顯示預測公式參數表。建立一個“自相關函數”(ACF) 圖，顯示随時間變化的重要事件。然後，顯示拟合模型結果的一組圖。建立對未來 20 天（股票指數表現）的預測。最後，20 天的預測顯示在 2 個圖中。

spec(aanc.ol = list(mel = 'eGARCH',
                                        garer= c(1, 1)),
                  dirion = 'sd')

# 用廣義自回歸條件異質性拟合模型
alimol = ugct(pec,allV, sovr = 'ybi')

cofale <- dtafe(cof(litol))
oeBal

plt(l.itodl)

第 4a 節 - 峰值超過門檻值估計 - 10 個股票指數

在 EVT 中的峰值超過門檻值方法中，選擇超過某個高門檻值的初始觀測值。這些標明觀測值的機率分布近似為廣義帕累托分布。通過拟合廣義帕累托分布來建立最大似然估計 (mle)。MLE 統計資料以表格形式呈現。然後通過 MLE 繪圖以圖形方式診斷所得估計值。

plot(Dseans, u.rg=c(0.3, 0.35))

第 4b 節 - POT 的 VaR 預測

POT 資料的風險價值 (VaR) 估計是通過将 10 個股票指數 MLE 資料轉換為時間序列來建立的。VaR 估計是根據 MLE 時間序列資料進行的。未來值的預測（未來 100 天和 500 天）是從 MLE VaR 資料推斷出來的。在結果圖中，藍色圓圈表示未來 100 天的值，紅色圓圈表示 500 天的收益值。

VAR(merts, p = 2, tp = "cost")

# 預測未來125天、250天和500天
mle_r.pd <- prect(e.ar, n.ahad = 100, ci = 0.9)


plot(mea.prd)

第 4c 部分 - POT 的期望損失ES (CvaR) 預測

然後計算10隻股票指數MLE資料的條件風險值（"CvaR "或 "期望損失ES"）。資料的時間序列被用來尋找最差的0.95%的跌幅的最大值。通過極端分布的 "修正 "方法，計算出 "期望損失ES"，兩種計算的結果都以表格形式呈現。

# 最差的0.95%最大回撤的平均值
mdM <- maxdadw(mlvs[,2])

CvaR(ldaa), p=0.95, meto="mdii",
               pimeod = "comnen", weghts)

第 4d 節 - 峰值超過門檻值的 Hill 估計

Hill 估計（用于尾部指數的參數估計）驗證 10 隻股票的 MLE 資料是一個極值分布。

第 4e 節 - 正态分布的 Anderson-Darling 檢驗

Anderson-Darling 檢驗是确定大樣本數量分布的非正态性的有力決定因素。如果 P 值小于 0.05，則分布與正态性不同。此測試的結果 P 值為 3.7^-24。

第 4f 節 - 結果表

最後，給出了 10 個股票指數 MLE 未來價值的估計結果表。3 個 MLE VaR 估計值（和 MLE 期望損失ES）的點估計值和範圍被制成表格來比較。

第 4g 節 - 峰值超過門檻值的 100 天 GARCH 預測

通過将 MLE（10 隻股票指數的最大似然估計）拟合到 GARCH(1,1)（廣義自回歸條件異型性）模型，對峰值超過門檻值 EVT 資料進行預測。顯示預測公式參數表。建立了一個“自相關函數”（ACF）圖，顯示了随時間變化的重要事件。然後，顯示拟合模型結果的一組圖。然後建立對接下來 20 天（股票指數表現）的預測。最後，20 天的預測（來自峰值超過門檻值 EVT extimation）顯示在 2 個圖中。

fit(ec,ta, slvr = 'hybrid')



plot(pot.fite.ol)

第 5a 節 - 估計方法影響表

下表彙總了檢驗極值分布的 10 個股票的四種方法的結果。第一列包含四種估計方法的名稱。提供了 VaR、ES、mu統計量和 Anderson-Darling P 值的統計量。

c("VaR",
                     round(mean(cofets),4),
                     "NA", "NA", p.vau)
c("Block Maxm", round(mean(coffies),4),
                     MES, pr.ss[3],.vle)

c("POT", 
                     round(mean(cofies), 4),
                     MES, fitdaes, p.ale)

第 5b 節 - 結論

在對 10 家公司（在 DAX 證券交易所上市）的 10 年股票收益率進行檢查後，确認将收益率百分比的變化表征為極值分布的有效性。四種分析方法的拟合值的所有 Anderson-Darling 檢驗都顯示分布具有正态性或所有非極值值的機率不顯着。這些方法在收益資料中的風險價值方面是一緻的。Block Maxima 方法會産生 VaR 估計的輕微偏差。傳統的 VaR 估計和 POT 估計産生相同的風險價值。與股票收益率資料的傳統 CvaR 估計相比，這 2 種 EVT 方法預測的預期缺口較低。标準 QQ 圖表明峰值超過門檻值是最可靠的估計方法，

在對10家公司（在德國DAX證券交易所上市）10年的股票收益率進行檢查後，證明了将收益率變化定性為極值分布的有效性。對四種分析方法的拟合值進行的所有安德森-達林測試顯示，分布具有正态性或所有非極值的機率不大。這些方法在收益資料的風險值方面是一緻的。分塊最大值方法産生了一個風險值估計的偏差。傳統的VaR估計和POT估計産生相同的風險值。相對于傳統的股票收益率資料的CvaR估計，兩種EVT方法預測的期望損失較低。标準Q-Q圖表明，在10隻股票的指數中，Peaks-Over-Threshold是最可靠的估計方法。

最受歡迎的見解

1.R語言基于ARMA-GARCH-VaR模型拟合和預測實證研究

2.R語言時變參數VAR随機模型

3.R語言估計時變VAR模型時間序列的實證研究

4.R語言基于ARMA-GARCH過程的VAR拟合和預測

5.GARCH（1,1），MA以及曆史模拟法的VaR比較

6.R語言用向量自回歸（VAR）進行經濟資料脈沖響應

7.R語言實作向量自動回歸VAR模型

R語言極值理論 EVT、POT超門檻值、GARCH 模型分析股票指數VaR、條件CVaR：多元化投資組合預測風險測度分析

參考

第 1a 部分 - 工作目錄、所需的包和會話資訊

第 1b 節 - 格式化專有資料

第 1c 節 - 下載下傳股票代碼資料

第 2c 部分 - 估計期望shortfall(ES),條件VAR(CvaR) 10 股票指數

第 2d 節 - 10 隻股票指數的希爾Hill估計

第 2e 節 - 正态分布的 Anderson-Darling 檢驗

第 2f 節 - 結果表

第 3b 節 - 分塊最大值的 VaR 預測

第 3c 部分 - 分塊最大值的期望損失ES (CvaR)

第 3d 節 - 分塊極大值的 Hill 估計

第 3e 節 - 正态分布的 Anderson-Darling 檢驗

第 3f 節 - 結果表

第 3g 節 - 分塊極大值的 100 天 GARCH 預測

第 4b 節 - POT 的 VaR 預測

第 4c 部分 - POT 的期望損失ES (CvaR) 預測

第 4d 節 - 峰值超過門檻值的 Hill 估計

第 4e 節 - 正态分布的 Anderson-Darling 檢驗

第 4f 節 - 結果表

第 4g 節 - 峰值超過門檻值的 100 天 GARCH 預測

第 5b 節 - 結論

繼續閱讀

Lagrange插值的R語言實作

C++易錯知識點筆記（一）const關鍵字一，const常量二，const指針

微信小程式前端解密擷取使用者資訊

Spring MVC 自學雜記（五） -- SpringMVC與前台的json資料互動

《MySQL技術内幕：InnoDB存儲引擎》筆記

擴容TIKV節點遇到的坑

PHP輔導代做程式設計：CS353 Database System

Babylon.js 第21章材質映射到網格+貼花

仿美團實作地域選擇（二）

自學Zabbix3.10.2-事件通知Notifications upon events-Actions報警配置點選傳回：自學zabbix集錦

HDU 5678 ztr loves trees

R語言-相關性分析函數

拓端tecdat|R語言彈性網絡Elastic Net正則化懲罰回歸模型交叉驗證可視化

二叉樹及其應用--二叉樹建立

【可靠性評估】電力系統可靠性評估matlab仿真1.軟體版本2.本算法理論知識

詳解STM32單片機的堆棧