天天看點

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

原文連結 http://tecdat.cn/?p=14139

我們考慮風險敞口,計算包含風險敞口的多個數量(經驗均值和經驗方差)的非參數估計量。如果要對二項式變量模組化。

這裡的模型如下:

  • 未觀察到該期間的索賠數量 
  • 索償的數量  

考慮一種情況,其中關注變量不是索償的數量,而僅僅是索償發生的标志。利用蔔瓦松過程模型,我們可以獲得

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

這意味着在一年的前六個月中沒有索賠的機率是一年中沒有索賠的平方根。假設可以

通過一些連結函數(使用GLM術語)表示為一些協變量來解釋沒有索賠的機率,

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

我們有

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

我們将使用的資料集

> T1= contrat$nocontrat[I==FALSE]> nombre2 = data.frame(nocontrat=T1,nbre=0)> sinistres = merge(contrat,nombre)> sinistres$nonsin = (sinistres$nbre==0)
           

我們可以考慮的第一個模型基于标準的邏輯回歸方法

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

但是很難用标準函數處理。盡管如此,始終有可能通過數值計算給定的最大似然估計量。

> optim(fn=logL,par=c(-0.0001,-.001),+ method="BFGS")$par[1] 2.14420560 0.01040707$value[1] 7604.073$countsfunction gradient42       10$convergence[1] 0$messageNULL
           

現在,讓我們看看基于标準回歸模型的替代方案。例如對數線性模型(Logistic回歸算法)。如果是指數函數(或  對數連結函數)  

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

現在,我們對其進行編碼,

Error: no valid set of coefficients has been found: please supply starting values
           

嘗試了所有可能的方法,但是無法解決該錯誤消息,

> reg=glm(nonsin~ageconducteur+offset(exposition),+ data=sinistresI,family=binomial(link="log"),+ control = glm.control(epsilon=1e-5,trace=TRUE,maxit=50),+ start=startglm,+ etastart=etaglm,mustart=muglm)Deviance = NaN Iterations - 1Error: no valid set of coefficients has been found: please supply starting values
           

是以我決定放棄。因為

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

其中

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

接近0,

是以我們可以用泰勒展開,

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

在這裡,暴露數不再顯示為機率的幂,而是相乘。如果我們考慮對數連結函數,那麼我們可以合并暴露數的對數。

最終可以完美運作了。

現在,要檢視最終模型,我們回到Poisson回歸模型,因為我們确實有機率模型。

現在我們可以比較這三個模型。我們還應該包括沒有任何解釋變量的預測。對于第二個模型,我們運作

>  regreff=glm((1-nonsin)~1+offset(log(exposition)),+ data=sinistres,family=binomial(link="log"))
           

預測

> exp(coefficients(regreff))(Intercept)0.06776376
           

可與邏輯回歸比較,

> 1-exp(param)/(1+exp(param))[1] 0.06747777
           

但是與泊松模型有很大的不同,

(Intercept)0.07279295
           

我們産生一個圖表比較那些模型,

> lines(age,1-yml1,type="l",col="purple")> abline(h=exp(coefficients(regreff)),lty=2)
           
r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

在這裡觀察到這三個模型是完全不同的。實際上,使用兩個模型,可以進行更複雜的回歸分析(例如使用樣條曲線),以可視化年齡對發生或不發生交通事故機率的影響。如果将泊松回歸(仍為紅色)和對數二項式模型與泰勒展開進行比較,我們得到

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

點選标題查閱往期内容

R語言非參數模型厘定保險費率:局部回歸、廣義相加模型GAM、樣條回歸 R語言中自編基尼系數的CART回歸決策樹的實作 R語言中回歸模型預測的不同類型置信區間應用比較分析 R語言中的廣義線性模型(GLM)和廣義相加模型(GAM):多元(平滑)回歸分析保險資金投資組合信用風險敞口 R語言中的偏最小二乘PLS回歸算法 R語言對用電負荷時間序列資料進行K-medoids聚類模組化和GAM回歸 基于R語言的lmer混合線性回歸模型 Python用PyMC3實作貝葉斯線性回歸模型 r語言中對LASSO回歸,Ridge嶺回歸和Elastic Net模型實作 R語言如何和何時使用glmnet嶺回歸 python用線性回歸預測股票價格 偏最小二乘回歸(PLSR)和主成分回歸(PCR) R語言如何在生存分析與Cox回歸中計算IDI,NRI名額 R使用LASSO回歸預測股票收益

更多内容,請點選左下角“”檢視報告全文

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化
r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化
r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

關注我們

案例精選、技術幹貨 第一時間與您分享

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

長按二維碼加關注

更多内容,請點選左下角“”檢視報告全文

r ridge回歸_R語言邏輯回歸和泊松回歸模型對發生交通事故機率模組化

繼續閱讀