天天看點

Stata進行logistic回歸繪制列線圖并做内部驗證

我們已經講過怎麼使用R語言進行logistic回歸并做内部驗證,今天來講講怎麼使用Stata來做logistic回歸并做内部驗證,Stata較R來說的優勢是操作相對簡單,可以界面操作,比SPSS功能又強大一些,廢話不多說,進入正題。

還是使用既往我們的乳腺癌資料,我們先來看看資料:

age表示年齡,pathsize表示病理惡性良性腫瘤大小(厘米),lnpos表示腋窩淋巴結陽性,histgrad表示病理組織學等級,er表示雌激素受體狀态,pr表示孕激素受體狀态,status結局事件是否死亡,pathscat表示病理惡性良性腫瘤大小類别(分組變量),ln_yesno表示是否有淋巴結腫大,time是生存時間,後面的agec是我們自己設定的,不用管它。

Stata進行logistic回歸繪制列線圖并做内部驗證

依圖檔上紅色箭頭點選打開logistic回歸的視窗

Stata進行logistic回歸繪制列線圖并做内部驗證

在視窗界面依次填入協變量和結局變量

Stata進行logistic回歸繪制列線圖并做内部驗證

這樣最簡單的logistic回歸就做成啦

Stata進行logistic回歸繪制列線圖并做内部驗證

我們還要對其中的分類變量進行i.的标記,這樣指令就變成了:

logistic status age pathsize lnpos i.histgrad i.er i.pr pathscat

Stata進行logistic回歸繪制列線圖并做内部驗證

假如我們想比較有無淋巴結腫大患者是否結局不一樣,加入分類變量,可以分組來做

Stata進行logistic回歸繪制列線圖并做内部驗證

假如我們隻想知道age(年齡)大于60歲這部分的患者,可以加入條件語句age>=60

logistic status age pathsize lnpos i.histgrad i.er i.pr pathscat if age>=60

Stata進行logistic回歸繪制列線圖并做内部驗證

最後生成列線圖,這個圖有點怪不必驚訝,因為本來也不是logistic的資料,而且很多P值都是大于0.05的,有興趣的可以自己調整一下

Stata進行logistic回歸繪制列線圖并做内部驗證

現在我們來做内部驗證,主要是區分度和校準度,先做區分度:

Lroc//生成ROC曲線

Stata進行logistic回歸繪制列線圖并做内部驗證

接線來做校準度,最簡單的玩法就是先行拟合優度檢驗以評價模型校準度

lfit//拟合度檢測

Stata進行logistic回歸繪制列線圖并做内部驗證

P值大于0.05,不能說拟合不好,然後做出列聯表

estat gof, group(10) table

Stata進行logistic回歸繪制列線圖并做内部驗證

我們把Obs_1 ,Exp_1,Obs_0,Exp_0的值複制黏貼入excel,選擇帶趨勢的散點圖,這樣校準圖形就做成功啦

Stata進行logistic回歸繪制列線圖并做内部驗證

也可以做成這樣子

Stata進行logistic回歸繪制列線圖并做内部驗證

這樣做出來的校準曲線看起來檔次低一點,我們也可以做成這樣的并進行外部驗證,就不詳細說了,有興趣的可以關注我的科研教程。

Stata進行logistic回歸繪制列線圖并做内部驗證
Stata進行logistic回歸繪制列線圖并做内部驗證

更多精彩文章請關注:零基礎說科研

Stata進行logistic回歸繪制列線圖并做内部驗證