我們已經講過怎麼使用R語言進行logistic回歸并做内部驗證,今天來講講怎麼使用Stata來做logistic回歸并做内部驗證,Stata較R來說的優勢是操作相對簡單,可以界面操作,比SPSS功能又強大一些,廢話不多說,進入正題。
還是使用既往我們的乳腺癌資料,我們先來看看資料:
age表示年齡,pathsize表示病理惡性良性腫瘤大小(厘米),lnpos表示腋窩淋巴結陽性,histgrad表示病理組織學等級,er表示雌激素受體狀态,pr表示孕激素受體狀态,status結局事件是否死亡,pathscat表示病理惡性良性腫瘤大小類别(分組變量),ln_yesno表示是否有淋巴結腫大,time是生存時間,後面的agec是我們自己設定的,不用管它。
依圖檔上紅色箭頭點選打開logistic回歸的視窗
在視窗界面依次填入協變量和結局變量
這樣最簡單的logistic回歸就做成啦
我們還要對其中的分類變量進行i.的标記,這樣指令就變成了:
logistic status age pathsize lnpos i.histgrad i.er i.pr pathscat
假如我們想比較有無淋巴結腫大患者是否結局不一樣,加入分類變量,可以分組來做
假如我們隻想知道age(年齡)大于60歲這部分的患者,可以加入條件語句age>=60
logistic status age pathsize lnpos i.histgrad i.er i.pr pathscat if age>=60
最後生成列線圖,這個圖有點怪不必驚訝,因為本來也不是logistic的資料,而且很多P值都是大于0.05的,有興趣的可以自己調整一下
現在我們來做内部驗證,主要是區分度和校準度,先做區分度:
Lroc//生成ROC曲線
接線來做校準度,最簡單的玩法就是先行拟合優度檢驗以評價模型校準度
lfit//拟合度檢測
P值大于0.05,不能說拟合不好,然後做出列聯表
estat gof, group(10) table
我們把Obs_1 ,Exp_1,Obs_0,Exp_0的值複制黏貼入excel,選擇帶趨勢的散點圖,這樣校準圖形就做成功啦
也可以做成這樣子
這樣做出來的校準曲線看起來檔次低一點,我們也可以做成這樣的并進行外部驗證,就不詳細說了,有興趣的可以關注我的科研教程。
更多精彩文章請關注:零基礎說科研