Stata是一款集資料分析、資料管理以及繪制專業圖表的整合性統計軟體,它提供許許多多功能,包括線性混合模型、均衡重複反複及多項式普羅比模式,用Stata繪制的統計圖形相當精美。【功能特點】統計功能:Stata的統計功能很強,除了傳統的統計分析方法外,還收集了近20年發展起來的新方法,如Cox比例風險回歸,指數與Weibull回歸,多類結果與有序結果的logistic回歸,Poisson回歸,負二項回歸及廣義負二項回歸,随機效應模型等。具體說,Stata具有如下統計分析能力:數值變量資料的一般分析:參數估計,t檢驗,單因素和多因素的方差分析,協方差分析,互動效應模型,平衡和非平衡設計,嵌套設計,随機效應,多個均數的兩兩比較,缺項資料的處理,方差齊性檢驗,正态性檢驗,變量變換等。分類資料的一般分析:參數估計,列聯表分析(列聯系數,确切機率),流行病學表格分析等。等級資料的一般分析:秩變換,秩和檢驗,秩相關等相關與回歸分析:簡單相關,偏相關,典型相關,以及多達數十種的回歸分析方法,如多元線性回歸,逐漸回歸,權重回歸,穩鍵回歸,二階段回歸,百分位數(中位數)回歸,殘差分析、強影響點分析,曲線拟合,随機效應的線性回歸模型等。其他方法:品質控制,整群抽樣的設計效率,診斷試驗評價,kappa等。
軟體位址【 haszj.top 】
【軟體功能】
一、統計功能
1、統計功能很強,除了傳統的統計分析方法外,還收集了近 20 年發展起來的新方法,如 Cox 比例風險回歸,指數與 Weibull 回歸,多類結果與有序結果的 logistic 回歸, Poisson 回歸,負二項回歸及廣義負二項回歸,随機效應模型等。具體說, 具有如下統計分析能力:
2、數值變量資料的一般分析:參數估計,t檢驗,單因素和多因素的方差分析,協方差分析,互動效應模型,平衡和非平衡設計,嵌套設計,随機效應,多個均數的兩兩比較,缺項資料的處理,方差齊性檢驗,正态性檢驗,變量變換等。
3、分類資料的一般分析:參數估計,列聯表分析 ( 列聯系數,确切機率 ) ,流行病學表格分析等。
4、等級資料的一般分析:秩變換,秩和檢驗,秩相關等
5、相關與回歸分析:簡單相關,偏相關,典型相關,以及多達數十種的回歸分析方法,如多元線性回歸,逐漸回歸,權重回歸,穩鍵回歸,二階段回歸,百分位數 ( 中位數 ) 回歸,殘差分析、強影響點分析,曲線拟合,随機效應的線性回歸模型等。
6、其他方法:品質控制,整群抽樣的設計效率,診斷試驗評價, kappa 等。
二、作圖功能
1、作圖子產品,主要提供如下八種基本圖形的制作 : 直方圖 (histogram) ,條形圖 (bar), 百分條圖 (oneway) ,百分圓圖 (pie) ,散點圖 (twoway) ,散點圖矩陣(matrix) ,星形圖 (star) ,分位數圖。這些圖形的巧妙應用,可以滿足絕大多數使用者的統計作圖要求。在有些非繪圖指令中,也提供了專門繪制某種圖形的功能,如在生存分析中,提供了繪制生存曲線圖,回歸分析中提供了殘差圖等。
2、矩陣運算功能
矩陣代數是多元統計分析的重要工具, 提供了多元統計分析中所需的矩陣基本運算,如矩陣的加、積、逆、 Cholesky 分解、 Kronecker 内積等;還提供了一些進階運算,如特征根、特征向量、奇異值分解等;在執行完某些統計分析指令後,還提供了一些系統矩陣,如估計系數向量、估計系數的協方差矩陣等。
三、程式設計功能
1、一個統計分析軟體,但它也具有很強的程式語言功能,這給使用者提供了一個廣闊的開發應用的天地,使用者可以充分發揮自己的聰明才智,熟練應用各種技巧,真正做到随心所欲。事實上, 軟體的 ado 檔案 ( 進階統計部分 ) 都是用軟體中自己的語言編寫的
2、統計分析能力遠遠超過了 SPSS ,在許多方面也超過了 SAS !由于在分析時是将資料全部讀入記憶體,在計算全部完成後才和磁盤交換資料,是以計算速度極快(一般來說, SAS 的運算速度要比 SPSS 至少快一個數量級,而軟體的某些子產品和執行同樣功能的 SAS 子產品比,其速度又比 SAS 快将近一個數量級!) 程式也是采用指令行方式來操作,但使用上遠比 SAS 簡單。其生存資料分析、縱向資料(重複測量資料)分析等子產品的功能甚至超過了 SAS 。用程式繪制的統計圖形相當精美,很有特色。
四、功能清單
1、資料管理 (Data management)
資料轉換、分組處理、附加檔案、 ODBC 、行 - 列轉換、資料标記、字元串函數…等
2、基本統計 (Basic statistics)
直交表、相關性、 t- 檢定、變異數相等性檢定、比例檢定、信賴區間…等3、線性模式 (Linear models)穩健 Huber/White/sandwich 變異估計,三階最小平方法、類非相關回歸、齊次多項式回歸、 GLS4、廣義型線性模式 (Generalized linear models)
十連結函數、使用者 - 定義連結、 ML 及 IRLS 估計、九變異數估計、七殘差…等
5、二進制、計數及有限應變量
(Binary,count,and limited dependent variables)
羅吉斯特、 probit 、蔔松回歸、 tobit 、 truncated 回歸、條件羅吉斯特、多項式邏輯、巢狀邏輯、負二項、 zero-inflated 模型、 Heckman 選擇模式、邊際影響
6、Panel 資料 / 交叉 - 組合時間序列
(Panel data/cross-sectional time-series)
随機及固定影響之回歸、 GEE 、随機及固定 - 影響之蔔松及負二項配置設定、随機 - 影響、工具變量回歸、AR(1) 幹擾回歸
7、無母數方法 (Nonparametric methods)
8、多變量方法 (Multivariate methods)
9、因素分析、多變量回歸、 anonical 相關系數
模型檢定及事後估計量支援分析
(Model testing and post-estimation support)
10、Wald 檢定、 LR 檢定、 線性及非線性組合、非線性限制檢定、邊際影響、修正平均數 Hausman 檢定11、群集分析 (Cluster analysis)
權重平均,品質中心及中位數聯結、 kmeans 、 kmedians 、 dendrograms 、停止規則、使用者擴充12、圖形 (Graphics)
直線圖、散布圖、條狀圖、圓餅圖、 hi-lo 圖、回歸診斷圖…
13、調查方法 (Survey methods)
抽樣權重、叢集抽樣、分層、線性變異數估計量、拟 - 概似最大估計量、回歸、工具變量…
14、生存分析 (Survival analysis)
Kaplan – Meier 、 Nelson – Aalen, 、 Cox 回歸 ( 弱性 ) 、參數模式 ( 弱性 ) 、危險比例測試、時間共變項、左 - 右檢查、韋柏配置設定、指數配置設定…
15、流行病學工具 (Tools for epidemiologists)比例标準化、病例控制、已配适病例控制、 Mantel – Haenszel,藥理學、 ROC 分析、 ICD-9-CM
16、時間序列 (Time series)
ARIMA 、 ARCH/GARCH 、 VAR 、 Newey – West 、 correlograms 、 periodograms 、白色 - 噪音測試 ,17、最小整數根檢定、時間序列運算、平滑化
最大概似法 (Maximum likelihood)
18、轉換及常态檢定 (Transforms and normality tests)
Box – Cox 、次方轉換 Shapiro – Wilk 、 Shapiro – Francia 檢定
其它統計方法 (Other statistical methods)
樣本數量及次方、非線性回歸、逐漸式回歸 、統計及數學函數
包含樣本範例 (Sample session)
19、再抽樣及模拟方法 (Resampling and simulation methods)
bootstrapping 、 jackknife 、蒙地卡羅模拟、排列檢定
五、網絡功能
安裝新指令、網絡更新、網站檔案分享、最新消息
Stata15功能介紹
基本統計(basic statistics)
stata把成百個統計工具放到您的指邊,從進階的技術,比如帶有frailty,動态面闆資料(dpd)回歸的幸存模型,廣義評估方程式(gee),多層混合模型,帶樣本選擇的模型,arch,和帶有複雜幸存樣本的評估;對于标準模型,比如線性和廣義線性模型(glm),帶有計數和二進制結果的回歸,anova/manova,聚集分析,比率标準化,案例控制分析,基本表格和彙總統計。
完整的資料管理工具(data management)
stata的資料管理指令讓您可以完整對所有類型的資料進行控制; 您能夠組合和重新規劃資料集,管理變量,和跨組或重複搜集統計資訊。您能夠處理位元組型,整數型,長整型,浮點型,雙位元組型和字元型變量。stata同樣也擁有管理特殊資料,比如幸存/連續資料,時間序列資料,面闆/longitudinal資料,分類資料和調查資料。
可以将分組變量轉換成訓示變量(啞變量),将字元串變量映射成數字代碼。
可以對資料檔案進行橫向和縱向連結,可以将行資料轉為列資料,或反之。
可以恢複、修改執行過的指令。
可以利用數值函數或字元串函數産生新變量。
可以從鍵盤或磁盤讀入資料。
線性模式(linear models)
穩健huber/white/sandwich 變異估計, 三階最小平方法、類非相關回歸、齊次多項式回歸、gls
廣義型線性模式(generalized linear models)
十連結函數、使用者-定義連結、ml及irls估計、九變異數估計、七殘差…等
模型檢定及事後估計量支援分析(model testing and post-estimation support)
wald檢定、lr 檢定、 線性及非線性組合、非線性限制檢定、邊際影響、修正平均數hausman檢定。
二進制、計數及有限應變量(binary,count,and limited dependent variables)
羅吉斯特、probit、蔔松回歸、tobit、truncated回歸、條件羅吉斯特、多項式邏輯、巢狀邏輯、負二項、zero-inflated 模型、heckman 選擇模式、邊際影響(panel data/cross-sectional time-series)随機及固定影響之回歸、gee、随機及固定-影響之蔔松及負二項配置設定、随機-影響、工具變量回歸、ar(1)幹擾回歸
群集分析(cluster analysis)
權重平均, 品質中心及中位數聯結、kmeans、kmedians、dendrograms、停止規則、使用者擴充
調查方法(survey methods)
抽樣權重、叢集抽樣、分層、線性變異數估計量、拟-概似最大估計量、回歸、工具變量…
出版級品質的圖形
stata能很容易的生成出版級品質,清晰風格的圖形,包括回歸拟合圖形,分布圖形,時間序列圖形和幸存圖。通過完整的圖形編輯器,您可以點選修改圖形上的任意部分或添加标題,注釋,線條,箭頭和文本。您可以選擇已有的圖形樣式,或建立您自己的樣式。
生存分析(survival analysis)
kaplan–meier、nelson–aalen,、cox 回歸(弱性)、參數模式(弱性)、危險比例測試、時間共變項、左-右檢查、韋柏配置設定、指數配置設定…
時間序列(time series)
arima、arch/garch、var、newey-west、 correlograms、periodograms、白色-噪音測試,最小整數根檢定、時間序列運算、平滑化。
流行病學工具(tools for epidemiologists)
比例标準化、病例控制、已配适病例控制、mantel–haenszel, 藥理學、roc 分析、icd-9-cm
譯文
整日裡,昏昏沉沉,醉夢人世間,忽然聽說春日将盡,于是打起精神勉強登上了鎮江南山。
經過古竹院,遇見了方丈大師,與其攀談許久,方覺得心無挂礙才是人生真正的清閑啊。
注釋
強:勉強。
因:由于。
過:遊覽,拜訪。
竹院:即寺院。
此處“偷”在有的詩歌版本中作“又”字
賞析
這是唐代詩人李涉的一首題壁詩。
“鶴林寺”,是江蘇鎮江南郊最古老、寺院規模最大,古迹、典故最多的寺院。始建于東晉元帝大興四年(321),距今已有1700多年曆史。相傳南朝宋武帝劉裕幼年家貧,青少年時代到黃鶴山砍柴時,頭頂常有黃鶴翩翩飛舞。稱帝後,遂改寺名為鶴林寺。唐玄宗開元、天寶年間,僧人元素任該寺住持,名為古竹院。這就是詩中稱其“竹院”的緣故。
“終日昏昏醉夢間,忽聞春盡強登山。”這兩句是說,整日裡,昏昏沉沉,醉夢人世間,忽然聽說春日将盡,于是打起精神勉強登上了南山。