*1使用前
clear *关掉一个数据集
findit 加随便一个名词
help 加一个具体操作
*2打开数据集
*use “C:\Users\Administrator\Desktop\stata伍德里奇-数据集\CEOSAL1.DTA”,
use"\",
*清空数据集
clear
*3查看变量
*创造变量
gen 加变量名=
*罗列
desc
*有个数、均值、变差(一般要求不太小才可以显著)、最小、最大
sum
*也可后面加感兴趣的变量,双击变量
*4回归系数
corr 加变量名
*得一矩阵,对角线为1,看各自对各自的
*5一元线性回归
*同方差和异方差得系数一样,只是stand.error 不一样
reg或者regress 加因变量 加自变量 同方差
reg或者regress 加因变量 加自变量,robust
或
reg或者regress 加因变量 加自变量,robust或者r异方差
*拟合值
predict 加变量名
*残差
predict 加变量名,resi
*到数据查看器看
*6画图,二维
plot 加变量名 加变量名
*最好加上lable更易懂
*两图画到一个坐标系
twoway()()
*散点图:scatter 因变量 自变量
*线性图:lfit 因变量 自变量
*eg:
twoway(scatter salary roe )(lfit salary roe )
*7放到dofile文件
*右键选中命令,全选,发送到dofile文件,可增删
*加注解
*不想滑,首行加set mre off
set more off
*若不想打开stata查看加结果
*eg:
log using"C:\Users\Administrator\Desktop",replace
*或者depend
*replace每次运行都产生新的替代,depend新的接在旧后面
use “C:\Users\Administrator\Desktop\stata伍德里奇-数据集\CEOSAL2.DTA”, clear
sum salary roe
reg salary grad
reg salary grad,robust
reg salary grad,r
twoway(scatter salary grad )(lfit salary grad )
log close
*8原假设:belta=0,备择假设:belta不等0
*P>| t |这里的值,与arfa对比,若arfa>=该值,则在该阿尔法下拒绝原假设;若arfa<该值,则在该阿尔法下接受原假设
*95% Conf.Interval是以arfa=5%构造的置信区间,看原假设中的估计值在不在该区间中
*eg:
*part1
*设置随机数种子
set seed 0
设置样本容量
set obs 500
x服从[0,10]的均匀分布
gen x=10uniform()
u服从[0,36]的正态分布
gen u=6rnormal()
gen y=1+2x+u
reg y x
part2
估计1和2
set seed 0
改变样本容量
set obs 5000
gen x1=10uniform()
gen u1=6rnormal()
gen y1=1+2x1+u1
reg y1 x1
*part3
看u是不是均值为0
predict uhat,resi
sum uhat
看xu是不是均值为0
gen xuhat=x1uhat
sum xuhat