天天看點

Stata學習筆記|資料處理3-類型轉化

目錄

資料的三種類型(在stata中以顔色區分)

類型轉化

1.destring 紅轉黑(限于第一種紅色) 

2.tostring 黑轉紅

3.encode 紅轉藍(限于第二種紅色)

4.label define&label value 黑轉藍

5. 紅轉黑+黑轉藍

資料的三種類型(在stata中以顔色區分)

  • 紅色:文本(可以按照字母順序進行排序)type:string(str)字元串
    • 一種:純數字(stkcd股票代碼)
    • 另一種:純文字(省份名稱、行業名稱)
  • 黑色:數字(可以做回歸分析)
  • 藍色:數字-文字對應表(虛拟變量)實質上也是數字

類型轉化

1.destring 紅轉黑(限于第一種紅色) 

目的:将字元串型的轉化為數值型

比如:國泰安下載下傳的資料——stkcd股票代碼,在stata打開中是紅色的,這是我們需要把它轉化為黑色數字型

destring stkcd ,replace
           

2.tostring 黑轉紅

目的:什麼時候适用于這種反向操作?—— 有時候字元串型比數值型更好進行操作,比如date的操作

tostring stkcd,replace
           

3.encode 紅轉藍(限于第二種紅色)

比如:将省份名稱、行業名稱、股權性質這種轉化為數字-文字對應表

缺點:encode要産生一個新變量

encode equitynature, gen(e1) //将純文字轉為數字-文字對應表
des2                         //檢視對應關系
labelbook                    //與以上同理
           
Stata學習筆記|資料處理3-類型轉化

檢視對應關系

4.label define&label value 黑轉藍

目的:把數值型轉化為數字-文字對應表

比如:國泰安下載下傳的資料——兩職合一,在stata中打開已經是數值型1和2,但是我想知道1代表什麼,2代表什麼,這個時候就可以加數字文字對應表

label define X  1 "同一人" 2 "不同一人"  //把1、2分别對應的類型定義為X标簽
label value  Dual  X      //将X标簽加到變量Dual上
           

5. 紅轉黑+黑轉藍

比如:

  • 國泰安下載下傳的資料——是否為四大事務所,在stat中打開是紅色“Y”和“N”,如果直接用encode得到的對應表可能并不是我想要的
  • 我要得到的類别變量,1表示是,0表示否
*直接用encode紅轉藍
encode big4, gen(Big4)
des2
           
Stata學習筆記|資料處理3-類型轉化
*先紅轉黑
gen Big4=1 if big4=="Y"
replace Big4=0 if big4=="N"
*黑轉藍 定義自己的對應關系表
label define Big4   1 "是" 0 "否"  
label value  Big4  Big4
des2
           
Stata學習筆記|資料處理3-類型轉化

繼續閱讀