天天看點

PSM 傾向性比對(一)基礎知識1.基礎知識2.随機分組

作者:Ernnnn

b站:Ernnnn

公衆号:統計分析分析

所有文章都在公衆号,b站有視訊版

PSM 傾向性比對

文章目錄

  • 1.基礎知識
    • 1.1 什麼叫處理效應
    • 1.2ATE ATT ATU
    • 1.3 選擇難題
  • 2.随機分組

1.基礎知識

1.1 什麼叫處理效應

對于個體 i i i而言,其未來收入為 y y y ,有

y i = { y 1 i  若  D i = 1 y 0 i  若  D i = 0 y_{i}=\left\{\begin{array}{ll}y_{1 i} & \text { 若 } D_{i}=1 \\ y_{0 i} & \text { 若 } D_{i}=0\end{array}\right. yi​={y1i​y0i​​ 若 Di​=1 若 Di​=0​

而處置效應就是 y 1 i − y 0 i y_{1i} - y_{0i} y1i​−y0i​,通俗來說就是如果一個人參加了這個活動的y減去不參加的y就等于處置效應。

聰明的同學就會問,這不是很簡單嗎?這當然不簡單,這個y必須是同個體!不能用另外一個的不參加的y減。

是以嚴格來講就是平行時空下,參加了A活動的你與未參加活動的你進行做差。

但這個事實上是不可能的,是以這個思想架構又稱為反事實架構。

1.2ATE ATT ATU

上面講了處理效應,是針對個體,個體一般是沒有統計意義的,是以還需要消除個體差異,計算一大群人的處理效應,然後取期望即可得到穩健的結果。

根據人群不同,對應的也不同。

人群 簡稱 名稱 公式
全體 ATE 平均處置效應 E ( y 1 i − y 0 i ) \mathrm{E}\left(y_{1i}-y_{0i}\right) E(y1i​−y0i​)
隻參加活動 ATT 參與者平均處置效應 E ( y 1 i − y 0 i ∣ D i = 1 ) \mathrm{E}\left(y_{1i}-y_{0i} \mid D_i = 1\right) E(y1i​−y0i​∣Di​=1)
非參加活動 ATU 非參與者平均處置效應 E ( y 1 i − y 0 i ∣ D i = 0 ) \mathrm{E}\left(y_{1i}-y_{0i} \mid D_i = 0\right) E(y1i​−y0i​∣Di​=0)

1.3 選擇難題

上面我們提出了基于反事實架構的處理效應以及平均處置效應,但是可惜的是,我們事實上是沒有辦法求的。平常我們求解一個事件的影響,通常是這樣的:

舉個例子:熬夜對壽命是不好的,這個問題我們平時是怎麼思考的?

可能就是經常熬夜的人壽命減去不熬夜的人的壽命,如果是小于0的話,就說明熬夜是不利于長壽的,反之就說明熬夜除了有眼圈,壽命啥的沒有影響。

但是這樣存在這樣一個問題,可能更健康的人更偏向不熬夜,不熬夜隻是他的其中一個習慣,

是以即使熬夜他們壽命也是一樣長(如果壽命并不受那個影響);相反,對于經常熬夜的人來說,他們本身不自律帶有不健康的身體,就更傾向于熬夜,是以壽命即使不熬夜也會短一些。

是以我們并不能得出一個可靠的結論。這就是選擇難題

寫成式子就是:

E ( y 1 i ∣ D i = 1 ) − E ( y 0 i ∣ D i = 0 ) = E ( y 1 i ∣ D i = 1 ) − E ( y 0 i ∣ D i = 1 ) + E ( y 0 i ∣ D i = 1 ) − E ( y 0 i ∣ D i = 0 ) \mathrm{E} \left(y_{1i} \mid D_i = 1\right) - \mathrm{E} \left(y_{0i} \mid D_i = 0\right) \\ =\mathrm{E} \left(y_{1i} \mid D_i = 1\right) - \mathrm{E} \left(y_{0i} \mid D_i = 1\right) \\ \text {+} \mathrm{E} \left(y_{0i} \mid D_i = 1\right) - \mathrm{E} \left(y_{0i} \mid D_i = 0\right) E(y1i​∣Di​=1)−E(y0i​∣Di​=0)=E(y1i​∣Di​=1)−E(y0i​∣Di​=1)+E(y0i​∣Di​=1)−E(y0i​∣Di​=0)

可以看到直接相減并找不到我們所要求的處置效應,還需要進行分解才能找到我們需要的效應,而還多出來一個選擇偏差。

2.随機分組

選擇難題并非無解,随機分組則是最“簡單”的解決方案。試想一下我們如果将人群随機分成熬夜組和非熬夜組,那麼其均值之差就等于是處置效應。

因為什麼呢?

E ( y 1 i ∣ D i = 1 ) − E ( y 0 i ∣ D i = 0 ) = E ( y 1 i ) − E ( y 0 i ) = A T E = A T T \mathrm{E}\left(y_{1 i} \mid D_{i}=1\right)-\mathrm{E}\left(y_{0 i} \mid D_{i}=0\right)=\mathrm{E}\left(y_{1 i}\right)-\mathrm{E}\left(y_{0 i}\right)=\mathrm{ATE}=\mathrm{ATT} E(y1i​∣Di​=1)−E(y0i​∣Di​=0)=E(y1i​)−E(y0i​)=ATE=ATT

根據國小兩年級的知識即可知道當 D D D和 y y y互相獨立時,條件期望等于無條件期望,是以ATT=ATE.

是以我們能夠簡單計算實驗組和控制組的平均收入之差就可以一緻地估計平均處理效應。即差分估計量,漸進服從正态分布。看到這裡聰明的同學就會發現這個估計量,長得很像t統計量,沒錯這個統計量和t統計量關系非常密切!詳見這篇文章。

進一步的我們如果隻關心ATT,則隻需要 y 0 i y_{0i} y0i​均值獨立于D即可,不需要對其他進行任何限制。

E ( y 0 i ∣ D i = 1 ) − E ( y 0 i ∣ D i = 0 ) = E ( y 0 i ) − E ( y 0 i ) = 0 \mathrm{E}\left(y_{0 i} \mid D_{i}=1\right)-\mathrm{E}\left(y_{0 i} \mid D_{i}=0\right)\\=\mathrm{E}\left(y_{0 i} \right)-\mathrm{E}\left(y_{0 i}\right)=0 E(y0i​∣Di​=1)−E(y0i​∣Di​=0)=E(y0i​)−E(y0i​)=0

那麼計算參與者和未參與者的平均差異就可以得到ATT,我們關心的估計量。

但是随機分組是一個非常消耗資源的事情,大部分情況下是做不到的(窮)。如果隻有觀測資料,則大部分情況不滿足需要 y 0 i y_{0i} y0i​均值獨立于D的假設。這時候要怎麼辦呢?敬請留意下節内容。

繼續閱讀