ちょうかん#2 - 盆栽日記

2.4欠測モデルからみた調査観察データと因果効果の定義

なんか抽象的過ぎてイメージが掴めないのでちょっと飛ばして具体論の節に入ってみる。

欠測と反実仮想モデル

ある介入の効果を見たい時、介入群と対照群を用意して結果を比較するというのが一般的な方法である。
その際、結果変数はそれぞれの群において一通りであると考えるのが普通。
しかしRubinは考えた。
介入群であっても、介入しなかった場合の値があってそれは欠測しているだけだ、と。
つまり独立変数の数だけ「本来ありえた結果」を考える。
それが反実仮想モデル。

因果効果の定義

対象者に対する因果効果→2つの潜在的結果変数の差
実際には必ず一方は観測できない（当たり前）。

Rubinの因果効果→2つの潜在的な結果変数の期待値の差
母集団の対象者全員が介入群と対照群にそれぞれ割り当てられた際の結果の差の平均、ともいえる。

因果効果と無作為割り当て

無作為割り当てによって、割り当てと結果変数を独立にする。
これにより欠測値（介入しなかった場合の「介入群」の結果変数とか）の存在を無視して、各群の平均値の差を用いることで因果効果をバイアスなく推定することができる。

処置群での介入効果

処置群での平均介入効果(average treatment effect on the treated:TET)
→処置群における潜在的な結果変数の差の期待値
※観測できない値を含んでいることに注意！

なお因果効果は処置群と対照群がどのような母集団から抽出されたものであるかに依存する量である

いまいちぴんとこない。
まあとりあえず先の因果効果よりも、TETの方が使うかな。

分位点での因果効果と周辺構造モデル

介入の効果が分位点によって異なることを調べる（たとえば太っている人ほど減量介入効果があるとか）場合、分位点での因果効果を求める必要がある。
必要性はわかるけど値の計算についてはぴんとこない。
周辺構造モデルについてはとばす。
どうでもいいけど、自分は添え字に弱いということがよくわかった。
添え字が2つ出てくると思考が止まる傾向にある。