傾向スコアマッチングは、因果推論において観測データから傾向スコアと呼ばれる変数を作成し、そのスコアが似ている群を作り、それらの群間で比較を行うことで、交絡因子の影響を除外して因果効果を推定する手法です。
傾向スコアは、因果推論の基本的な仮定である「共変量調整可能性」を担保するために導入されます。共変量調整可能性とは、因果効果を正確に推定するために、介入群と非介入群で均等になるような共変量を選ぶことができることを指します。しかし、共変量が多い場合、処理群と対照群で共変量が一致しない場合があり、その場合、交絡因子が残り、因果効果の推定に影響を与えることがあります。
傾向スコアは、介入群に属する確率(propensity score)を表します。介入群に属する確率は、介入と関連のある共変量を用いて、ロジスティック回帰などのモデルによって予測されます。そして、傾向スコアが似ている対照群と介入群をマッチングすることにより、交絡因子の影響をコントロールすることができます。
傾向スコアマッチングの手順は以下のようになります。
- 傾向スコアの計算:介入群に属する確率を計算するために、介入と関連のある共変量を用いて、ロジスティック回帰などのモデルによって傾向スコアを計算する。
- マッチング方法の選択:傾向スコアに基づいて、対照群と介入群をマッチングする方法を選択する。代表的なマッチング方法には、最近傍法、一対多重マッチング、重み付けマッチングなどがあります。
- マッチングの実行:選択したマッチング方法に従って、傾向スコアが近い介入群と対照群をペアにする。
- マッチング後の分析:マッチング後に、介入群と対照群の間で因果効果を推定する。
傾向スコアマッチングは、観察研究において介入効果を推定するための統計手法の一つで、介入群と対照群をマッチングすることで、共変量の不均衡を解消し、因果効果をより正確に推定することを目的としています。
傾向スコアとは、介入と関連のある共変量を用いて、ロジスティック回帰などのモデルによって計算される確率です。この確率は、介入群に属する確率を表しており、この確率が近い介入群と対照群をペアにすることで、共変量の不均衡を解消します。
マッチング方法は、最近傍法、一対多重マッチング、重み付けマッチングなどがあります。最近傍法は、傾向スコアが最も近い介入群と対照群をペアにする方法で、一対多重マッチングは、介入群の1つの観測値に対して、複数の対照群をペアにする方法です。重み付けマッチングは、傾向スコアの逆数を重みとして、介入群と対照群を重み付けしてペアを作成する方法です。
マッチング後の分析では、介入群と対照群の間で因果効果を推定することができます。この推定には、t検定、ウィルコクソンの順位和検定、対数変換をした上でのt検定などの統計的手法が用いられます。
傾向スコアマッチングは、ランダム化比較試験が困難な場合に有用な手法であり、共変量の不均衡を解消することで、因果効果をより正確に推定することができます。しかし、傾向スコアの計算やマッチング方法の選択には、統計的な知識と専門的なスキルが必要となるため、注意が必要です。
===
"make you feel, make you think."
SGT&BD
(Saionji General Trading & Business Development)
説明しよう!西園寺貴文とは、常識と大衆に反逆する「社会不適合者」である!平日の昼間っからスタバでゴロゴロするかと思えば、そのまま軽いノリでソー◯をお風呂代わりに利用。挙句の果てには気分で空港に向かい、当日券でそのままどこかへ飛んでしまうという自由を履き違えたピーターパンである!「働かざること山の如し」。彼がただのニートと違う点はたった1つだけ!そう。それは「圧倒的な書く力」である。ペンは剣よりも強し。ペンを握った男の「逆転」ヒップホッパー的反逆人生。そして「ここ」は、そんな西園寺貴文の生き方を後続の者たちへと伝承する、極めてアンダーグラウンドな世界である。 U-18、厳禁。低脳、厳禁。情弱、厳禁。