はじめに
最近因果推論の書籍が増えてきたな~と感じています。流行りなんでしょうか。とりあえず目にしたものは全部買っているので、どの本から読めばいいかわからないままに積読が増えています。
今回はひとまず「はじめての統計的因果推論」を読みました。読書体験がとても良かったこともあり、備忘録を兼ねて感想と読書メモを書いていきます。
概要
目次を引用します1。
はじめに
BOX 0.1 そもそもなぜ「ちがい」と「しくみ」の両面から見ていくのか第Ⅰ部 因果推論の基本的な考え方
1 因果と相関と「特性の分布の(アン)バランス」
1.1 まず、「対象のありよう」を丁寧に考えよう
1.2 相関と因果と、特性の分布のバランス
1.3 基本的なゴールとしての「特性の分布のバランシング」
BOX 1.1 「共変量のバランシング/処置Tと特性Cが独立」のイメージをつかむ
1.4 そもそも何が揃うと「因果関係」といえるのか?
BOX 1.2 因果概念をめぐる哲学的議論について
1.5 手始めの一歩――層別化による因果効果の推定
1.6 この章のまとめ
BOX 1.3 統計的因果推論における「目的」「識別」「推定」の論点2 どの特性を揃えるべきなのか――因果ダイアグラムとバックドア基準
2.1 相関と因果の違い
2.2 いざ、バックドア基準へ
BOX 2.1 バックドア基準は「何について」の話?
BOX 2.2 「分岐点のケース」を回帰分析の枠組みでおさらいする
BOX 2.3 因果ダイアグラム関係の専門用語の補足
BOX 2.4 代理(プロキシ)として働く変数のふるまい――考えていくと沼へとつながる話
2.3 まとめとしてのバックドア基準――とどのつまり、どの変数をバランシングするべきなのか
BOX 2.5 バックドア基準の観点から見たシンプソンのパラドックス
2.4 いくつかの例題でのおさらい――習うより慣れよう
BOX 2.6 因果構造の全体を知る必要はない――路線図の喩え
2.5 バックドア基準を踏まえて、「目指すべきゴール」をアップデート
2.6 この章のまとめ
BOX 2.7 因果ダイアグラムなんて描けません!
BOX 2.8 「バックドア基準を満たす変数セット」なんて観測できません!3 因果推論、その(不)可能性の中心――潜在結果モデルと無作為化
3.1 潜在結果モデルへの入り口――個体レベルでの因果効果から考える
3.2 潜在結果モデル――「もしも」の世界も考える
BOX 3.1 可能世界論と反事実
BOX 3.2 ATTとATEとATU
BOX 3.3 潜在結果と観測値の関係を数式で表現する
3.3 無作為化――コイントスで「不可能」を「可能」に“フリップ”する
BOX 3.4 無作為化と管理のイメージ
3.4 因果ダイアグラムから眺める無作為化
3.5 この章のまとめ
BOX 3.5 ひとくちに“統計解析”というけれど――推定のそもそもの目的の違いと方法論との対応第Ⅱ部 因果効果の推定手法
4 共変量に着目――層別化、マッチング、重回帰分析
4.1 層別化と標準化で揃える
4.2 マッチングで揃える
4.3 重回帰分析で揃える
4.4 この章のまとめ
BOX 4.1 じゃあモデルなんて使わなければいいじゃないですか5 「次元の呪い」の罠の外へ――傾向スコア法
5.1 傾向スコア法――“割付けられやすさ”を表す合成変数
5.2 傾向スコア法を使ってみよう
5.3 傾向スコアによるマッチング
5.4 マッチングは相手あってこそ
5.5 この章のまとめ6 共変量では調整できない、そんなとき――差の差法、回帰不連続デザイン
6.1 差分データへの変換によるバランシング――差の差法
6.2 処置の切替の境界を利用したバランシング
6.3 この章のまとめ7 データの背後の構造を利用する――操作変数法、媒介変数法
7.1 外的なショックを利用する――操作変数法
7.2 媒介変数法とフロントドア基準――中間変数を利用する
7.3 この章のまとめ第Ⅲ部 「因果効果」が意味することと、しないこと
8 “処置Tの効果”を揺るがすもの
8.1 「因果効果を媒介するもの」を考える
8.2 “因果効果”を揺らす他の要因たち
8.3 処置Tのコンテクスト依存性を考える
BOX 8.1 “柑橘類”とは何だったのか――壊血病を巡る実験の成功と概念的吟味の失敗
8.4 測定されたその「処置T」は本当に「処置T」か
8.5 この章のまとめ
BOX 8.2 「まずSUTVAあれ」9 エビデンスは棍棒ではない――「因果効果」の社会利用に向けて
9.1 その因果効果はどこまで一般化できるのか――ターゲット妥当性とバイアスの分解
9.2 実世界での適切な利用へ向けて――「固有性の世界」と「法則性の世界」の往復
9.3 「平均因果効果」が隠してしまうもの
9.4 エビデンスは棍棒ではない――結果の社会利用にあたって注意すべきこと
9.5 この章のまとめ――RCTは最強ではないし、統計学は最強ではない
BOX 9.1 本書の終わりに――マシュマロ実験からの教訓巻末補遺A1 共変量Cの影響に対する“補正計算”としての重回帰
巻末補遺A2 逆確率重み付け法の考え方参考文献
あとがき
索 引
本書は「第Ⅰ部 因果推論の基本的な考え方 」、「第Ⅱ部 因果効果の推定手法」、「第Ⅲ部 「因果効果」が意味することと、しないこと」の3部構成に分かれています。理論的な説明や実践的なケース問題、実装例はあまり記載されていません。その代わりに”はじめての”という言葉通り、ひたすらに丁寧な例示とわかりやすい図示による充実した説明が続きます。各章を読み進める分には、中学数学+α程度の知識で十分でしょう2。
因果推論というテーマに初めて取り組む人や、大学の授業で挫折してしまった人にこそ読んで欲しいです3。「何の効果をみたいんだっけ?」とか「この分析結果って他の集団に一般化できるっけ?」のような疑問を抱いた経験がある人にもおすすめできます。「数式を先に出してくれたほうが分かりやすい」というタイプの人は第Ⅲ部だけでも読んでみて欲しいです。因果推論のフレームワークにある程度慣れている人へも有益な記述が沢山あると感じます。
また、本書で説明される内容はPearlにもRubinにも偏ることがありません。その点でも安心して初学者におすすめできます。因果推論の流派に関しては宗教戦争が起こりがちですが、本書ではむしろ両方の概念の橋渡し的な説明も多く含まれています。
内容には関係ないですが、具体例にねこちゃんがたくさん出てくる点も非常に良いです。
読書メモ
各章の簡単なメモです。ところどころ感想が混じっているので、書籍を読まないと何を言っているか分からないかもしれません。Sorry.
1章 因果と相関と「特性の分布の(アン)バランス」
本書における因果関係の定義が記載されています。
要因\(T\)を(介入により)変化させたとき、要因\(T\)とは関係ない他の要因の影響によってではなく、要因\(Y\)が変化する
ちょっと回りくどい表現ですが、これ以上簡潔に表すこともできないですね。因果効果を推定する際には分布のバランシングが重要な役割を持ちます。実験計画や分析手法の工夫によって、バランシングを達成することが因果推論の基本的なゴールだと考えることが出来ます。
2章 どの特性を揃えるべきなのか――因果ダイアグラムとバックドア基準
因果推論では定番のテーマである「相関と因果の違い」についても優しく丁寧な説明があります。1章のバランシングの概念と接続しているのもうれしいです。さらっと触れているだけでしたが、構造が部分的にしかわからないDAGでバックドアパスをブロックする例をみて、因果ダイアグラムの有用性やバックドア基準を考える嬉しさが少し理解できました。「現実には構造が部分的にしかわからないケースの方が多いんだから因果ダイアグラムなんて書けるわけないだろ!」とか思っていた自分が恥ずかしいです。
3章 因果推論、その(不)可能性の中心――潜在結果モデルと無作為化
反事実的な考え方、「counterfactual」による因果効果の定義が説明されています。調査観察データの統計科学で因果効果を学んだ僕にとっては慣れ親しんだ定義です。Box3.5に記載されている目的と方法論の対応に関する記述をみて、「なるほどなぁ」となりました。今まで他者の分析に感じていたいくつかの違和感は、目的と方法論のストーリーが歪んでしまっているものだったのだと思います。予測と説明の立場が異なることは理解しているつもりでしたが、本章を読むことで今までよりも自分の考えが整理されました。
4章 共変量に着目――層別化、マッチング、重回帰分析
重回帰分析を用いた因果推論に隠れている強い仮定について明確な記述と注意喚起があります。重回帰分析は適当に使ってもとりあえず推定結果が出てしまうので良くないよなぁと感じているので、この問題意識はもっと多くの人に持ってほしいです。特に「統計的な有意性」と「因果効果に対するバイアス」はまったく異なるものであることは全人類意識すべきだと思います4。
5章 「次元の呪い」の罠の外へ――傾向スコア法
恥ずかしながら、因果ダイアグラムを用いた傾向スコアの説明を初めて目にしました。感動です。今まで何となく敬遠していたDAGを用いた表記でしたが、だいぶ苦手意識がなくなりました。
傾向スコアも重回帰分析と同様に、ライブラリにデータを突っ込むといい感じに計算されて、それっぽい因果効果が出てしまうので注意が必要です。本章ではとくにcommon supportの重要性が述べられています。傾向スコアを利用するときは最低限分布のバランシングが改善しているかどうかはチェックしたいですね。
6章 共変量では調整できない、そんなとき――差の差法、回帰不連続デザイン
強い仮定を満たした下で利用できるいくつかの手法に関する説明があります。特にDIDベースの考え方は実務でも割とよく使うため、6.1の平行トレンド仮定に関する注意は心に留めておきたいです5。仮定が強いため適用できる状況は限定的ですが、こういった手法が存在することは知識として持っておいて損はないと思います。
7章 データの背後の構造を利用する――操作変数法、媒介変数法
操作変数法を全く知らない僕にとっては非常に価値がある章でした。ちょっと手法の仮定が強い気もしましたが、最近読んだSansanの技術ブログでの適用例をみると、これらの手法も限定的ではあるが使えるケースは確かにあるなと感じました。
8章 “処置Tの効果”を揺るがすもの
「本当に知りたい因果効果」を正しく設定することは、データ分析一般に通ずる重要なファクターだと再認識しました。データが与えられたもとで行う分析では、理論的条件にばかり目が行きがちです。もちろん理論的条件を満たしているかどうかは重要なのですが、解析概念の定義や実験に不備がないかどうかについても同様に重んじるべきだと思いました。
9章 エビデンスは棍棒ではない――「因果効果」の社会利用に向けて
本章では一般化可能性に関する議論が丁寧に行われています。当たり前ではありますが、分析結果を注意深く吟味したうえで慎重に一般化する必要があります。記載されている通り「RCTは最強」や「統計学は最強」なのはあくまで限定的なケースのみです。学びたての時は「因果推論は最強」と思ってしまうケースもありそうです。
まとめ
控えめに言って最高の本でした。完全にFor meでした。僕は具体例から入る方が理解が進みやすいタイプなので、本書には非常にマッチしていました。定期的に著者の情熱が文章に現れている点も、大学の面白い講義を受けている気持ちにさせてくれます。今後も定期的に読み返す一冊になるだろうなぁと思います。書籍を読み進めている途中で気づきましたが、著者の林先生のスライドには昔からお世話になっていたことに気づきました。感謝しかありません。
そしてなぜか本書は技術書としては破格の3000円です。ぜひ購入して一読してみてください!
Enjoy!