とりまかし読書記録

読んだ本の感想や書評を掲載していきます。

アンドリュー・リー(上原裕美子)『RCT大全』みすず書房

エビデンスに基づく」というフレーズが流行り言葉になって久しい。政策や意思決定の効果を数量的に検証して得られた結果が「エビデンス」だが、数量的な検証と言ってもさまざまだ。本書のタイトルにもある「RCT」はランダム化比較試験の略で、良質なエビデンスを得るためにはRCTが欠かせないというのが著者の立場だ。

RCTを使ってエビデンスを得るとはどういうことか。こんな例を考えてみよう。職業訓練プログラムに参加しなかった求職者と比べて、参加者の就職率が有意に高かったことが分かったとする。さて、このプログラムには就職率を高める効果があったと言えるだろうか。必ずしもそうは言えない、というのが答えである。そもそも職探しに熱心な求職者だからこそ、職業訓練プログラムに参加したのかもしれないからだ。*1ではプログラムの効果を正しく測定するにはどうすればよいか。プログラムに参加するかどうかを求職者にえらばせるのではなくランダムに割り当てる。そのうえで参加者(介入群)と不参加者(対照群)について就職率の違いをみればよい。これがRCTを用いた評価の基本的なアイデアである。

医療の分野にルーツをもつRCTだが、これを活用できる領域は広い。医療・教育・経済についての政策や、ビジネスにおける意思決定を評価することもできる。実際、著者が本書で紹介するRCTは多岐にわたる分野で実施されている。

先ほどの例から分かるように、RCTを使うと単なる相関関係ではなく因果関係を知ることができる。これは得られるエビデンスの質が高いことを意味する。またRCT評価の強みとして、著者はシンプルさを強調する。ここで引くのは経済学者ジュディス・ゲロンのことばである。曰く、「分析の基本は誰でも理解できます。小難しい統計処理はありません」(69ページ)。RCTによって「堅固かつシンプルなエビデンス」を引き出せるのだ。

本書で著者はRCTの魅力を伝えると同時に、まだまだRCTが活用されていない現状を憂いてもいる。著者によれば、印象的な逸話や人間の直感を頼りに政策が導入されたり、表面的な比較に終始する質の低い評価に基づいて効果を判断されたりすることが多い。人間の直感は大してあてにならないと著者は警鐘を鳴らす。実際に「世間一般に受け入れられた常識をRCTが覆した例」は多い。長年、犯罪率の低下に寄与していると思われていた米国の「刑務所見学プログラム」によって、犯罪発生数がむしろ増えていたという事実が発覚したのはその一例だ。あるいは、途上国で貧困を減らすのにマイクロクレジットがさほど効果的ではないことも、RCTを実施して分かった。効果の低い政策を実行するための予算にはもっと別の使い道がある。RCTを用いた高品質の評価によって政策をふるい分けていくことが、より良い社会の実現につながる、そう著者は述べる。

本書の主眼はRCTの魅力を読者へ伝えることにある。しかし当然、RCTには欠点も批判もある。本書を読む限り、RCTを実施するために大きなコストがかかること、RCTを実施できる範囲が限られていること、この2点を著者はRCTの主なデメリットと考えているようだ。

過去に実施されたRCTには多くの被験者、多額の費用、長い期間といったコストを伴う大規模なものも多い。しかし常にこれらが必要というわけではないし、RCTによる評価によって無駄な政策への支出が減らせるのであれば、RCTにかかるコストは十分に報われる。著者は2つめの欠点をより大きな問題だと考えている。限られた範囲の被験者を対象としたRCTの結果は、類似するほかのどんな状況にも当てはまるというわけではない。*2例えば米国で効果を認められた政策が日本でも効果を発揮するとは限らない。また対象者の規模が大きくなると、思ったような成果が得られないこともある。一方で「結果の解釈には慎重に臨むべし」と述べつつ、他方で経済学者アンガス・ディートンのことばを引いて「他の状況に一般化可能な仮説」が見つかる「最善の実験」を行なうのが望ましいという。*3また経済学を初め、社会科学で実施される「実験室実験」よりはRCTの外的妥当性は高い、と読める記述もある(第10章)。

著者によれば、「対照群を設けるRCTは非倫理的である」「対照群をくじでえらぶのは不公平である」という批判が最も多いようだ。これらに対して著者はこう反論する。

評価の対象となるプログラムに効果があるのかどうかは分からない。そもそも効果を知るためにRCTを行なうわけであり、(プログラムからもれた)対照群が必ずしも損な役回りを演じるとは限らない。また、時期をずらして導入するようなプログラムでは全員がいずれは対象となるので、「倫理的でない」という批判は当たらない。さらに「公平性を欠くという理由でRCTを拒否するのは、先進諸国で教育機関への入学や、住宅バウチャーや医療保険の割り当て、さらに投票順序や徴兵の決定にくじが利用されている現実と矛盾する」(204ページ)。どちらも妥当な反論だと私(レビュアー)には思える。

政府が税金を投入して実施する政策の背後には説得力のあるエビデンスがあるべきだ。そして良質なエビデンスを提供する手段としてRCTはとても強力い。本書の重要なメッセージである。より多くの政策がRCTによって評価される世の中は、著者の言うように「より良い社会」だろうと私(レビュアー)も思う。RCTの有用性を伝える本書をぜひ多くの人に読んでもらいたい。他方で本書がはらむ、RCTが万能に近いと錯覚させる危うさには注意も必要だろう。RCTを実施できない状況も存在するし、またRCTの結果をどこまで一般化できるのかという外的妥当性は、本書で言及されている以上に実は複雑な問題だ。本書では触れられていないが、RCTに対する批判はほかにもある。こうした論点については例えば、経済セミナー編集部による『新版 進化する経済学の実証分析』(日本評論社)などを合わせて読むことを勧める。

*1:これを「識別問題」という。

*2:「外的妥当性」が低いかもしれない。

*3:もっとも、反RCTの旗印を掲げるディートンはおそらく違った文脈でこう発言したのだろうと私は思う。