研究デザイン　概論 - MPH・MBAその後＠アメリカ

今日はPublic Healthでよく使われる研究デザインについてでも。

特に基本のものをいくつかということでIntervention（介入型）とObservation（非介入型）にわけて、それぞれで使われる研究手法の概説でも。

Interventionからは

１、RCT（ランダム化比較試験）

２、Quasi-experimental

Observationからは

３、Ecological

４、Cross-sectional

５、Case-control

６、Cohort

の系6つを簡単に取り上げます。詳しいのは個別に作っていく予定。いつになるかはわからんけど。

ちなみにこれらのうち５と６がかなりPublic Healthに特徴的ですね。

基本的にPublicHealthの研究はある事象と結果（たいてい病気）の因果関係を調べることが目的なので、よくこれらはエビデンスレベルで区別されるのだけれど（後述）、そもそもこれらは使える研究対象もだいぶ違う気がします。

介入型（1、２）はそもそも研究対象の事象がよい結果を引き起こすだろうもので、観察型（３～６）は引き起こさないだろうものですね。喫煙とか。基本的に倫理的な問題。もちろん政策は結果としてどちらに触れるかはわからないものなので特殊だけれども、そもそも悪い結果がおこるのを予測してやるわけではないので。

簡単な解説をすると

１．RCT

（基本的には）介入群（Treatment）と対照群（Control）をつくり、対象となる集団をランダムにこれらの2群にふりわけていく（Randomisation）ことでConfounding factorを2群でなるべくバランスさせることで、介入の真の効果を測ろうとする方法。

ちなみによく翻訳本とかでこのRandomisationをランダムサンプリングと混同してる本も多いので注意。あんま具体例だすのもどうかと思うけど、この本（その数学が戦略を決める (文春文庫) | イアンエアーズ, Ian Ayres, 山形浩生 | 本 | Amazon.co.jp）

の第2章で言っている無作為抽出テストというのはこのRandomisationのことで、普通に無作為抽出といって思い浮かべるRadom Samplingとは異なる概念のものです。

理科系の実験にあるようなコントロールされた環境を現実世界に作り出すのは難しいので、ならなるべく介入以外の条件を2群で同じようにつくりだすための方法なので、サンプリングの問題ではないのです。

よく薬の臨床試験で使われるけれども最近だと国際開発の世界でもよく使われている模様。

参考：貧乏人の経済学 - もういちど貧困問題を根っこから考える | アビジット・V・バナジー, エスター・デュフロ, 山形浩生 | 本 | Amazon.co.jp

確かに治療効果を割り振るのと、開発政策の１サービスを割り振るのって基本は同じだよね。ちなみに細かい話をすると、地理的条件とか病院とかの施設的条件とかに関るClustered RCTもあるのだけれどそれは今度。

２．Quasi-experiment

簡単に言うと擬似的な実験状態（RCTに近い状態）を作り出そうとするもの。

Time Seriesにおける切断モデルとか計量経済学におけるDifference in Differenceとかもこちら。めちゃくちゃ詳しくはないのだけれどいくつか扱ったものはあるので、それについては各論で。

３．Ecological

エコロジカルって環境かい！って感じですが、これは要は集団ごとのデータを使った研究です。例えば世界190カ国のGDP per capitaとMortalityの関連を見るとか。

Hans Roslingのギャップマインダー（http://www.gapminder.org/）のバブルチャートとかまさにこれ。

なかなか視覚的にもわかりやすいし直感的にもよいのだけれど、いわゆるEcological fallacyと呼ばれる問題があり、因果関係まで結びつけることは絶対にできないのがポイント。あくまで示唆的です。

４．Cross sectional

日本語では断面研究っていうけれどなんじゃそりゃって感じですね。

要はある1時点において、サンプリングしたデータに基づいた研究です。いわゆるサーベイ。サンプリングの方法とかがかなり重要になってきて、代表性（Representation）の問題がでてくるのもこれ。

また基本的に時系列的な前後関係がはっきりしないので、因果関係は絶対に言えません。

５．Case Control

ケースがすでに存在していて、それにうまくマッチするコントロールを見つけてくることで関連性を探ろうとするもの。基本的にケースが存在して、その人たちの過去の情報を探ったりするのでRetrospective（後ろ向き）studyとか言われたりするのです。

例えば肺がんと喫煙の関係性を調べるときにまず肺がん患者をリクルートして、それらの人とマッチする要因を持つ人たちをコントロールとしてリクルートし、喫煙習慣の違いを調べたりする。

ちなみにここでいう要因は、性別、年齢、地域とかが一般的。家族とかでうまくマッチできると遺伝要因もマッチできるのだけれど、それはもはやTwin studyの領域・・・。

ただこれも時系列的な前後の問題や、過去の情報をとるときにRecall Bias（過去の正確な情報を思い出せるか）という問題はあるので注意。

６．Cohort

Prospective（前向き）studyとかいわれるもの。ある時点で、病気などの原因になると考えられるExposureを持つ人と持たない人を一気にリクルートして、その後何年・何十年と追っかけるなかで、その2種の人たちの間の病気の発生を比べる方法。

時系列の逆転がおこらないのでよろしい・・・が、病気によっては発症までの時間が長かったり、Exposureがレアなケースだと、費用が異常にかかります。お金持ち研究グループじゃないとだめ

アメリカだとFrammingham Cohortとか日本だと九州の久山町Cohortが有名。

最後にエビデンスレベル的には

RCT　＞　Cohort　＞　Case Contorol　＞　Cross Sectionalというのが一般的ですね。黄金律。ただこれらも、例えばRCTもしっかりDouble blinding されてるとかCohortでもLoss to follow upとかバイアスがかかる要素が検討された上での話なので注意。またBradoford Hill Criteriaとかも重要になってくる。

細かい話はまた今後の各論で。

かなり真面目になってきた・・・