対照研究、二重盲検法、無作為化法
control group study, double-blind and random tests
対照研究とは、ある現象について、その仮説を検証する際に、処理を加え
る実験群(実験区)と比較するための対照群(コントロール、対照区)とい
うものを用いる実験法である。対照群と実験群は、原因と目される処理を実
験群に施すということ以外は、まったく同一でなければならない。もし原因
と目される処理が本当にその現象の原因なら、論理的に対照群と実験群の間
には現象の発生割合に有意な差が生じるはずである。たとえば、もし'C(要
因)'が'E(結果)' の原因となるなら、実験群に'C'を処理して対照群に
は処理をせずにおく。この場合、実験群では対照群に比べて有意に高い割合
で'E'が生じるはずである。有意差(significance)は確率的に算出される:
もしある出来事が偶然では説明できなければ、その出来事は有意となる。
二重盲検法とは対照群に関する検証で、試験者と被験者の双方とも、どれ
が対照群なのかわからなくしておくものである。無作為化法とは、実験群と
対照群それぞれに属する個体を乱数で決めるものである。
対照、二重盲検法、それに無作為化法の目的は、誤りと自己欺瞞と偏見を
軽減することである。以下の例を見れば、こうした安全装置が必要だという
ことがわかるだろう。
ダイエレクトロ・カイネティック研究所のDKLライフガード モデル2は
人間探知機だそうだ。メーカーによると、どんな障害物があろうと、最大20m
離れたところから心臓の鼓動で生じる信号を探知して、生きた人間を探知で
きるという。サンディア研究
所はこの器械を、二重盲検法と無作為化法を用いて検証した。サンディ
アは国防関係の研究所で、ロッキードの関連企業 サンディア社がエネルギー
省のために運営している。彼らが検証した仮説をまとめると、以下の通りで
ある:ヒトの心臓の鼓動は位置信号を発し、ライフガードに検知される。し
たがって、ライフガードのユーザーは最大20m離れたところに隠れている人
(つまり目標)を、あいだにどんな障害物があろうと探知できる。
検証方法は非常に単純なものだった:プラスチック製の大きなカゴを5つ
用意して30フィートおきに一列に並べて、オペレーターはDKLライフガー
ドを使って、5つのうちどのカゴに人が入っているか当てるのだ。各々のカ
ゴに人が入るかどうかはランダムに決めた。これはオペレーターにパターン
を読み取られてしまうのを防ぐためだ。テストの結果、
この探知機は偶然で当たるのと同程度の成績しか出なかった。オペレー
ターはDKL社員だった。オペレーターが好成績をあげることができたのは、
あらかじめ目標の位置がわかっていたときだけだった。このライフガードは、
当たりのカゴがあらかじめオペレーターにわかっていたときは、10回中10 回
とも探知に成功したのだ。どれが当たりかあらかじめ教えてからテストする
というのは馬鹿げた話だが、こうすることで基準を設定して探知機が正常に
作動することを確かめさせたのだ。オペレーターは、探知機が正常に動作し
ていると同意してはじめて、第二段階の二重盲検テストへ進めるのだ。とい
うのも、器械が正しく動作していることをあらかじめ確認させておけば、オ
ペレーターは二重盲検法に失敗したことを言い抜けるためにその場しのぎの仮説をひねり出したりはしないだろ
うからだ。
もしこの探知機が主張どおりの性能を発揮していたら、オペレーターはカ
ラのカゴから信号を受けたりはしなかっただろうし、人の入ったカゴから信
号を受けていただろう。ライフガードの本実験では5つのカゴのうちどれに
人が入っているか、オペレーターも審査員も知らされなかった。この場合は
オペレーターの成績は悪く(25 回中当たりは6回)、またあらかじめ当たり
の位置を知っていたときに比べて、特定するまでに約4倍の時間がかかった。
もしこの器械でヒトの鼓動を検知できるなら、25回中6回よりはずっとマシ
な結果が期待されるはずだ。偶然でもこの程度は当たるのである。
10回中10回の当たりと、25回中6回の当たり -- このように試験成績が違
うということは、盲検によってどれが対照がわからないようにする必要があ
る、ということを明白に示している:盲検は自己欺瞞と主観的な評価を減殺するのに必要なのだ。意識的で
あれ無意識であれ、審査員のちょっとした仕草から対照がどれなのかばれて
しまうことが考えられるので、審査員も盲検の対象となる。もしどのカゴが
カラでどのカゴに人が入っているか審査員が知っていたら、審査員は人の入っ
たカゴだけをじっと見るなどの方法を使って、被験者に目に見える合図を送っ
たりするかもしれないのだ。カンニングや審査員の偏見を減殺するため、審
査員はどれが対照か知っていてはいけないのだ。
霊能者、筆相学師、占星術師、ダウザー、超常療法師などの多くがみずか
らの能力を信じ込んでいるが、その理由は、調製された条件のもとでの検証
がなされていないということから説明できる。ダウザーをテストするには、
井戸はぜんぶダウザーのアドバイスにしたがって堀り当てたものだ、だから
ダウジングは効くんだ、などとダウザーとその友達にしゃべらせるだけでは、
充分ではない。教育放送(PBS)の番組 科学のフロンティアたち
(Frontiers of Science, 1997年11月19日放送)でレイ・ハイマンが
やったように、無作為化と二重盲検法をおこなう必要があるのだ。番組の中
で、ダウザーは水だけでなく地中に埋められた金属も見つけることができる
と主張した。そのダウザーは、ランダムに番号を選んで、その番号に対応す
るバケツを選ぶというテストに同意した。バケツは野外に逆さまにおいてお
き、その下に番号をふった金属を置いておくのだ。目標となる金属は、ダウ
ザーが番号を当てるのに同行するのとは別の者が設置した。偶然に当たる確
率は算出可能だ。たとえば、もしバケツが100個あってそのうち10個に金属が
隠されていれば、偶然による正答率は10% となる。つまり試行回数が多けれ
ば、ダウジングロッドがあろうとなかろうと、だれがやっても10%程度の正答
率は期待できるのだ。一方、もし80%とか90%といった正答率が一貫して得ら
れ、しかもそれがカンニングのせいではないと確証できるなら、これはダウ
ザーの能力によるものだ、と証明できることになる。
このダウザーはロッドを持ってバケツのあいだを歩き回ったが、強い感覚
は得られないと語った。彼はダウザーとしての判断基準にもとづいて、これ
はたぶんハズレだろうと思うバケツをひとつ選んだ。彼は正しかった。バケ
ツはほんとうにハズレだったのだ!彼は何度もやってみたが、金属は見つか
らなかった。彼の行動は、調製された条件の下でテストしたダウザーに典型
的に見られるものだ:彼自身も本当に驚いていた。私たちみんなと同様にこ
のダウザーも、ある出来事を正しく評価する場合、自己欺瞞、ないものねだり、暗示、無意識の偏見、
選択的思考、主観的な
評価、組織的強化などなど、評価の妨げ
となる多くの要因があるということを知らなかったのだ。
対照研究の多くは、要因となる処理を施したかどうかを被験者に悟られな
いように、対照群にはプラシーボを処理する。
たとえば新薬の効果を検証する研究では、対照群と実験群の両方に、見た目
には区別がつかない錠剤を与える。薬効成分は実験群に与えた錠剤にのみ含
まれており、対照群に与えたものはプラシーボなのだ。二重盲検研究では、
どの被験者にプラシーボを与えたかは、結果を評価する人間にも結果をとり
おわるまでわからないようにする。これは審査員の偏見が観察や測定に影響
を与えないようにするためだ。
関連する項目:その場しのぎの仮説(ad
hoc hypotheses)、コールド・リーディング
(cold reading)、組織的強化(communal
reinforcement)、確証バイアス
(confirmation bias)、オッカムの剃刀
(Occam's razor)、プラシーボ効果(the
placebo effect)、因果の誤り(the post hoc
fallacy)、選択的思考(selective thinking)
、自己欺瞞(self-deception)、主観的な評価(subjective validation)、証言(testimonials)、ジェームズ・ヴァン・プラーグ(James Van Praagh)
、ないものねだり(wishful thinking)
。
参考文献
Giere, Ronald, Understanding Scientific Reasoning, 2nd ed,
(New York, Holt Rinehart, Winston: 1984).
Kourany, Janet A., Scientific
Knowledge: Basic Issues in the Philosophy of Science, 2nd
edition (Belmont: Wadsworth Publishing Co., 1998).
Sagan, Carl. The Demon-Haunted World: Science as a Candle in
the Dark (New York:Random House, 1995). $11.20
|