Robert Todd Carroll

SkepDic 日本語版

対照研究、二重盲検法、無作為化法
control group study, double-blind and random tests

対照研究とは、ある現象について、その仮説を検証する際に、処理を加える実験群（実験区）と比較するための対照群（コントロール、対照区）というものを用いる実験法である。対照群と実験群は、原因と目される処理を実験群に施すということ以外は、まったく同一でなければならない。もし原因と目される処理が本当にその現象の原因なら、論理的に対照群と実験群の間には現象の発生割合に有意な差が生じるはずである。たとえば、もし'Ｃ（要因）'が'Ｅ（結果）' の原因となるなら、実験群に'Ｃ'を処理して対照群には処理をせずにおく。この場合、実験群では対照群に比べて有意に高い割合で'Ｅ'が生じるはずである。有意差（significance）は確率的に算出される：もしある出来事が偶然では説明できなければ、その出来事は有意となる。

二重盲検法とは対照群に関する検証で、試験者と被験者の双方とも、どれが対照群なのかわからなくしておくものである。無作為化法とは、実験群と対照群それぞれに属する個体を乱数で決めるものである。

対照、二重盲検法、それに無作為化法の目的は、誤りと自己欺瞞と偏見を軽減することである。以下の例を見れば、こうした安全装置が必要だということがわかるだろう。

ダイエレクトロ・カイネティック研究所のＤＫＬライフガードモデル2は人間探知機だそうだ。メーカーによると、どんな障害物があろうと、最大20m 離れたところから心臓の鼓動で生じる信号を探知して、生きた人間を探知できるという。サンディア研究所はこの器械を、二重盲検法と無作為化法を用いて検証した。サンディアは国防関係の研究所で、ロッキードの関連企業サンディア社がエネルギー省のために運営している。彼らが検証した仮説をまとめると、以下の通りである：ヒトの心臓の鼓動は位置信号を発し、ライフガードに検知される。したがって、ライフガードのユーザーは最大20m離れたところに隠れている人（つまり目標）を、あいだにどんな障害物があろうと探知できる。

検証方法は非常に単純なものだった：プラスチック製の大きなカゴを５つ用意して30フィートおきに一列に並べて、オペレーターはＤＫＬライフガードを使って、５つのうちどのカゴに人が入っているか当てるのだ。各々のカゴに人が入るかどうかはランダムに決めた。これはオペレーターにパターンを読み取られてしまうのを防ぐためだ。テストの結果、この探知機は偶然で当たるのと同程度の成績しか出なかった。オペレーターはＤＫＬ社員だった。オペレーターが好成績をあげることができたのは、あらかじめ目標の位置がわかっていたときだけだった。このライフガードは、当たりのカゴがあらかじめオペレーターにわかっていたときは、10回中10 回とも探知に成功したのだ。どれが当たりかあらかじめ教えてからテストするというのは馬鹿げた話だが、こうすることで基準を設定して探知機が正常に作動することを確かめさせたのだ。オペレーターは、探知機が正常に動作していると同意してはじめて、第二段階の二重盲検テストへ進めるのだ。というのも、器械が正しく動作していることをあらかじめ確認させておけば、オペレーターは二重盲検法に失敗したことを言い抜けるためにその場しのぎの仮説をひねり出したりはしないだろうからだ。

もしこの探知機が主張どおりの性能を発揮していたら、オペレーターはカラのカゴから信号を受けたりはしなかっただろうし、人の入ったカゴから信号を受けていただろう。ライフガードの本実験では５つのカゴのうちどれに人が入っているか、オペレーターも審査員も知らされなかった。この場合はオペレーターの成績は悪く（25 回中当たりは６回）、またあらかじめ当たりの位置を知っていたときに比べて、特定するまでに約４倍の時間がかかった。もしこの器械でヒトの鼓動を検知できるなら、25回中６回よりはずっとマシな結果が期待されるはずだ。偶然でもこの程度は当たるのである。

10回中10回の当たりと、25回中6回の当たり -- このように試験成績が違うということは、盲検によってどれが対照がわからないようにする必要がある、ということを明白に示している：盲検は自己欺瞞と主観的な評価を減殺するのに必要なのだ。意識的であれ無意識であれ、審査員のちょっとした仕草から対照がどれなのかばれてしまうことが考えられるので、審査員も盲検の対象となる。もしどのカゴがカラでどのカゴに人が入っているか審査員が知っていたら、審査員は人の入ったカゴだけをじっと見るなどの方法を使って、被験者に目に見える合図を送ったりするかもしれないのだ。カンニングや審査員の偏見を減殺するため、審査員はどれが対照か知っていてはいけないのだ。

霊能者、筆相学師、占星術師、ダウザー、超常療法師などの多くがみずからの能力を信じ込んでいるが、その理由は、調製された条件のもとでの検証がなされていないということから説明できる。ダウザーをテストするには、井戸はぜんぶダウザーのアドバイスにしたがって堀り当てたものだ、だからダウジングは効くんだ、などとダウザーとその友達にしゃべらせるだけでは、充分ではない。教育放送（ＰＢＳ）の番組 科学のフロンティアたち （Frontiers of Science, 1997年11月19日放送）でレイ・ハイマンがやったように、無作為化と二重盲検法をおこなう必要があるのだ。番組の中で、ダウザーは水だけでなく地中に埋められた金属も見つけることができると主張した。そのダウザーは、ランダムに番号を選んで、その番号に対応するバケツを選ぶというテストに同意した。バケツは野外に逆さまにおいておき、その下に番号をふった金属を置いておくのだ。目標となる金属は、ダウザーが番号を当てるのに同行するのとは別の者が設置した。偶然に当たる確率は算出可能だ。たとえば、もしバケツが100個あってそのうち10個に金属が隠されていれば、偶然による正答率は10% となる。つまり試行回数が多ければ、ダウジングロッドがあろうとなかろうと、だれがやっても10%程度の正答率は期待できるのだ。一方、もし80%とか90%といった正答率が一貫して得られ、しかもそれがカンニングのせいではないと確証できるなら、これはダウザーの能力によるものだ、と証明できることになる。

このダウザーはロッドを持ってバケツのあいだを歩き回ったが、強い感覚は得られないと語った。彼はダウザーとしての判断基準にもとづいて、これはたぶんハズレだろうと思うバケツをひとつ選んだ。彼は正しかった。バケツはほんとうにハズレだったのだ！彼は何度もやってみたが、金属は見つからなかった。彼の行動は、調製された条件の下でテストしたダウザーに典型的に見られるものだ：彼自身も本当に驚いていた。私たちみんなと同様にこのダウザーも、ある出来事を正しく評価する場合、自己欺瞞、ないものねだり、暗示、無意識の偏見、選択的思考、主観的な評価、組織的強化などなど、評価の妨げとなる多くの要因があるということを知らなかったのだ。

対照研究の多くは、要因となる処理を施したかどうかを被験者に悟られないように、対照群にはプラシーボを処理する。たとえば新薬の効果を検証する研究では、対照群と実験群の両方に、見た目には区別がつかない錠剤を与える。薬効成分は実験群に与えた錠剤にのみ含まれており、対照群に与えたものはプラシーボなのだ。二重盲検研究では、どの被験者にプラシーボを与えたかは、結果を評価する人間にも結果をとりおわるまでわからないようにする。これは審査員の偏見が観察や測定に影響を与えないようにするためだ。

参考文献

Giere, Ronald, Understanding Scientific Reasoning, 2nd ed, (New York, Holt Rinehart, Winston: 1984).

Kourany, Janet A., Scientific Knowledge: Basic Issues in the Philosophy of Science, 2nd edition (Belmont: Wadsworth Publishing Co., 1998).

Sagan, Carl. The Demon-Haunted World: Science as a Candle in the Dark (New York:Random House, 1995). $11.20

Copyright 1998 Robert Todd Carroll	日本語化 01/31/00
conjuring	A Course in Miracles

対照研究、二重盲検法、無作為化法 control group study, double-blind and random tests

参考文献

対照研究、二重盲検法、無作為化法
control group study, double-blind and random tests