実例で考える統計解析の落とし穴
はじめに
本書は雑誌「麻酔」に連載されました「実例で考える統計解析の落とし穴」を基本に,実際の論文投稿の際に筆者が相談を受けた統計解析上の問題点について 解説したものです。医学研究に携わるものにとって,自分の研究した内容を他人に理解してもらうために論文を書くことは避けては通れません。その際に,「こ ういったことは滅多に起こらない珍しい現象」とか「こういったことは偶然起こったもので,意味のない現象」という判断をしなければなりません。このような あいまいな状態を判断するために,統計解析という手法を用います。多くの論文が世の中に存在しますが,問題の多い統計処理を行っている論文は少なくありま せん。この連載は「どんなパターンの誤用が多いのだろう,なにが誤解されているのだろう」ということからテーマを見つけました。このことによって,少しで も誤解・誤用が少なくなるのに貢献できるのではないか,と考えたのです。
しかしながら,こと麻酔科領域に限ってみても,統計解析の明らかな誤りが以前に比べて減少したと断言できるでしょうか? 私は基礎医学領域の研究のため に米国へ留学していましたが,「統計なんてそんなに難しくない。平均値の比較はt検定を用いればいいし,危険率pが5%かどうかで判断すればいいんだろ う」と考えている指導者が米国にも珍しくないことに驚きました。また,米国での医学研究者向け統計学セミナーを垣間見て,米国の状況も日本と大差がないこ とも分かりました。
本書では,統計解析の基本的知識を解説するのではなく,例題をもとに統計解析を行ううえで陥りやすい問題点について解説することを目標としています。統 計解析には,複雑で膨大な計算を行う作業だけでなく,得られた結果を統計学的に誤りなく評価する作業が必要です。計算処理はコンピュータが代行してくれま すが,現時点ではわれわれ研究者自身が「結果の解釈」を行う必要があるのです。研究で最も大切なのはデータを集めることでも莫大な統計処理をすることでも なく,結果の意味付けにあたる「研究のアイディア」と言われるのもこのためです。そこで本書では,統計解析から得られた結果を正しく評価するための基本的 知識を統計の誤用例を通して解説したいと思います。
本書では統計解析の基本的知識はあるものの,自分の関わっている研究で望ましい解析方法を探している方を対象としていますが,研究結果の考察に重大な影 響を持つ研究指導者の先生方にも是非知っていただきたいことでもあります。残念ながらスペースの関係で統計学の詳細については触れられませんので,統計処 理の基礎知識については他の優れた教科書を参照していただきたいと存じます。また,あらかじめお断りいたしますが,本書に掲載した例題はすべて架空のデー タに基づくものです。テーマ自体は私が受けた質問や目にする麻酔科領域の論文から取り上げますから実在の研究と似たものとなることが有り得ますが,すでに 発表された論文に対する批判や盗用ではありません。
統計学の教科書とは異なった観点から統計処理のノウハウをお伝えすることができれば,筆者としてこの上ない喜びです。
平成11年10月
長田 理
第1章 統計処理の前にグラフを作成しよう
はじめに
【例題1】
代表値を用いてグラフを作成する意味
1)平均値
2)中央値
3)最頻値
代表値と統計処理
検討結果
おわりに
第2章 パラメトリック検定とノンパラメトリック検定
―ノンパラメトリック検定は万能か?―
はじめに
【例題2】
パラメトリック検定とノンパラメトリック検定
パラメトリック検定の考え方
ノンパラメトリック検定の考え方
ノンパラメトリック検定は万能ではない
おわりに
第3章 「有意差なし」≠「等しい」―第2種過誤率について考える―
はじめに
【例題3】
統計学的検定と解析結果
「有意差が認められない」≠「等しい」
第2種過誤率についての考察
有意差が認められない場合の考え方
おわりに
第4章 なぜ多重比較が必要なのか
はじめに
【例題4】
危険率が甘くなる罠
平均値の差の大小と有意差の有無が一致しない
望ましい手順による解析
おわりに
第5章 いかなる場合も多重比較検定が必要か?
はじめに
【例題5】
この研究者の解析モデル
多重比較検定を用いる状況
仮説に応じた解析方法の選択
おわりに
第6章 多重比較検定方法の選択
はじめに
【例題6】
この研究者の解析モデル
主な多重比較検定方法
1)基準薬との比較
2)すべての群の組合わせについての比較
3)順序関係がある群の比較
多重比較と分散分析の関係
ノンパラメトリック的多重比較検定
解析結果と解釈
多重比較の解釈
おわりに
第7章 測定点を増やせばより良い解析結果が得られるのか?
はじめに
【例題7】
解析モデルについての考察
おわりに
第8章 連続データで表される要因の解析
はじめに
【例題8】
この研究者の解析モデル
分散分析-解析モデル
共分散分析-解析モデル
解析結果
おわりに
第9章 2つの事象が発生するまでの時間の評価法
はじめに
【例題9】
この研究者の解析モデル
生存分析の応用
おわりに
第10章 2つの事象を判別するモデル
はじめに
【例題10】
この研究者の解析モデル(重回帰分析)
ロジスティック回帰分析による解析
おわりに
第11章 単純な比較から要因の検討へ
はじめに
【例題11】
この研究者の解析モデル
多変量解析の利用①―相関分析―
多変量解析の利用②―因子分析―
おわりに
第12章 治療効果の評価方法
―エンドポイントと評価の指標について―
はじめに
【例題12】
この研究者の解析モデル
統計学的解析と考察
おわりに
索 引