PR

多重比較検定はなぜ必要?検定の多重性の問題を知っておこう!

統計

医療系の実験、特に臨床試験では多重性の問題に悩むことも多いと思います。
そんな検定の多重性の問題ですが、どのようなときに問題になるのか、多重比較検定にはどんなものがあるのか、今回はそんな基本的な部分について説明しておきます。

多重性が発生する状況は?その問題点は?

どのようなときに多重性は起こるのか?
シンプルに言えば、複数回の検定(2回以上の検定)を実施すると発生します。

なぜ2回以上検定すると発生するのかですが、以下に例を挙げます。

例えば、3種類の手法(A、B、C)についてそれぞれ比較する場合、検定を3回繰り返すことになりますが、1回あたり0.05(5%)の有意水準で検定を行っているため、その検定を3回繰り返すことにより最終的な有意水準が0.05(5%)よりも大きく(この例では有意水準が0.14(14%))なってしまいます。
これでは、この検討全体において有意水準は14%となってしまい、これを有意差ありとしてしまうのは問題だとわかると思います。

多重比較法は、このような問題を回避するために、有意水準の調整を行う検定方法です。
様々な手法がありますので、目的に合わせて適切な手法を選択します。

多重比較法の種類

多重比較するとき、全ての群を比較したい場合に使う手法と基準となる特定の一つの群と,その他の群とを比較したい場合でそれぞれ使える手法、使えない手法があります。

全ての群を比較したい場合に使う手法

すべての実験データ(A~D群とする)の全ての群間の有意性を調べて,それを説明したい時に使う多重比較方法です。

この場合には、パラメトリックを仮定する多重比較法では、テューキーが、ノンパラメトリックではスティール・ドゥワスなどがよく利用されています。
その理由として、この2つに関しては、分散分析による有意性の確認をしなくても、いきなり多重比較に取り掛かれるという点です。
ほかにも、対応のある一元配置分散分析のノンパラメトリックに使用されるフリードマン、手法として比較的簡便だが有意差が出にくいボンフェローニ、ボンフェローニの改良版としてボンフェノーニより有意差がでやすいサイダック、サイダックよりさらに有意差が出やすいボンフェローニ型多重比較のホルム、そのホルムの手法に似ているが、補正をかけていく組み合わせの順番をp値の大小ではなく、平均値で決めるライアンなどがあります。

基準となる特定の一つの群と,その他の群とを比較したい場合に使う手法

実験データA群を基準として,他のB群,C群,D群それぞれと比較したいという場合(対照群との比較)です。

この場合では、ダネットが有名です。
ほかにも先ほど記述した、ボンフェローニ、サイダック、ホルム、ライアンも使用できます。

※基準となる特定の一つの群と,その他の群とを比較したい場合に使う手法の注意点として、A群とその他の群だけを比較、A群とその群との差にしか言及できないということが前提となりますので、その点は注意してください。

多重性の問題点と多重検定法について認識しておこう!

多重性の問題点と多重検定法の種類について説明しました。どのようなときに問題になるのか、多重比較検定にはどんなものがあるのかに関して、しっかり認識し、実験を進めていきましょう。

コメント

タイトルとURLをコピーしました