研究発表や論文などでデータをまとめるとき、パラメトリックかノンパラメトリック、どちらでの手法で解析すればいいのか、どのような違いがあるのか、迷うときはないでしょうか?
「このデータ、パラメトリックかノンパラメトリックかよくわからないから、とりあえずノンパラメトリックの手法で検定しておこう!」という方もいるのではないでしょうか?
それはそれで間違いではありませんし、楽ではありますが、パラメトリックのデータをノンパラメトリックの手法に適応した場合にはデメリットなどもあります。
そこで今回、パラメトリックとノンパラメトリックの違いについて説明していきます。
パラメトリックとノンパラメトリックの違いは?
両者の違いを簡単に言うと「検定対象とする母集団の特徴」です。
これだけだと「???」となると思いますので、少し具体的に述べていきます。
実験などからデータとして得られる値(標本)は、母集団の分布に従ったばらつきを持っています。
そして母集団から標本を抜き取るということは、母集団が何らかの分布に従っている前提があるかないかによって、標本の扱いも同じく変わってきます。
このとき、母集団分布を2パターンに区別(何らかの分布に従っている前提があるかないか)したのが、パラメトリックとノンパラメトリックとなります。
ここからはパラメトリックとノンパラメトリックについて、詳しく述べていきます。
パラメトリック
事母集団の分布が、ある確率分布であるとわかっているとき、すなわち「与えられた母集団が何らかの分布に従っている前提がある」時に使える手法です。ここで言う何らかの分布とは大抵の場合は、正規分布を指します。
以前記事にしたt検定などは、母集団が正規分布など特定の分布をしていると仮定していますから、パラメトリック手法といえます。
※注意点として、あたりまえのことですが、パラメトリック手法は母集団が何らかの分布(主に正規分布)に従っていない、従っていることが確認できないと使用できません。
その代わり、パラメトリックの解析手法はノンパラメトリックの解析手法に比べ、精度の高い(検定の検出力が高い)結果を出すことが出来ます。
ノンパラメトリック
事母集団の分布が、ある確率分布であるとわからないとき、すなわち「与えられた母集団について何らかの分布に従っている前提がない」時に使う手法で、「与えられた母集団について一切の仮定も設けずに行われる手法」です。
ノンパラメトリックの手法は使用するのに仮定がいらないため、どんな母集団でも適応できます。
統計が苦手な私のような人間には、夢のような?ノンパラメトリックの手法ですが、パラメトリックの説明で記載したように、結果の精度(検出力)はパラメトリックの手法に比べると劣る(低下する)傾向にあります。
※例外として、得られたデータサイズが小さいときはパラメトリックの手法で検定すると検出力が低下することもあるため、ノンパラメトリックの手法で検定した方が良い場合もあります。
また、ノンパラメトリックの手法は、パラメトリック手法の使えない母集団はもちろんのこと、パラメトリックの母集団に対しても適応できますので、どちらを使えばいいか迷う、はっきり確信が持てない、わからない場合には心強い(ありがたい)手法とも言えます。
それぞれの特徴と使い分けを理解しておこう!
パラメトリックとノンパラメトリックの違いと特徴について説明しました。
実際には、母集団の特徴から、パラメトリックの手法が使えるかどうか判断し、その母集団に対してパラメトリックの手法を適応できないとき、ノンパラメトリックの手法を適応する。という流れになります。
パラメトリックな手法がつかえるときに、ノンパラメトリックな手法を用いることは、迷わなくて良いなどのメリットもありますが、検出力の面でデメリットがある(データサイズが小さいなどの例外は除く)ので、得られたデータに対し、適切な検定を行うようにしましょう。
コメント