メインコンテンツにスキップ
Qualtrics Home page

分散分析(ANOVA)とは?

ANOVA という略称で呼ばれる Analysis of Variance(分散分析)は、統計学者のロナルド・フィッシャーによって生み出された手法です。一元配置分散分析を実施することで、3件以上の独立したグループの平均値の間に統計的な差があるかどうかを理解することができます。

一元配置分散分析は、最も基本的な形式です。他にも複数の形式が存在します。

  • 二元配置分散分析
  • 多元配置分散分析
  • WelchのF検定分散分析
  • 順位付け分散分析
  • Games-Howellのペアワイズ検定

【オンデマンド ウェビナー】Brand XMが変える、これからのマーケティング

分散分析の仕組み

t検定と同様、分散分析では各グループから採取したサンプルによって、グループ内の分散のレベルを分析し、データのグループ間の差が統計的に有意であるかどうかを確認するために使用します。

もし、データ・グループ内に多くの分散(平均からのデータの広がり)が確認されれば、データから選ばれたサンプルの平均が偶然に異なる可能性が高くなります。

データ・グループ内の分散を見るだけでなく、分散分析では、サンプルサイズ(サンプルが大きいほど、偶然にサンプルの外れ値を選ぶチャンスが少ない)とサンプル平均間の差(サンプルの平均が離れていると、グループ全体の平均もそうなる可能性が高い)を考慮する必要があります。

これらの要素はすべてF値にまとめられ、それを分析することで、グループ間の差が統計的に有意かどうかの確率(P値)を与えることができます。

一元配置分散分析は、複数の従属変数に対する独立変数(他のものに影響を与える要因)の効果を比較します。二元配置分散分析も同様ですが、複数の独立変数で、因数分解分散分析は、独立変数の数をさらに広げます。

【無料 eBook】『エクスペリエンス デザインとは何か?』

分散分析で理解できること

一元配置分散分析は、年齢、性別、収入など独立変数の平均値の間に有意差があるかどうかを理解するために役立ちます。

各独立変数の平均値が他のものとどう違うかを知ることで、それらのうちのどれが従属変数(ランディングページのクリック数)に関係しているかがわかり、その行動を促進している要因の解明につながっていきます。

また、逆に一つの独立変数(気温など)が複数の従属変数(日焼け止めクリームの購入率、野外イベントへの参加率、炊き出しの実施可能性など)に影響を与えるかどうか、与えるとしたらどの変数か、などを確認することもできます。

分散分析が役に立つ機会とは

分散分析は、例えばマーケティングの分野で特定の仮説を検証したい際などに利用されます。異なるグループの平均値が等しいことを検定する帰無仮説で分散分析を用い、統計的に有意な結果が出ると、2 件の母集団が不等である=つまり異なっている、と考えられます。

分散分析の使用例

分散分析を利用することで、以下のような問いに答えることができます。

年齢、性別、収入などの要素は、自社ランディング ページのクリック率に影響するか?

この疑問に答えるために、3つの独立変数と1つの従属変数が存在するため、要因分析(factial ANOVA)を使用することができます。異なる年齢層(15-20、21-40、41-70、71+など)、異なる所得階層、すべての関連する性別のデータを収集する必要があります。二元配置分散分析は、従属変数(支出)に対するこれらの変数の効果を同時に評価し、各要素が違いをもたらすかどうかを判定することができます。

学歴(中卒、高卒、大卒、院卒)は気分に影響するか?

これに答えるには、独立変数が1つ(学歴)なので、一元配置分散分析(one-way ANOVA)を使うことができます。4つのグループのデータがあり、それぞれ学歴のカテゴリごとに1つずつ、そしてそれぞれの平均の間に差があるかどうかを見るために、気分のスコアを見ることになります。

独立変数内のグループがどのように異なるか(例えば、中卒か高卒か、大卒か院卒か)を理解すると、それらのどれが従属変数(気分)と関係があるかが理解できるようになります。

しかし、分散分析は、すべてのグループの平均的な気分のスコアが同じか、同じでないかを伝えるだけであることに注意する必要があります。どのグループが有意に高いか低いかの平均的な気分のスコアを持つかは示されないことに留意しましょう。

分散分析の仕組みは?

他のタイプの統計検定と同様に、分散分析は異なるグループの平均値を比較し、その平均値の間に統計的な差があるかどうかを示します。分散分析は、オムニバス検定に分類されます。これは、2 件を比較しても、グループのうち少なくとも 2 件が有意に異なることだけが示され、どのグループが統計的に有意に異なるかを知ることはできない、ということを意味します。

分散分析では、サンプルの平均値が異なる母集団からのものであるかどうかが、主な調査課題になります。分散分析は、以下の 2 件の仮定をもとに成り立っています。

  1. データ収集の手法に関わりなく、サンプルが集められた各母集団内の観測値が正規分布していること
  2. サンプルが集められた母集団が共通分散(s2)を有していること

分散分析の種類

基本的な一元配置の分散分析から、非カテゴリ変数のための順位付け分散分析のような特殊なケースのためのバリエーションまで、データ分析で分散分析を使用するには複数のアプローチが存在します。本セクションでは、最も一般的な例を紹介します。

一元配置分散分析と二元配置分散分析の違いとは?

分散分析検定に含まれる独立変数の数が異なります。一元配置では 1 件の独立変数で、二元配置では 2 件の独立変数で分散分析が行われます。例えば、独立変数が飲料ブランドのみである場合は一元配置、飲料ブランドに加えてカロリー、オリジナル版とダイエット版など、 2 件の独立変数を含める場合は二元配置となります。

多元配置分散分析

多元配置分散分析 は、2つ以上の独立したカテゴリ変数を持つ分散分析検定をカバーする包括的な用語です。カテゴリとは、順位付けされたスケールや数値ではなく、例えば「関東と関西」「バスケットボールとサッカー」など、変数が非階層的に表現されることを意味します。

WelchのF検定分散分析

Stats iQ では、データに関して以下の仮説が成り立つ場合、順位なしの Welch の F 検定を推奨しています。

  • サンプルサイズが計算上のグループ数の10倍以上(値が1つしかないグループは除く)であるため、中心極限定理により正規分布データの要件を満たす。
  • 連続/離散データには外れ値がほとんど、あるいは全く存在しない。

より一般的な等分散のF検定とは異なり、WelchのF検定は比較されるグループの分散が等しいとは仮定していません。分散が等しいと仮定すると、実際に分散が等しくないときには、正確性に置いて劣る結果を導く一方、実際に分散が等しいときには、その結果は非常に近いものになります。

順位付け分散分析

仮説が成立しないとき、順位付けされていない分散分析は有効でない場合があります。その場合、Stats iQは順位付け分散分析(「順位の分散分析」とも)の使用を推奨します。データを順位変換し(値を順位で置き換える)、その変換されたデータで同じ分散分析を実行します。

順位付け分散分析は、外れ値や非正規分布のデータに対して堅牢性が高くなります。順位変換は、仮説が成立しない場合に使える確立された方法(ノンパラメトリック手法)で、ピアソンとスピアマンの相関の主な違いとなるものです。順位変換の後にWelchのF検定を行うと、Kruskal-Wallis検定と同様の効果が得られます。

なお、Stats iQの順位付け分散分析と順位なし分散分析の効果量(Cohenのf)は、等分散のF検定によるF値を使って計算されています。

Games-Howellのペアワイズ検定

Stats iQは、分散分析検定の結果に関係なく、Games-Howell検定を実行します(Zimmerman, 2010)。Stats iQは、順位付けされた、もしくはされていない分散分析の場合と同じ基準で、順位付けされていない/されているGames-Howellのペアワイズ検定を示すため、詳細出力に「順位付け分散分析」と表示されていれば、ペアワイズ検定も順位付けされていることになります。

Games-Howell検定は、基本的に不等分散に対するt検定であり、多くのペアワイズ検定を実施すると、偶然に統計的に有意な結果を見つける可能性が高くなることを説明するものです。より一般的なTukeyのb検定とは異なり、Games-Howell検定は、比較されるグループの分散が等しいことを仮定していません。分散が等しいと仮定すると、実際に分散が等しくないときには、より正確性の低い結果を導くことになる一方、実際に分散が等しいときには、その結果は非常に近いものになります(Howell, 2012)。

順位なしペアワイズ検定が 2 件のグループの平均値の等しさを検定するのに対して、順位付けペアワイズ検定は、グループの平均値や中央値の差を明示的に検定するわけではないことに注意しましょう。一方のグループが他方のグループより大きな値を持つ一般的な傾向があることが検定されます。

また、Stats iQ は値が 4 未満のグループのペアワイズ検定の結果を示すことはありませんが、それらのグループは他のペアワイズ検定の自由度の計算には用いられます。

分散分析検定の実行方法

多くの伝統的な統計検定と同様、分散分析は数式に基づく手動計算を使用して実行することが可能です。また、R、SPSS、Minitabなどの一般的な統計ソフトウェアパッケージやシステムを使用して、分散分析を実行することもできます。最近では、QualtricsのStats iQのような自動化されたツールを使用することで、統計解析をこれまで以上に身近でわかりやすいものにすることができるようになっています。

Stats iQ と分散分析

クアルトリクスが提供する分析ツール Stats iQ は、分散分析検定の実行に役立ちます。3 件以上のグループを持つ 1 件のカテゴリ変数、および 1 件の連続変数または離散変数を選択すると、Stats iQは一元配置分散分析(WelchのF検定)と一連のペアワイズ事後検定(Games-Howell検定)を実行します。

一元配置分散分析では 2 件の変数間の総合的な関係を検定し、ペアワイズ検定では、可能なグループのペアごとに、一方のグループの値が他方より高くなる傾向があるかどうかを検定します。

Stats iQ を利用した分散分析検定の実行方法

Overall Stat Test of Averages(平均値の総合統計検定)は、分散分析(ANOVA)として機能します。分散分析では、2 件以上の平均値の差を検定することにより、カテゴリ変数と数値変数の間の関係を検定します。この検定で生成されるP値から、その関係が有意であるかどうかを判断することができます。

Stats iQ で分散分析検定を実行する方法は以下のとおりです。

  • 3 件以上のグループを持つ変数と、数値を持つ変数をクリックします。
  • 「関連づける」をクリックします。
  • 分散分析、関連する効果量とともに、シンプルでわかりやすいサマリーが表示されます。

Qualtrics のクロス集計と分散分析

クアルトリクスでは、クロス集計機能 を利用し、分散分析検定を実行することが可能です。

  • バナー(列)変数が 3 件以上のグループを有し、スタブ(行)変数が数値(年齢など)または数値リコード(「非常に満足」=7など)を有することを確認します。
  • 「平均値の総合統計検定」をクリックします。
  • 分散分析の基本的な P 値が示されます。

分散分析の限界とは?

分散分析は、2 件の独立変数間の平均値の差を分析するのに役立ちますが、どの統計的グループが互いに異なっているかは示されません。もし、実施した検定で有意なF統計量(分散分析検定を実行したときに得られる値)が返ってきた場合は、どのグループの平均値に差があったのかを正確に知るために、アドホック検定(最小有意差検定のようなもの)を実行することも可能です。

分散分析に関する、その他の考慮すべき点

  • サンプル サイズが小さくても、データが実際に正規分布しているかどうかを視覚的に確認することは可能です。正規分布していれば、サンプル サイズが小さい場合であっても、順位なしのt 検定 の結果は有効です。実際にはこの評価は困難であるため、Stats iQ では、小さいサンプル サイズに対して順位付けされた t 検定を行うことをデフォルトで推奨しています。
  • サンプル サイズが大きい場合は、外れ値が結果に悪影響を及ぼす可能性は低くなります。Stats iQ では、Tukeyの ”outside fence”(フェンス外)を用いて、パーセンタイル順位が 75 以上または 25 以下の四分位間の 3 倍以上のポイントを外れ値として定義しています。
  • 「最高学歴」や「マラソン大会の順位」などは、明らかに順序データです。リッカート尺度(1が非常に不満で、7が非常に満足というような尺度)は厳密には順序データですが、社会科学では連続データ (順位のないt検定)であるかのように扱うのが一般的です。

クアルトリクスが提供する統計 & リサーチ ソリューション

【オンデマンド ウェビナー】Brand XMが変える、これからのマーケティング