前回は、分散分析について説明しました。 その中で、因子(データに影響を与える要因)が2種類のときは、二元配置と呼ぶと言いました。 今日は、二元配置の分散分析を行います。
次の例を考えます。
あるパソコン・スクールでは、タイピング練習ソフトとして、A, B, C, Dの4種類を用意しています。 また、練習方法として、
の3種類を用意しています。 パソコン初心者12人を選び、ソフトと練習方法を変えて練習してもらい、その後、タイプ速度(1分間に打てる文字数)を測定したところ、以下のようになったとします。
この例は、ソフトと練習方法の違いが、タイプ速度に影響を与えるかどうかを考えています。 したがって、因子は2種類で、二元配置となります。
この例は、2因子(ソフトと練習方法)の組み合わせごとに、データが1つだけです。 このようなデータを、 繰り返しのない二元配置 と呼びます。 2因子の組み合わせごとに、データが複数ある場合は、 繰り返しのある二元配置 と呼ばれます。
さて、上記の例で、平均を見てみましょう。 練習方法1の平均は132文字/分、練習方法2の平均は107文字/分、練習方法3の平均は86文字/分です。 練習方法の違いによる速度差は、多少ありそうです。 一方、ソフトAの平均は109文字/分、ソフトBの平均は96文字/分、ソフトCの平均は113文字/分、ソフトDの平均は115文字/分です。 ソフトの違いによる速度差は、あまり無さそうです。
一元配置の分散分析では、変動を
全体の変動=水準間の変動+水準内の変動
と分解しました。 ここで、変動とは平均との差の平方和のことで、水準とは因子の項目のことでした。
これに対して、二元配置の分散分析では、
全体の変動=因子1の水準間の変動+因子2の水準間の変動+統計的誤差による変動
と分解します。 分解した後は、一元配置と同じように、それぞれの変動から分散を求め、分散比 F を求めて F 検定を行います。 (詳細は省略します。)
繰り返しのある二元配置では、変動の分解がさらに複雑になります。
全体の変動=因子1の水準間の変動+因子2の水準間の変動+交互作用による変動+統計的誤差による変動
ここで、 交互作用 とは、一つ一つの因子ではなく、2因子の組み合わせによって、データに影響を与えることです。
上記の例を、繰り返しのある二元配置にすると、次のようになります。
ソフトと練習方法の組み合わせによる速度差(交互作用)があるかもしれないので、パソコン初心者24人を選び、ソフトと練習方法を変えて練習してもらい、その後、タイプ速度を測定したところ、以下のようになったとします。
Excelの分析ツールでは、次の3種類の分散分析が利用可能です。
どの分散分析を利用するかは、以下のフローチャートに従ってください。
それでは、Excelを利用して、分散分析を行いましょう。 以下のファイルをダウンロードしてください。
comp2j_12_data.xls最初に、「繰り返しなし」の表について、分散分析を行います。
有意水準5%で分散分析を行い、帰無仮説 H 10 および H 20 が棄却できるかどうかを考えます。
まず、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「分散分析: 繰り返しのない二元配置」をクリックして、「OK」ボタンをクリックします。
「入力範囲」にはデータの範囲($A$2:$E$5)を入力し、「ラベル」のチェックを入れ、「α」が「0.05」であることを確認し、「出力先」をクリックして、空いているセル(例えば$G$1)を入力します。
すると、基本統計量と分散分析表が出力されます。
練習方法の違いによる速度差については、「行」の部分を見ます。 分散比 F が上側5%点より大きいので、帰無仮説 H 10 は棄却できます。 したがって、タイピングには練習方法の違いによる速度差があると言えます。
ソフトの違いによる速度差については、「列」の部分を見ます。 分散比 F が上側5%点より小さいので、帰無仮説 H 20 は棄却できません。 したがって、タイピングにソフトの違いによる速度差があるとは言えません。
次に、「繰り返しあり」の表について、分散分析を行います。
有意水準5%で分散分析を行い、帰無仮説 H 10 , H 20 および H 30 が棄却できるかどうかを考えます。
まず、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「分散分析: 繰り返しのある二元配置」をクリックして、「OK」ボタンをクリックします。
「入力範囲」にはデータの範囲($A$23:$E$29)を入力し、「1標本あたりの行数」に「2」と入力し、「α」が「0.05」であることを確認し、「出力先」をクリックして、空いているセル(例えば$G$22)を入力します。
すると、基本統計量と分散分析表が出力されます。
練習方法の違いによる速度差については、「標本」の部分を見ます。 分散比 F が上側5%点より大きいので、帰無仮説 H 10 は棄却できます。 したがって、タイピングには練習方法の違いによる速度差があると言えます。
ソフトの違いによる速度差については、「列」の部分を見ます。 分散比 F が上側5%点より小さいので、帰無仮説 H 20 は棄却できません。 したがって、タイピングにソフトの違いによる速度差があるとは言えません。
ソフトと練習方法の組み合わせによる速度差については、「交互作用」の部分を見ます。 分散比 F が上側5%点より小さいので、帰無仮説 H 30 は棄却できません。 したがって、タイピングにソフトと練習方法の交互作用があるとは言えません。
以下のファイルをダウンロードしてください。
comp2j_12_report.xls(1)ある資格取得スクールでは、ある資格試験のテキストとして、A, B, C, Dの4種類を用意しています。 また、時間割として、
の3種類を用意しています。 まだ資格試験の勉強をしていない12人を選び、テキストと時間割を変えて授業を受けてもらい、その後に模擬試験を実施したところ、以下のようになりました。
有意水準5%で分散分析を行い、帰無仮説 H 10 および H 20 が棄却できるかどうかを答えてください。
(2)テキストと時間割の組み合わせによる得点差(交互作用)があるかもしれないので、まだ資格試験の勉強をしていない24人を選び、テキストと時間割を変えて授業を受けてもらい、その後に模擬試験を実施したところ、以下のようになりました。
有意水準5%で分散分析を行い、帰無仮説 H 10 , H 20 および H 30 が棄却できるかどうかを答えてください。
今日の演習12の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(b08a001@cis.twcu.ac.jpなど)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(12月21日)を明記してください。