[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

コンピュータIIJ(統計データ解析)第12回

目次
12.1 二元配置の分散分析
12.1.1 繰り返しのない場合
12.1.2 繰り返しのある場合
12.2 分析ツールによる分散分析(2)
12.2.1 繰り返しのない二元配置
12.2.2 繰り返しのある二元配置
12.3 演習12
12.4 レポート課題
12.5 参考文献
索引

12.1 二元配置の分散分析

12.1.1 繰り返しのない場合

前回は、分散分析について説明しました。 その中で、因子(データに影響を与える要因)が2種類のときは、二元配置と呼ぶと言いました。 今日は、二元配置の分散分析を行います。

次の例を考えます。

あるパソコン・スクールでは、タイピング練習ソフトとして、A, B, C, Dの4種類を用意しています。 また、練習方法として、

  1. 毎回の授業で少しずつ練習する
  2. 2〜3回に1回の割合で練習する
  3. 1回の授業でまとめて練習する

の3種類を用意しています。 パソコン初心者12人を選び、ソフトと練習方法を変えて練習してもらい、その後、タイプ速度(1分間に打てる文字数)を測定したところ、以下のようになったとします。

分散分析(11)
図 12.1  分散分析(11)

この例は、ソフトと練習方法の違いが、タイプ速度に影響を与えるかどうかを考えています。 したがって、因子は2種類で、二元配置となります。

この例は、2因子(ソフトと練習方法)の組み合わせごとに、データが1つだけです。 このようなデータを、 繰り返しのない二元配置 と呼びます。 2因子の組み合わせごとに、データが複数ある場合は、 繰り返しのある二元配置 と呼ばれます。

さて、上記の例で、平均を見てみましょう。 練習方法1の平均は132文字/分、練習方法2の平均は107文字/分、練習方法3の平均は86文字/分です。 練習方法の違いによる速度差は、多少ありそうです。 一方、ソフトAの平均は109文字/分、ソフトBの平均は96文字/分、ソフトCの平均は113文字/分、ソフトDの平均は115文字/分です。 ソフトの違いによる速度差は、あまり無さそうです。

一元配置の分散分析では、変動を

全体の変動=水準間の変動+水準内の変動

と分解しました。 ここで、変動とは平均との差の平方和のことで、水準とは因子の項目のことでした。

これに対して、二元配置の分散分析では、

全体の変動=因子1の水準間の変動+因子2の水準間の変動+統計的誤差による変動

と分解します。 分解した後は、一元配置と同じように、それぞれの変動から分散を求め、分散比 F を求めて F 検定を行います。 (詳細は省略します。)

12.1.2 繰り返しのある場合

繰り返しのある二元配置では、変動の分解がさらに複雑になります。

全体の変動=因子1の水準間の変動+因子2の水準間の変動+交互作用による変動+統計的誤差による変動

ここで、 交互作用 とは、一つ一つの因子ではなく、2因子の組み合わせによって、データに影響を与えることです。

上記の例を、繰り返しのある二元配置にすると、次のようになります。

ソフトと練習方法の組み合わせによる速度差(交互作用)があるかもしれないので、パソコン初心者24人を選び、ソフトと練習方法を変えて練習してもらい、その後、タイプ速度を測定したところ、以下のようになったとします。

分散分析(16)
図 12.2  分散分析(16)

12.2 分析ツールによる分散分析(2)

12.2.1 繰り返しのない二元配置

Excelの分析ツールでは、次の3種類の分散分析が利用可能です。

どの分散分析を利用するかは、以下のフローチャートに従ってください。

分散分析のフローチャート
図 12.3  分散分析のフローチャート

それでは、Excelを利用して、分散分析を行いましょう。 以下のファイルをダウンロードしてください。

comp2j_12_data.xls

最初に、「繰り返しなし」の表について、分散分析を行います。

有意水準5%で分散分析を行い、帰無仮説 H 10 および H 20 が棄却できるかどうかを考えます。

まず、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「分散分析: 繰り返しのない二元配置」をクリックして、「OK」ボタンをクリックします。

分散分析(12)
図 12.4  分散分析(12)

「入力範囲」にはデータの範囲($A$2:$E$5)を入力し、「ラベル」のチェックを入れ、「α」が「0.05」であることを確認し、「出力先」をクリックして、空いているセル(例えば$G$1)を入力します。

分散分析(13)
図 12.5  分散分析(13)

すると、基本統計量と分散分析表が出力されます。

分散分析(14)
図 12.6  分散分析(14)
分散分析(15)
図 12.7  分散分析(15)

練習方法の違いによる速度差については、「行」の部分を見ます。 分散比 F が上側5%点より大きいので、帰無仮説 H 10 は棄却できます。 したがって、タイピングには練習方法の違いによる速度差があると言えます。

ソフトの違いによる速度差については、「列」の部分を見ます。 分散比 F が上側5%点より小さいので、帰無仮説 H 20 は棄却できません。 したがって、タイピングにソフトの違いによる速度差があるとは言えません。

12.2.2 繰り返しのある二元配置

次に、「繰り返しあり」の表について、分散分析を行います。

有意水準5%で分散分析を行い、帰無仮説 H 10 , H 20 および H 30 が棄却できるかどうかを考えます。

まず、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「分散分析: 繰り返しのある二元配置」をクリックして、「OK」ボタンをクリックします。

分散分析(17)
図 12.8  分散分析(17)

「入力範囲」にはデータの範囲($A$23:$E$29)を入力し、「1標本あたりの行数」に「2」と入力し、「α」が「0.05」であることを確認し、「出力先」をクリックして、空いているセル(例えば$G$22)を入力します。

分散分析(18)
図 12.9  分散分析(18)

すると、基本統計量と分散分析表が出力されます。

分散分析(19)
図 12.10  分散分析(19)
分散分析(20)
図 12.11  分散分析(20)

練習方法の違いによる速度差については、「標本」の部分を見ます。 分散比 F が上側5%点より大きいので、帰無仮説 H 10 は棄却できます。 したがって、タイピングには練習方法の違いによる速度差があると言えます。

ソフトの違いによる速度差については、「列」の部分を見ます。 分散比 F が上側5%点より小さいので、帰無仮説 H 20 は棄却できません。 したがって、タイピングにソフトの違いによる速度差があるとは言えません。

ソフトと練習方法の組み合わせによる速度差については、「交互作用」の部分を見ます。 分散比 F が上側5%点より小さいので、帰無仮説 H 30 は棄却できません。 したがって、タイピングにソフトと練習方法の交互作用があるとは言えません。


12.3 演習12

以下のファイルをダウンロードしてください。

comp2j_12_report.xls

(1)ある資格取得スクールでは、ある資格試験のテキストとして、A, B, C, Dの4種類を用意しています。 また、時間割として、

  1. 1日1時間を20日間
  2. 1日2時間を10日間
  3. 1日4時間を5日間

の3種類を用意しています。 まだ資格試験の勉強をしていない12人を選び、テキストと時間割を変えて授業を受けてもらい、その後に模擬試験を実施したところ、以下のようになりました。

分散分析(21)
図 12.12  分散分析(21)

有意水準5%で分散分析を行い、帰無仮説 H 10 および H 20 が棄却できるかどうかを答えてください。

分散分析(22)
図 12.13  分散分析(22)

(2)テキストと時間割の組み合わせによる得点差(交互作用)があるかもしれないので、まだ資格試験の勉強をしていない24人を選び、テキストと時間割を変えて授業を受けてもらい、その後に模擬試験を実施したところ、以下のようになりました。

分散分析(23)
図 12.14  分散分析(23)

有意水準5%で分散分析を行い、帰無仮説 H 10 , H 20 および H 30 が棄却できるかどうかを答えてください。

分散分析(24)
図 12.15  分散分析(24)

12.4 レポート課題

今日の演習12の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(b08a001@cis.twcu.ac.jpなど)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(12月21日)を明記してください。


12.5 参考文献


[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

2011年12月21日更新
小西 善二郎 <konishi@cis.twcu.ac.jp>
Copyright (C) 2011 Zenjiro Konishi. All rights reserved.