[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

コンピュータIIJ(統計データ解析)第10回

目次
10.1 母平均の差の検定
10.1.1 検定方法
10.1.2 F検定
10.1.3 母比率の差の検定
10.2 分析ツールによる検定(2)
10.2.1 母分散が等しい場合
10.2.2 母分散が等しくない場合
10.2.3 母比率の場合
10.3 演習10
10.4 レポート課題
10.5 参考文献
索引

10.1 母平均の差の検定

10.1.1 検定方法

前回の授業では、対標本と2標本の違いについて説明しました。 同一人物の前後のデータなら対標本、他人同士のデータなら2標本です。 今日は、2標本のデータについて、母平均に差があるかどうかを検定してみます。

例えば、大都市の中学生と過疎地の中学生との間に、何か差があるかと考えます。 学力、体力、および部活動の3点に注目し、英語の得点、50m走のタイム、および部活動への参加率を標本調査したとします。 帰無仮説は大都市と過疎地には差がないとし、対立仮説は差があるとします。

標本 X の大きさを n 1 , 平均を X , 標準偏差を s 1 , 標本 Y の大きさを n 2 , 平均を Y , 標準偏差を s 2 とします。 XY の母分散が等しい場合、「合併した標準偏差」

2標本検定の数式(1)

を定義すると、

2標本検定の数式(2)

は、自由度 n 1n 2 −2の t 分布に従います。 したがって、 t の値と両側5%点を比較すると、有意水準5%の両側検定が行えます。 t の定義式の分母は、2つの平均の差の標準誤差です。

母分散が等しくない場合は、 ウェルチの検定 と呼ばれる方法で検定を行います。 数式が複雑なので省略します。

10.1.2 F検定

母平均の差の検定を始めるには、母分散が等しいかどうか知る必要があります。 母分散が等しいかどうかは、 F 検定で分かります。

F分布 とは、確率分布の一種で、次の性質を持ちます。 標本 X の大きさを n 1 , 分散を s 1 2 , 標本 Y の大きさを n 2 , 分散を s 2 2 とすると、2つの分散の比 Fs 1 2s 2 2 は自由度( n 1 −1, n 2 −1) の F 分布に従う。

t 分布のときは、自由度 n −1というパラメータを1つ持ちましたが、 F 分布では自由度( n 1 −1, n 2 −1)とパラメータを2つ持ちます。

F 分布は、正規分布や t 分布と違い、左右対称ではありません。 そのため、有意水準5%の両側検定を行う際には、上側2.5%点と下側2.5%点を別々に用意しておき、上側2.5%点より大きいか下側2.5%点より小さいときに帰無仮説を棄却します。

10.1.3 母比率の差の検定

母比率の差の検定というものも考えられます。

標本 X の大きさを n 1 , 比率を p 1 とし、標本 Y の大きさを n 2 , 比率を p 2 とします。 「合併した比率」 p

2標本検定の数式(3)

と定義すると、

2標本検定の数式(4)

は、平均0、標準偏差1の正規分布に従うことが知られています。 したがって、 z の値と両側5%点を比較すると、有意水準5%の両側検定が行えます。

なお、 z の定義式の√( p ×(1− p ))を「合併した標準偏差」と見なし、分母を標準誤差と見なすと、母平均の差の検定と同じになります。


10.2 分析ツールによる検定(2)

10.2.1 母分散が等しい場合

Excelの分析ツールでは、次の3種類の t 検定が利用可能です。

どの t 検定を利用するかは、以下のフローチャートに従ってください。

t検定のフローチャート
図 10.1  t検定のフローチャート

母分散が等しいかどうかを調べるには、分析ツール「F 検定: 2 標本を使った分散の検定」を利用します。 F 検定では、帰無仮説を母分散が等しい(母分散比が1である)とし、対立仮説を母分散が等しくない(母分散比が1でない)とします。 帰無仮説が棄却できたら、分散が等しくないと仮定します。 帰無仮説が棄却できなかったら、等分散を仮定します。

それでは、Excelを利用して、仮説検定を行いましょう。 以下のファイルをダウンロードしてください。

comp2j_10_data.xls

表「英語の得点」は、大都市の中学生と過疎地の中学生との間で、英語の得点に差があるかどうかを標本調査したものです。 帰無仮説は英語の得点に差がないとし、対立仮説は英語の得点に差があるとします。 有意水準5%で両側検定を行います。

まず、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「F 検定: 2 標本を使った分散の検定」をクリックして、「OK」ボタンをクリックします。

仮説検定の方法(25)
図 10.2  仮説検定の方法(25)
仮説検定の方法(26)
図 10.3  仮説検定の方法(26)
仮説検定の方法(27)
図 10.4  仮説検定の方法(27)

分散比が上側2.5%点より小さいので、 F 検定の帰無仮説は棄却できません。 したがって、等分散を仮定します。

次に、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「t 検定: 等分散を仮定した 2 標本による検定」をクリックして、「OK」ボタンをクリックします。

仮説検定の方法(28)
図 10.5  仮説検定の方法(28)
仮説検定の方法(29)
図 10.6  仮説検定の方法(29)
仮説検定の方法(30)
図 10.7  仮説検定の方法(30)

t の値が両側5%点より大きいので、帰無仮説は棄却できます。 したがって、英語の得点には差があると言えます。

10.2.2 母分散が等しくない場合

表「50m走のタイム」は、大都市の中学生と過疎地の中学生との間で、50m走のタイムに差があるかどうかを標本調査したものです。 帰無仮説は50m走のタイムに差がないとし、対立仮説は50m走のタイムに差があるとします。 有意水準5%で両側検定を行います。

まず、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「F 検定: 2 標本を使った分散の検定」をクリックして、「OK」ボタンをクリックします。

仮説検定の方法(31)
図 10.8  仮説検定の方法(31)
仮説検定の方法(32)
図 10.9  仮説検定の方法(32)
仮説検定の方法(33)
図 10.10  仮説検定の方法(33)

分散比が上側2.5%点より大きいので、 F 検定の帰無仮説は棄却できます。 したがって、分散が等しくないと仮定します。

次に、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「t 検定: 分散が等しくないと仮定した 2 標本による検定」をクリックして、「OK」ボタンをクリックします。

仮説検定の方法(34)
図 10.11  仮説検定の方法(34)
仮説検定の方法(35)
図 10.12  仮説検定の方法(35)
仮説検定の方法(36)
図 10.13  仮説検定の方法(36)

t の値が両側5%点より小さいので、帰無仮説は棄却できません。 したがって、50m走のタイムに差があるとは言えません。

10.2.3 母比率の場合

表「部活動への参加」は、大都市の中学生と過疎地の中学生との間で、部活動への参加率に差があるかどうかを標本調査したものです。 帰無仮説は部活動への参加率に差がないとし、対立仮説は部活動への参加率に差があるとします。 有意水準5%で両側検定を行います。

仮説検定の方法(37)
図 10.14  仮説検定の方法(37)
仮説検定の方法(38)
図 10.15  仮説検定の方法(38)
仮説検定の方法(39)
図 10.16  仮説検定の方法(39)
仮説検定の方法(40)
図 10.17  仮説検定の方法(40)
仮説検定の方法(41)
図 10.18  仮説検定の方法(41)
仮説検定の方法(42)
図 10.19  仮説検定の方法(42)
仮説検定の方法(43)
図 10.20  仮説検定の方法(43)

z の値(の絶対値)が両側5%点より大きいので、帰無仮説は棄却できます。 したがって、部活動への参加率には差があると言えます。


10.3 演習10

以下のファイルをダウンロードしてください。

comp2j_10_report.xls

(1)表「英語の得点」は、公立校の中学生と私立校の中学生との間で、英語の得点に差があるかどうかを標本調査したものです。 帰無仮説は英語の得点に差がないとし、対立仮説は英語の得点に差があるとします。 有意水準5%で両側検定を行い、帰無仮説が棄却できるかどうかを答えてください。

仮説検定の方法(44)
図 10.21  仮説検定の方法(44)
仮説検定の方法(45)
図 10.22  仮説検定の方法(45)

(2)表「50m走のタイム」は、公立校の中学生と私立校の中学生との間で、50m走のタイムに差があるかどうかを標本調査したものです。 帰無仮説は50m走のタイムに差がないとし、対立仮説は50m走のタイムに差があるとします。 有意水準5%で両側検定を行い、帰無仮説が棄却できるかどうかを答えてください。

仮説検定の方法(46)
図 10.23  仮説検定の方法(46)
仮説検定の方法(47)
図 10.24  仮説検定の方法(47)

(3)表「部活動への参加」は、公立校の中学生と私立校の中学生との間で、部活動への参加率に差があるかどうかを標本調査したものです。 帰無仮説は部活動への参加率に差がないとし、対立仮説は部活動への参加率に差があるとします。 有意水準5%で両側検定を行い、帰無仮説が棄却できるかどうかを答えてください。

仮説検定の方法(48)
図 10.25  仮説検定の方法(48)

10.4 レポート課題

今日の演習10の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(b08a001@cis.twcu.ac.jpなど)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(12月7日)を明記してください。


10.5 参考文献


[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

2011年12月7日更新
小西 善二郎 <konishi@cis.twcu.ac.jp>
Copyright (C) 2011 Zenjiro Konishi. All rights reserved.