前回の授業では、対標本と2標本の違いについて説明しました。 同一人物の前後のデータなら対標本、他人同士のデータなら2標本です。 今日は、2標本のデータについて、母平均に差があるかどうかを検定してみます。
例えば、大都市の中学生と過疎地の中学生との間に、何か差があるかと考えます。 学力、体力、および部活動の3点に注目し、英語の得点、50m走のタイム、および部活動への参加率を標本調査したとします。 帰無仮説は大都市と過疎地には差がないとし、対立仮説は差があるとします。
標本 X の大きさを n 1 , 平均を X , 標準偏差を s 1 , 標本 Y の大きさを n 2 , 平均を Y , 標準偏差を s 2 とします。 X と Y の母分散が等しい場合、「合併した標準偏差」
を定義すると、
は、自由度 n 1 + n 2 −2の t 分布に従います。 したがって、 t の値と両側5%点を比較すると、有意水準5%の両側検定が行えます。 t の定義式の分母は、2つの平均の差の標準誤差です。
母分散が等しくない場合は、 ウェルチの検定 と呼ばれる方法で検定を行います。 数式が複雑なので省略します。
母平均の差の検定を始めるには、母分散が等しいかどうか知る必要があります。 母分散が等しいかどうかは、 F 検定で分かります。
F分布 とは、確率分布の一種で、次の性質を持ちます。 標本 X の大きさを n 1 , 分散を s 1 2 , 標本 Y の大きさを n 2 , 分散を s 2 2 とすると、2つの分散の比 F = s 1 2 / s 2 2 は自由度( n 1 −1, n 2 −1) の F 分布に従う。
t 分布のときは、自由度 n −1というパラメータを1つ持ちましたが、 F 分布では自由度( n 1 −1, n 2 −1)とパラメータを2つ持ちます。
F 分布は、正規分布や t 分布と違い、左右対称ではありません。 そのため、有意水準5%の両側検定を行う際には、上側2.5%点と下側2.5%点を別々に用意しておき、上側2.5%点より大きいか下側2.5%点より小さいときに帰無仮説を棄却します。
母比率の差の検定というものも考えられます。
標本 X の大きさを n 1 , 比率を p 1 とし、標本 Y の大きさを n 2 , 比率を p 2 とします。 「合併した比率」 p を
と定義すると、
は、平均0、標準偏差1の正規分布に従うことが知られています。 したがって、 z の値と両側5%点を比較すると、有意水準5%の両側検定が行えます。
なお、 z の定義式の√( p ×(1− p ))を「合併した標準偏差」と見なし、分母を標準誤差と見なすと、母平均の差の検定と同じになります。
Excelの分析ツールでは、次の3種類の t 検定が利用可能です。
どの t 検定を利用するかは、以下のフローチャートに従ってください。
母分散が等しいかどうかを調べるには、分析ツール「F 検定: 2 標本を使った分散の検定」を利用します。 F 検定では、帰無仮説を母分散が等しい(母分散比が1である)とし、対立仮説を母分散が等しくない(母分散比が1でない)とします。 帰無仮説が棄却できたら、分散が等しくないと仮定します。 帰無仮説が棄却できなかったら、等分散を仮定します。
それでは、Excelを利用して、仮説検定を行いましょう。 以下のファイルをダウンロードしてください。
comp2j_10_data.xls表「英語の得点」は、大都市の中学生と過疎地の中学生との間で、英語の得点に差があるかどうかを標本調査したものです。 帰無仮説は英語の得点に差がないとし、対立仮説は英語の得点に差があるとします。 有意水準5%で両側検定を行います。
まず、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「F 検定: 2 標本を使った分散の検定」をクリックして、「OK」ボタンをクリックします。
分散比が上側2.5%点より小さいので、 F 検定の帰無仮説は棄却できません。 したがって、等分散を仮定します。
次に、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「t 検定: 等分散を仮定した 2 標本による検定」をクリックして、「OK」ボタンをクリックします。
t の値が両側5%点より大きいので、帰無仮説は棄却できます。 したがって、英語の得点には差があると言えます。
表「50m走のタイム」は、大都市の中学生と過疎地の中学生との間で、50m走のタイムに差があるかどうかを標本調査したものです。 帰無仮説は50m走のタイムに差がないとし、対立仮説は50m走のタイムに差があるとします。 有意水準5%で両側検定を行います。
まず、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「F 検定: 2 標本を使った分散の検定」をクリックして、「OK」ボタンをクリックします。
分散比が上側2.5%点より大きいので、 F 検定の帰無仮説は棄却できます。 したがって、分散が等しくないと仮定します。
次に、メニューバーで「ツール」→「分析ツール」とクリックして、分析ツールのウィンドウを開きます。 「t 検定: 分散が等しくないと仮定した 2 標本による検定」をクリックして、「OK」ボタンをクリックします。
t の値が両側5%点より小さいので、帰無仮説は棄却できません。 したがって、50m走のタイムに差があるとは言えません。
表「部活動への参加」は、大都市の中学生と過疎地の中学生との間で、部活動への参加率に差があるかどうかを標本調査したものです。 帰無仮説は部活動への参加率に差がないとし、対立仮説は部活動への参加率に差があるとします。 有意水準5%で両側検定を行います。
z の値(の絶対値)が両側5%点より大きいので、帰無仮説は棄却できます。 したがって、部活動への参加率には差があると言えます。
以下のファイルをダウンロードしてください。
comp2j_10_report.xls(1)表「英語の得点」は、公立校の中学生と私立校の中学生との間で、英語の得点に差があるかどうかを標本調査したものです。 帰無仮説は英語の得点に差がないとし、対立仮説は英語の得点に差があるとします。 有意水準5%で両側検定を行い、帰無仮説が棄却できるかどうかを答えてください。
(2)表「50m走のタイム」は、公立校の中学生と私立校の中学生との間で、50m走のタイムに差があるかどうかを標本調査したものです。 帰無仮説は50m走のタイムに差がないとし、対立仮説は50m走のタイムに差があるとします。 有意水準5%で両側検定を行い、帰無仮説が棄却できるかどうかを答えてください。
(3)表「部活動への参加」は、公立校の中学生と私立校の中学生との間で、部活動への参加率に差があるかどうかを標本調査したものです。 帰無仮説は部活動への参加率に差がないとし、対立仮説は部活動への参加率に差があるとします。 有意水準5%で両側検定を行い、帰無仮説が棄却できるかどうかを答えてください。
今日の演習10の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(b08a001@cis.twcu.ac.jpなど)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(12月7日)を明記してください。