[小西ホームページ]   [目次・索引]   [前の授業]

コンピュータIIJ(統計データ解析)第14回

目次
14.1 目的に応じた分析手法の選択
14.1.1 分析手法の選択方法
14.1.2 分析手法の選択例
14.2 統計的推測のまとめ
14.3 今後の予定
14.4 試験について
14.5 成績評価について
14.6 参考文献
索引

14.1 目的に応じた分析手法の選択

14.1.1 分析手法の選択方法

これまでに、色々な検定や分析を行ってきました。 Excelに一つ一つ数式を入力したこともありましたが、本格的な検定や分析については統計解析ソフトを利用しました。 この授業で扱った分析手法は以下の通りです。

それぞれの分析手法の操作方法はすでに説明しましたが、間違った分析手法を選んでしまうと、操作方法が正しくても意味のある結果は得られません。 最後の授業内容として、どのような目的のときに、どのような分析手法を選択すべきかということを考えます。

まず、変数の間の差異を見るか、関係を見るかを判断します。 差異を見る場合は、 t 検定か分散分析です。 関係を見る場合は、回帰分析になります。

次に、差異を見る場合、変数が2変数か3変数以上かを判断します。 2変数の場合は、 t 検定になります。 3変数以上の場合は、分散分析になります。

分析手法のフローチャート
図 14.1  分析手法のフローチャート

最後に、 t 検定の場合は、第10回のフローチャートの通りに判断します。 分散分析の場合も、第12回のフローチャートの通りに判断します。

14.1.2 分析手法の選択例

例題1. 中学2年生10名に対して、数学と理科の試験を実施した。 理科の得点を数学の得点で説明する方程式を知りたい。

解答: 数学の得点と理科の得点の関係を見るので、「回帰分析」を選択します。

例題2. 小学5年生の男子10名と女子10名に対して、身長を測定した。 性別によって身長に違いがあるか知りたい。 母分散は等しいと仮定する。

解答: 男子の身長と女子の身長の差異を見るので、 t 検定か分散分析です。 男子と女子で2変数なので、 t 検定です。 さらに、2標本であり、母分散が等しいと仮定されているので、「t 検定: 等分散を仮定した 2 標本による検定」を選択します。

例題3. 高校1年生、2年生、3年生それぞれ10名に対して、1日の勉強時間を調査した。 学年によって勉強時間に違いがあるか知りたい。

解答: 学年による勉強時間の差異を見るので、 t 検定か分散分析です。 1年生、2年生、3年生で3変数なので、分散分析です。 さらに、因子は学年だけなので一元配置となり、「分散分析: 一元配置」を選択します。


14.2 統計的推測のまとめ

表 14.1  色々な確率分布
確率分布 説明 用途
正規分布 最も代表的な確率分布 (1)母分散が既知または標本が大きい場合の母平均の検定(2)母比率の検定
t分布 標本が小さい場合の正規分布の代用 母分散が未知かつ標本が小さい場合の母平均の検定
F分布 分散の比の分布 (1)母分散の検定(2)分散分析
表 14.2  仮説検定の流れ
帰無仮説が棄却される→対立仮説が採択される→対立仮説が言えるという結果
帰無仮説が棄却されない→対立仮説は言えないという結果
表 14.3  帰無仮説と対立仮説
問題 帰無仮説 対立仮説 検定方法
母平均が100かどうか 母平均=100 母平均≠100 両側検定
母平均が100より大きいか 母平均=100 母平均>100 片側検定
Xの母平均とYの母平均が等しいかどうか Xの母平均=Yの母平均 Xの母平均≠Yの母平均 両側検定
Xの母平均がYの母平均より大きいか Xの母平均=Yの母平均 Xの母平均>Yの母平均 片側検定
表 14.4  信頼区間、検定統計量、 p
検定の基準 典型的な検定方法
信頼区間 95%信頼区間に100が入っていなければ帰無仮説は棄却される。(100かどうかの検定)
検定統計量 t統計量の絶対値が両側5%点より大きいならば帰無仮説は棄却される。(両側検定)
p p値が0.05未満ならば帰無仮説は棄却される。

14.3 今後の予定

今後の予定は以下の通りです。

1月22日(火)
この日までに、レポートの提出状況をメールで知らせます。
1月23日(水)
定期試験を実施します。
1月30日(水)
レポートの最終締切日です。 この日以後に提出されたレポートは採点しません。

14.4 試験について

試験会場は、学務課が配布する時間割で確認してください。

試験時間は30分間です。

試験の形式は、四者択一問題が10問です。

試験の内容は、記述統計学と統計的推測の基本についてです。 Excelや統計解析ソフトの操作方法は出題しません。

電卓、パソコンは使用不可です。 資料の持ち込みも不可です。

問1. 第3回から出題。 与えられた統計データを、どのような統計グラフ(棒グラフ、折れ線グラフ、円グラフ、帯グラフ)で表すのが適切かを選ぶ問題。

問2. 第4回から出題。 平均、中央値、分散を計算する問題。 公式を覚えておくこと。

問3. 第5回から出題。 散布図と相関係数の解釈に関する問題。

問4. 第6回から出題。 クロス集計表の解釈に関する問題。

問5. 第7回から出題。 正規分布のシグマ範囲に関する問題。

問6. 第9〜13回から出題。 適切な分析手法( t 検定、分散分析、回帰分析)を選択する問題。

問7. 第9〜13回から出題。 適切な分析手法( t 検定、分散分析、回帰分析)を選択する問題。

問8. 第9〜10回から出題。 統計解析ソフトで t 検定を行ったとき、どの数値を見ればよいかを問う問題。

問9. 第11〜12回から出題。 統計解析ソフトで分散分析を行ったとき、どの数値を見ればよいかを問う問題。

問10. 第13回から出題。 回帰分析において、 y 切片と回帰係数から、どのように回帰値を計算するかを問う問題。


14.5 成績評価について

この授業の成績は、レポートの提出が60%, 試験の得点が40%という割合で決まります。 レポートが未提出の場合、そのレポートは0点になりますので、レポートはすべて提出するようにしてください。


14.6 参考文献


[小西ホームページ]   [目次・索引]   [前の授業]

2013年1月9日更新
小西 善二郎 <konishi@cis.twcu.ac.jp>
Copyright (C) 2013 Zenjiro Konishi. All rights reserved.