[小西ホームページ]   [目次・索引]   [次の授業]

コンピュータIIJ(統計データ解析)第1回

目次
1.1 教員の紹介
1.2 シラバス
1.2.1 内容
1.2.2 到達目標
1.2.3 スケジュール
1.2.4 教室外の学習方法
1.2.5 教材(テキスト)
1.2.6 教材(参考書等)
1.2.7 成績評価方法
1.2.8 成績評価基準
1.2.9 備考
1.3 履修者の抽選
1.4 ガイダンス
1.4.1 授業の概要
1.4.2 授業の準備
1.5 アンケート1
1.6 参考文献
索引

1.1 教員の紹介

名前
小西 善二郎(こにし ぜんじろう)
肩書き
東京女子大学非常勤講師
連絡先
konishi@cis.twcu.ac.jp

1.2 シラバス

1.2.1 内容

本講義では、表計算ソフトExcelを用いて統計データ解析を学ぶ。 記述統計学および統計的推測の基本について解説しながら、具体的なデータ解析の方法について実習を行う。 データの集計、グラフ化、仮説検定、統計的な分析などが行えることを目標とする。

1.2.2 到達目標

  1. 記述統計学および統計的推測の基本を理解する。
  2. Excelを用いて統計データ解析ができるようになる。

1.2.3 スケジュール

  1. ガイダンス
  2. 度数分布表とヒストグラム
    度数分布表とヒストグラムに関する課題を出すので、その課題に取り組むこと。
  3. 統計グラフ
    統計グラフに関する課題を出すので、その課題に取り組むこと。
  4. 代表値と散らばりの尺度
    代表値と散らばりの尺度に関する課題を出すので、その課題に取り組むこと。
  5. 散布図と相関係数
    散布図と相関係数に関する課題を出すので、その課題に取り組むこと。
  6. クロス集計表
    クロス集計表に関する課題を出すので、その課題に取り組むこと。
  7. 確率分布
    確率分布に関する課題を出すので、その課題に取り組むこと。
  8. 推定
    推定に関する課題を出すので、その課題に取り組むこと。
  9. 仮説検定(1)
    仮説検定に関する課題を出すので、その課題に取り組むこと。
  10. 仮説検定(2)
    仮説検定に関する課題を出すので、その課題に取り組むこと。
  11. 分散分析(1)
    分散分析に関する課題を出すので、その課題に取り組むこと。
  12. 分散分析(2)
    分散分析に関する課題を出すので、その課題に取り組むこと。
  13. 回帰分析
    回帰分析に関する課題を出すので、その課題に取り組むこと。
  14. 目的に応じた分析手法の選択
    まとめ

1.2.4 教室外の学習方法

「スケジュール」の欄を参照

1.2.5 教材(テキスト)

http://www.cis.twcu.ac.jp/~konishi/index-j.html

1.2.6 教材(参考書等)

授業内容に応じて参考資料を紹介する。

1.2.7 成績評価方法

毎回の課題60%と定期試験40%で成績を評価する。

1.2.8 成績評価基準

以下の基準にしたがって成績を評価する。

  1. 毎回の課題については、Excelによる統計データ解析ができているか。
  2. 定期試験については、記述統計学と統計的推測の基本を理解しているか。

1.2.9 備考

課題はすべて提出すること。

メール・アドレス: konishi@cis.twcu.ac.jp


1.3 履修者の抽選

コンピュータの台数の関係により、履修希望者が80名を越えた場合は抽選を行います。 抽選用紙には、時間割番号(2限はJJ207B, 3限はJJ207C)を記入してください。


1.4 ガイダンス

1.4.1 授業の概要

この授業の題目は「統計データ解析」です。 この題目の意図は、統計学の基本を理解した上で、実際に統計データを解析するということです。

統計学は、「記述統計学」と「統計的推測」の大きく二つの学問分野に分けられます。

記述統計学 とは、「統計データをどうまとめるか」という学問分野です。 一般的に、統計データは大量の数の羅列です。 これをただ眺めていても、何が何だかよく分からなでしょう。

などの方法で統計データをまとめ、何らかの法則・規則を見つけ出す。 これが記述統計学です。

記述統計学のイメージ
図 1.1  記述統計学のイメージ

統計的推測 とは、「一部」を調べて「全部」を知る学問分野です。 「サンプル調査」という言葉を聞いたことがあれば、イメージが湧くでしょう。 統計的推測は、確率論が基礎になります。

例えば、血圧を下げると考えられる飲料の効果を調べたいとします。 日本人全員にこの飲料を飲んでもらえれば、効果があるかどうかが分かりますが、そんなことは不可能です。 そこで、ランダムに選んだ数十人にこの飲料を飲んでもらい、血圧の変化を調べます。 そして、確率論に基づいてこの統計データを解析し、日本人全員に効果があるかどうかを推測するというわけです。

統計的推測のイメージ
図 1.2  統計的推測のイメージ

なお、統計データを解析する前に、統計データを収集する必要があります。 データの集め方についての学問分野もあります( 実験計画法社会調査法 )が、この授業の対象外です。

また、統計学の数学的理論についての学問分野もあります( 数理統計学 )が、この授業では取り扱いません。

さて、実際に統計データを解析するわけですが、電卓をたたくのではなく、パソコンを使います。 この授業ではExcelを利用します。 Excel は表計算ソフトの一種ですが、統計用の機能も充実しています。 具体的には、

などの機能を利用して、統計データを解析します。

1.4.2 授業の準備

この授業では、Microsoft Excel 2004 for Mac(以下Excel 2004)を利用します。 Microsoft Excel for Mac 2011(以下Excel 2011)ではありません。

東京女子大学のMacでは、Excel 2004は、「アプリケーション」→「Office_old」→「Microsoft Office 2004」→「Microsoft Excel」にインストールされています。

Excel 2004のアイコンをDockに登録すると便利です。 アイコンをDockの点線の左側にドラッグ・アンド・ドロップしてください。

一般的にExcelには、「 分析ツール 」という統計関係のツールがあります。 この授業では、この「分析ツール」を利用して統計データ解析を行います。 「分析ツール」は、Excel 2004にはありますが、Excel 2011にはありません。 しかも、Excelファイルのアイコンをダブルクリックすると、Excel 2011で開いてしまいます。 そこで、意図的にExcel 2004で開く必要があるわけです。

ExcelファイルをExcel 2004で開くには、次のいずれかの操作をしてください。

なお、Excel 2004で「分析ツール」を利用するには、最初の一回だけ、「分析ツール」を登録する操作を行います。 次のように操作してください。

  1. メニューバーで「ツール」→「アドイン」とクリックします。
  2. 「分析ツール」のチェックを有効にします。
アドインのダイアログボックス
図 1.3  アドインのダイアログボックス

メニューバーで「ツール」→「分析ツール」とクリックしてください。 次のようなウィンドウが開いたら成功です。

データ分析のダイアログボックス
図 1.4  データ分析のダイアログボックス

ちなみに、Windows用のExcelは、どのバージョンでも「分析ツール」を利用できます。 (極端に古いものは不明ですが。) したがって、この授業で勉強したことは、Windowsにも通用します。


1.5 アンケート1

履修者の予備知識を確認するため、アンケートを行います。 以下の質問に答え、回答をメールで提出してください。 差出人は学内のメール・アドレス(b08a001@cis.twcu.ac.jpなど)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(9月28日)を明記してください。

  1. Excelの関数を使ったことはありますか。
  2. 総和を表す数学記号Σ(シグマ)の使い方は分かりますか。
  3. 大学受験などで「偏差値」という単語が使われますが、どのように計算するか分かりますか。
  4. 今まで、大学で統計関係の授業を受けたことはありますか。 あれば、科目名を答えてください。
  5. Excel以外で、統計用のソフトウェアを利用したことはありますか。 あれば、ソフト名を答えてください。
  6. 授業内容に関して、何か希望がありましたら答えてください。

1.6 参考文献


[小西ホームページ]   [目次・索引]   [次の授業]

2011年10月26日更新
小西 善二郎 <konishi@cis.twcu.ac.jp>
Copyright (C) 2011 Zenjiro Konishi. All rights reserved.