[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

コンピュータIIJ(統計データ解析)第6回

目次
6.1 クロス集計表
6.1.1 クロス集計表とは
6.1.2 クロス集計表の相対度数
6.1.3 クロス集計表の注意点
6.2 クロス集計表の作成
6.2.1 ピボットテーブルの作成
6.2.2 相対度数の計算
6.3 クロス集計表のグラフ化
6.4 演習6
6.5 レポート課題
6.6 参考文献
索引

6.1 クロス集計表

6.1.1 クロス集計表とは

前回の授業では、2次元データを散布図にしました。 ただ、散布図にできるのは、量的データの場合です。 今日は、質的データの場合を考えます。

ここで、例として、ある小学校の5年生に対して、以下のようなアンケート調査が行われたとしましょう。

小五男女の体育の好き嫌いアンケート

問1 あなたは男女のどちらですか。

1. 男子      2. 女子

問2 あなたは体育が好きですか。

1. 好き      2. 嫌い

そして、以下のようなアンケート結果が得られたとします。

表 6.1  2次元の質的データの例
児童 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
男女 2 2 2 1 1 1 2 2 1 2 2 2 2 1 1
体育 2 1 1 1 1 1 1 1 1 2 1 1 1 1 2

これは、2次元の質的データです。 このようなデータは、クロス集計表というものにまとめられます。

クロス集計表 とは、変数 x (今回は男女)の項目(男子、女子)を縦に並べ、変数 y (体育)の項目(好き、嫌い)を横に並べ、項目の交わる部分に対応するデータの度数を書き込んだ表です。

表 6.2  クロス集計表の例

体育 合計
好き 嫌い
男子 5 1 6
女子 7 2 9
合計 12 3 15

クロス集計表は、 分割表クロス表 とも呼ばれます。

6.1.2 クロス集計表の相対度数

上記のクロス集計表から、何が読み取れるでしょうか。 体育の好きな男子が5人、女子が7人だから、男子より女子のほうが体育が好きだと言っていいでしょうか。 そもそも、アンケート調査した人数が男女で異なっているので、人数を比較するのではなく、割合を比較すべきです。 この割合、すなわち度数÷合計を、 相対度数 と呼びます。 クロス集計表に相対度数を追加すると、次のようになります。

表 6.3  相対度数(横比)を追加したクロス集計表

体育 合計
好き 嫌い
男子 5
83%
1
17%
6
100%
女子 7
78%
2
22%
9
100%
合計 12
80%
3
20%
15
100%

これで、体育の好きな男子が83%、女子が78%だから、女子より男子のほうが体育が好きだと言えます。

なお、今回の相対度数は、度数を横方向の合計で割りました。 これを横比と言います。 度数を縦方向の合計で割った、縦比の相対度数も考えられます。

表 6.4  相対度数(縦比)を追加したクロス集計表

体育 合計
好き 嫌い
男子 5
42%
1
33%
6
40%
女子 7
58%
2
67%
9
60%
合計 12
100%
3
100%
15
100%

さらに、度数を全度数で割った相対度数もあり得ます。

表 6.5  相対度数(全体比)を追加したクロス集計表

体育 合計
好き 嫌い
男子 5
33%
1
7%
6
40%
女子 7
47%
2
13%
9
60%
合計 12
80%
3
20%
15
100%

横比、縦比、全体比のどの相対度数を使うべきかはデータによりますが、多くの場合、横比が使われます。

6.1.3 クロス集計表の注意点

量的な2次元データは散布図にする、質的な2次元データはクロス集計表にする、と分かりました。 では、質的データと量的データの組み合わせは、どうすればいいでしょうか。

以下のデータは、ある高校の生徒の性別と体重です。 男女(1=男子、2=女子)は質的データで、体重は量的データです。

表 6.6  2次元データ(質的と量的)の例
生徒 1 2 3 4 5 6 7 8 9 10
性別 2 1 1 2 1 1 1 2 2 1
体重(kg) 51.0 71.1 67.2 56.1 55.1 61.0 57.6 50.5 50.1 68.0

このような場合は、量的データを適切な階級に分ければ、クロス集計表にまとめられます。

表 6.7  クロス集計表(量的と質的)の例

体重 合計
50〜60 60〜70 70〜80
男子 2 3 1 6
女子 4 0 0 4
合計 6 3 1 10

6.2 クロス集計表の作成

6.2.1 ピボットテーブルの作成

それでは、Excelを利用して、クロス集計表を作成しましょう。 次のExcelファイルをダウンロードしてください。

comp2j_06_data.xls
表 6.8  小五男女の体育の好き嫌い
児童 男女 体育
1 2 2
2 2 1
3 2 1
... ... ...
15 1 2

Excelでクロス集計表を作成するには、ピボットテーブルの作成機能を利用します。

まず、メニューバーで「データ」→「ピボットテーブルレポート」とクリックします。 すると、ピボットテーブルウィザードが開きます。

「Excelのリスト/データベース」をクリックして、「次へ」ボタンをクリックします。

ピボットテーブルの作成(1)
図 6.1  ピボットテーブルの作成(1)

データの範囲として、セルB1からC16まで($B$1:$C$16)と入力し、「次へ」ボタンをクリックします。

ピボットテーブルの作成(2)
図 6.2  ピボットテーブルの作成(2)

ピボットテーブルの作成先として、「既存のワークシート」をクリックし、余白(例えば$E$1)を入力し、「レイアウト」ボタンをクリックします。

ピボットテーブルの作成(3)
図 6.3  ピボットテーブルの作成(3)

「行」領域に「男女」をドラッグ・アンド・ドロップします。 「列」領域に「体育」をドラッグ・アンド・ドロップします。 「データ」領域「男女」をドラッグ・アンド・ドロップします。 これでピボットテーブルのレイアウトが決まるので、「OK」ボタンをクリックします。

ピボットテーブルの作成(4)
図 6.4  ピボットテーブルの作成(4)

最後に、「完了」ボタンをクリックします。

ピボットテーブルの作成(5)
図 6.5  ピボットテーブルの作成(5)

すると、ピボットテーブルが作成されます。

ピボットテーブルの作成(6)
図 6.6  ピボットテーブルの作成(6)

ただし、この表はデータの個数を数えているのではなく、データの合計をしています。 これを切り替えるために、表の左上(セルE1)を右クリックして「フィールドの設定」をクリックします。

「集計の方法」の「データの個数」をクリックして、「OK」ボタンをクリックします。

ピボットテーブルの作成(7)
図 6.7  ピボットテーブルの作成(7)

すると、データの個数を数えた表に切り替わります。

ピボットテーブルの作成(8)
図 6.8  ピボットテーブルの作成(8)

6.2.2 相対度数の計算

次に、このピボットテーブルをコピー・アンド・ペーストして、クロス集計表らしく直しましょう。 ただし、ピボットテーブル全体のドラッグがうまくいかないので、表の左上(セルE1)を右クリックして、「選択」→「テーブル全体」とクリックします。 そして、メニューバーで「編集」→「コピー」とクリックします。 あとは、ペースト先(例えばセルJ1)を右クリックし、「形式を選択してペースト」をクリックし、「値」をクリックします。

クロス集計表の作成(1)
図 6.9  クロス集計表の作成(1)

不要な文字を消し、「1」を「男子」、「2」を「女子」などと書き換えます。 最後に、読みやすくするために罫線を引きます。 これで、クロス集計表が完成します。

クロス集計表の作成(2)
図 6.10  クロス集計表の作成(2)

相対度数を追加したクロス集計表も作成しましょう。 相対度数は横比で計算することにします。

まず、クロス集計表を余白(例えばセルO1)にコピー・アンド・ペーストします。 ペーストは、値のみにしてください。

クロス集計表の作成(3)
図 6.11  クロス集計表の作成(3)

表を1行おきにするために、空けたい範囲(セルO4からR4まで)をドラッグし、右クリックして「挿入」をクリックします。

「下方向にシフト」をクリックして、「OK」ボタンをクリックします。

クロス集計表の作成(4)
図 6.12  クロス集計表の作成(4)

これを繰り返して、表を1行おきにします。

クロス集計表の作成(5)
図 6.13  クロス集計表の作成(5)

セルP4に数式=P3/$R3を入力し、セルの表示形式をパーセンテージにします。 このセルを1行おきにコピー・アンド・ペーストすると、すべての相対度数が計算されます。

クロス集計表の作成(6)
図 6.14  クロス集計表の作成(6)

罫線を引いて読みやすくすれば、完成です。

クロス集計表の作成(7)
図 6.15  クロス集計表の作成(7)

6.3 クロス集計表のグラフ化

クロス集計表を分かりやすくするために、グラフ化してみましょう。 ここでは、3次元の棒グラフを作成します。

3次元棒グラフの例(1)
図 6.16  3次元棒グラフの例(1)

クロス集計表のラベルとデータの範囲(セルJ2からL4まで)をドラッグし、メニューバーで「挿入」→「グラフ」とクリックして、グラフウィザードを開きます。

「グラフの種類」は「縦棒」、「形式」は「3-D縦棒グラフ」をクリックし、「次へ」ボタンをクリックします。

3次元棒グラフの作成(1)
図 6.17  3次元棒グラフの作成(1)

「系列」を「列」に変更して、「次へ」ボタンをクリックします。

3次元棒グラフの作成(2)
図 6.18  3次元棒グラフの作成(2)

「グラフタイトル」に「小五男女の体育の好き嫌い」と入力し、「Y/系列軸」に「体育」と入力し、「Z/数値軸」に「人数(人)」と入力します。

3次元棒グラフの作成(3)
図 6.19  3次元棒グラフの作成(3)

同じウィンドウで「凡例」タブをクリックし、「凡例を表示する」のチェックを外して、「次へ」ボタンをクリックします。

3次元棒グラフの作成(4)
図 6.20  3次元棒グラフの作成(4)

「グラフの場所」が「オブジェクト」であることを確認して、「完了」ボタンをクリックします。

3次元棒グラフの作成(5)
図 6.21  3次元棒グラフの作成(5)

すると、3次元の棒グラフが完成します。

3次元棒グラフの例(1)
図 6.22  3次元棒グラフの例(1)

6.4 演習6

ある小学校で、2年生と5年生の合計75人の児童に対して、以下のアンケートを実施したとします。

小学生の学習塾への通学アンケート

問1 あなたの学年を教えてください。

(    )年生

問2 あなたは学習塾に通っていますか。

1. 通っている      2. 通っていない

このアンケートの結果をまとめたExcelファイルをダウンロードしてください。

comp2j_06_report.xls
表 6.9  小学生の学習塾への通学
児童 学年 学習塾
1 5 2
2 2 1
3 2 2
... ... ...
75 5 1

(1)このデータのクロス集計表を作成してください。

クロス集計表の例(1)
図 6.23  クロス集計表の例(1)

(2)相対度数を追加したクロス集計表も作成してください。 相対度数は横比で計算してください。

クロス集計表の例(2)
図 6.24  クロス集計表の例(2)

(3)このクロス集計表を3次元の棒グラフにしてください。

3次元棒グラフの例(2)
図 6.25  3次元棒グラフの例(2)

6.5 レポート課題

今日の演習6の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(b08a001@cis.twcu.ac.jpなど)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(11月2日)を明記してください。


6.6 参考文献


[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

2011年11月2日更新
小西 善二郎 <konishi@cis.twcu.ac.jp>
Copyright (C) 2011 Zenjiro Konishi. All rights reserved.