[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

情報処理技法(統計解析)第6回

目次
索引

クロス集計表

クロス集計表とは

前回の授業では、2次元データを散布図にしました。 ただ、散布図にできるのは、量的データの場合です。 今日は、質的データの場合を考えます。

ここで、例として、ある小学校の5年生に対して、以下のようなアンケート調査が行われたとしましょう。

小五男女の体育の好き嫌いアンケート

問1 あなたは男女のどちらですか。

1. 男子      2. 女子

問2 あなたは体育が好きですか。

1. 好き      2. 嫌い

そして、以下のようなアンケート結果が得られたとします。

2次元の質的データの例
児童 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
男女 2 2 2 1 1 1 2 2 1 2 2 2 2 1 1
体育 2 1 1 1 1 1 1 1 1 2 1 1 1 1 2

これは、2次元の質的データです。 このようなデータは、クロス集計表というものにまとめられます。

クロス集計表 cross tabulation table )とは、変数 x (今回は男女)の項目(男子、女子)を縦に並べ、変数 y (体育)の項目(好き、嫌い)を横に並べ、項目の交わる部分に対応するデータの度数を書き込んだ表です。

クロス集計表の例
男女 体育 合計
好き 嫌い
男子 5 1 6
女子 7 2 9
合計 12 3 15

クロス集計表は、 分割表 contingency table )や クロス表 cross table )とも呼ばれます。

クロス集計表の相対度数

上記のクロス集計表から、何が読み取れるでしょうか。 体育の好きな男子が5人、女子が7人だから、女子のほうが男子より体育が好きだと言っていいでしょうか。 そもそも、アンケート調査した人数が男女で異なっているので、人数を比較するのではなく、割合を比較すべきです。 この割合、すなわち度数÷合計を、 相対度数 relative frequency )と呼びます。 クロス集計表に相対度数を追加すると、次のようになります。

相対度数(横比)を追加したクロス集計表
男女 体育 合計
好き 嫌い
男子 5
83%
1
17%
6
100%
女子 7
78%
2
22%
9
100%
合計 12
80%
3
20%
15
100%

これで、体育の好きな男子が83%、女子が78%だから、男子のほうが女子より体育が好きだと言えます。

なお、今回の相対度数は、度数を横方向の合計で割りました。 これを横比と言います。 度数を縦方向の合計で割った、縦比の相対度数も考えられます。

相対度数(縦比)を追加したクロス集計表
男女 体育 合計
好き 嫌い
男子 5
42%
1
33%
6
40%
女子 7
58%
2
67%
9
60%
合計 12
100%
3
100%
15
100%

さらに、度数を全度数で割った相対度数もあり得ます。

相対度数(全体比)を追加したクロス集計表
男女 体育 合計
好き 嫌い
男子 5
33%
1
7%
6
40%
女子 7
47%
2
13%
9
60%
合計 12
80%
3
20%
15
100%

横比、縦比、全体比のどの相対度数を使うべきかはデータによりますが、多くの場合、横比が使われます。

クロス集計表の注意点

量的な2次元データは散布図にする、質的な2次元データはクロス集計表にする、と分かりました。 では、質的データと量的データの組み合わせは、どうすればいいでしょうか。

以下のデータは、ある高校の生徒の性別と体重です。 男女(1=男子、2=女子)は質的データで、体重は量的データです。

2次元データ(質的と量的)の例
生徒 1 2 3 4 5 6 7 8 9 10
性別 2 1 1 2 1 1 1 2 2 1
体重(kg) 51.0 71.1 67.2 56.1 55.1 61.0 57.6 50.5 50.1 68.0

このような場合は、量的データを適切な階級に分ければ、クロス集計表にまとめられます。

クロス集計表(量的と質的)の例
性別 体重(kg) 合計
50〜60 60〜70 70〜80
男子 2 3 1 6
女子 4 0 0 4
合計 6 3 1 10

Excelによるクロス集計表

ピボットテーブルの作成

それでは、Excelを利用して、クロス集計表を作成しましょう。 次のExcelファイルをダウンロードしてください。

stat_06_data.xlsx
小五児童(child)の男女(gender)と体育(physical)の好き嫌い
child gender physical
1 2 2
2 2 1
3 2 1
... ... ...
15 1 2

Excelでクロス集計表を作成するには、ピボットテーブルの作成機能を利用します。

まず、リボンの「データ」をクリックし、「分析」項目で「ピボットテーブル」の三角ボタン→「手動ピボットテーブル」とクリックします。 (Windowsの場合は、リボンの「挿入」をクリックし、「テーブル」項目の「ピボットテーブル」をクリックします。) すると、「ピボットテーブルの作成」ウィンドウが開くので、「このブックのテーブルまたは範囲を使用」ラジオ・ボタンをオンにし、「場所」入力欄の右のボタンをクリックして、データの範囲(セルB2からC17まで)をドラッグします。 「既存のワークシート」ラジオ・ボタンをオンにし、「場所」入力欄の右のボタンをクリックして、余白(セルE2)をクリックします。

クロス集計表の作成(1)
クロス集計表の作成(1)

すると、「ピボットテーブルビルダー」ウィンドウ(Windowsの場合は「ピボットテーブルのフィールドリスト」ウィンドウ)が開くので、「gender」を「行ラベル」にドラッグ・アンド・ドロップし、「physical」を「列ラベル」にドラッグ・アンド・ドロップし、「gender」を「値」にドラッグ・アンド・ドロップします。

クロス集計表の作成(2)
クロス集計表の作成(2)

すると、ピボットテーブルが作成されます。

クロス集計表の作成(3)
クロス集計表の作成(3)

ただし、この表はデータの個数を数えているのではなく、データの合計をしています。 これを切り替えるために、表の左上(セルE2)を右クリックして「フィールドの設定」をクリックします。

「集計の方法」の「データの個数」をクリックして、「OK」ボタンをクリックします。

クロス集計表の作成(4)
クロス集計表の作成(4)

すると、データの個数を数えた表に切り替わります。

クロス集計表の作成(5)
クロス集計表の作成(5)

相対度数の計算

次に、このピボットテーブルをコピー・アンド・ペーストして、クロス集計表らしく直しましょう。 ただし、ピボットテーブル全体をドラッグしてから右クリックしても、「コピー」が選べないので、メニューバーで「編集」→「コピー」とクリックします。 あとは、ペースト先(例えばセルJ2)を右クリックし、「形式を選択してペースト」をクリックし、「値」をクリックします。

クロス集計表の作成(6)
クロス集計表の作成(6)

不要な文字を消し、「1」を「男子」、「2」を「女子」などと書き換えます。 最後に、読みやすくするために罫線を引きます。 これで、クロス集計表が完成します。

クロス集計表(1)
クロス集計表(1)

相対度数を追加したクロス集計表も作成しましょう。 相対度数は横比で計算することにします。

まず、クロス集計表を余白(例えばセルO2)にコピー・アンド・ペーストします。 ペーストは、値のみにしてください。

クロス集計表の作成(7)
クロス集計表の作成(7)

表を1行おきにするために、空けたい範囲(セルO5からR5まで)をドラッグし、右クリックして「挿入」をクリックします。

「下方向にシフト」をクリックして、「OK」ボタンをクリックします。

クロス集計表の作成(8)
クロス集計表の作成(8)

これを繰り返して、表を1行おきにします。

クロス集計表の作成(9)
クロス集計表の作成(9)

セルP5に数式=P4/$R4を入力し、セルの表示形式をパーセンテージにします。 このセルを1行おきにコピー・アンド・ペーストすると、すべての相対度数が計算されます。

クロス集計表の作成(10)
クロス集計表の作成(10)

罫線を引いて読みやすくすれば、完成です。

クロス集計表(2)
クロス集計表(2)

Excelによる3次元棒グラフ

クロス集計表を分かりやすくするために、グラフ化してみましょう。 ここでは、3次元の棒グラフを作成します。

まず、クロス集計表のラベルとデータの範囲(セルJ3からL5まで)をドラッグします。 そして、リボンの「グラフ」(Windowsの場合は「挿入」)をクリックし、「グラフの挿入」項目の「縦棒」をクリックし、「3-D縦棒」項目の「3-D縦棒」をクリックします。 すると、3次元の棒グラフが表示されます。

3次元棒グラフの作成(1)
3次元棒グラフの作成(1)

リボンの「グラフ レイアウト」をクリックし、「ラベル」項目で「グラフ タイトル」→「タイトルをグラフの上に表示」とクリックし、グラフ・タイトルを「小五児童の男女と体育の好き嫌い」に変更します。 また、右側の凡例をクリックし、deleteキーで削除します。

3次元棒グラフの作成(2)
3次元棒グラフの作成(2)

同じく、「ラベル」項目で「軸ラベル」→「横軸ラベル」→「軸ラベルを軸の下に配置」とクリックし、横軸ラベルを「体育」に変更します。 「軸ラベル」→「縦軸ラベル」→「軸ラベルを垂直に配置」とクリックし、縦軸ラベルを「人数(人)」に変更します。 「軸ラベル」→「奥行き軸ラベル」→「軸ラベルを水平に配置」とクリックし、奥行き軸ラベルを「男女」に変更します。 これで、3次元の棒グラフが完成します。

3次元棒グラフ(1)
3次元棒グラフ(1)

Rコマンダーによるクロス集計表

「Rコマンダー」でも、クロス集計表が作成できます。 あらかじめ「Rコマンダー」を起動して、Excelシートのデータの範囲(セルB2からC17まで)をインポートしておいてください。 念のため、「Rコマンダー」ウィンドウの「データセットを表示」ボタンをクリックして、インポートしたデータを確認します。

クロス集計表の作成(1)
クロス集計表の作成(1)

まず、男女のデータと、体育の好き嫌いのデータを、質的データに変換します。

「Rコマンダー」ウィンドウで、「データ」→「アクティブデータセット内の変数の管理」→「数値変数を因子に変換」とクリックします。 すると、「数値変数を因子に変換」ウィンドウが開くので、「変数」項目で「gender」をクリックし、「水準名を指定」ラジオ・ボタンをオンにし、「新しい変数名...」入力欄に「gender2」と入力して、「OK」ボタンをクリックします。

クロス集計表の作成(2)
クロス集計表の作成(2)

すると、「水準名」ウィンドウが開くので、「1」入力欄に「boy」、「2」入力欄に「girl」と入力して、「OK」ボタンをクリックします。

クロス集計表の作成(3)
クロス集計表の作成(3)

同様に、「Rコマンダー」ウィンドウで「データ」→「アクティブデータセット内の変数の管理」→「数値変数を因子に変換」とクリックし、「数値変数を因子に変換」ウィンドウの「変数」項目で「physical」をクリックし、「水準名を指定」ラジオ・ボタンをオンにし、「新しい変数名...」入力欄に「physical2」と入力して、「OK」ボタンをクリックします。

クロス集計表の作成(4)
クロス集計表の作成(4)

「水準名」ウィンドウの「1」入力欄に「like」、「2」入力欄に「dislike」と入力して、「OK」ボタンをクリックします。

クロス集計表の作成(5)
クロス集計表の作成(5)

念のため、「データセットを表示」ボタンをクリックして、データを確認します。

クロス集計表の作成(6)
クロス集計表の作成(6)

質的データに変換できたので、「Rコマンダー」ウィンドウで、「統計量」→「分割表」→「2元表」とクリックします。 すると、「2元表」ウィンドウが開くので、「行の変数」項目で「gender2」をクリックし、「列の変数」項目で「physical2」をクリックし、「行のパーセント」ラジオ・ボタンをオンにし、「独立性のカイ2乗検定」チェックボックスをオフにして、「OK」ボタンをクリックします。

クロス集計表の作成(7)
クロス集計表の作成(7)

すると、クロス集計表とその相対度数が表示されます。

クロス集計表(1)
クロス集計表(1)

演習6

ある小学校で、2年生と5年生の合計75人の児童に対して、以下のアンケートを実施したとします。

小学生の学習塾への通学アンケート

問1 あなたの学年を教えてください。

(    )年生

問2 あなたは学習塾に通っていますか。

1. 通っている      2. 通っていない

このアンケートの結果をまとめたExcelファイルをダウンロードしてください。

stat_06_report.xlsx
小学校児童(child)の学年(year)と学習塾(school)への通学
child year school
1 5 2
2 2 1
3 2 2
... ... ...
75 5 1

(1)このデータのクロス集計表を作成してください。

クロス集計表(3)
クロス集計表(3)

(2)相対度数を追加したクロス集計表も作成してください。 相対度数は横比で計算してください。

クロス集計表(4)
クロス集計表(4)

(3)このクロス集計表を3次元の棒グラフにしてください。

3次元棒グラフ(2)
3次元棒グラフ(2)

レポート課題

今日の演習6の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(k12x1001@cis.twcu.ac.jpなど)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(11月5日)を明記してください。


参考文献


[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

2014年11月5日更新
小西 善二郎 <konishi@cis.twcu.ac.jp>
Copyright (C) 2014 Zenjiro Konishi. All rights reserved.