前回の授業では、2次元データを散布図にしました。 ただ、散布図にできるのは、量的データの場合です。 今日は、質的データの場合を考えます。
ここで、例として、ある小学校の5年生に対して、以下のようなアンケート調査が行われたとしましょう。
小五男女の体育の好き嫌いアンケート
問1 あなたは男女のどちらですか。
1. 男子 2. 女子
問2 あなたは体育が好きですか。
1. 好き 2. 嫌い
そして、以下のようなアンケート結果が得られたとします。
児童 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
男女 | 2 | 2 | 2 | 1 | 1 | 1 | 2 | 2 | 1 | 2 | 2 | 2 | 2 | 1 | 1 |
体育 | 2 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 1 | 2 | 1 | 1 | 1 | 1 | 2 |
これは、2次元の質的データです。 このようなデータは、クロス集計表というものにまとめられます。
クロス集計表 とは、変数 x (今回は男女)の項目(男子、女子)を縦に並べ、変数 y (体育)の項目(好き、嫌い)を横に並べ、項目の交わる部分に対応するデータの度数を書き込んだ表です。
体育 | 合計 | ||
---|---|---|---|
好き | 嫌い | ||
男子 | 5 | 1 | 6 |
女子 | 7 | 2 | 9 |
合計 | 12 | 3 | 15 |
クロス集計表は、 分割表 や クロス表 とも呼ばれます。
上記のクロス集計表から、何が読み取れるでしょうか。 体育の好きな男子が5人、女子が7人だから、男子より女子のほうが体育が好きだと言っていいでしょうか。 そもそも、アンケート調査した人数が男女で異なっているので、人数を比較するのではなく、割合を比較すべきです。 この割合、すなわち度数÷合計を、 相対度数 と呼びます。 クロス集計表に相対度数を追加すると、次のようになります。
体育 | 合計 | ||
---|---|---|---|
好き | 嫌い | ||
男子 | 5 83% |
1 17% |
6 100% |
女子 | 7 78% |
2 22% |
9 100% |
合計 | 12 80% |
3 20% |
15 100% |
これで、体育の好きな男子が83%、女子が78%だから、女子より男子のほうが体育が好きだと言えます。
なお、今回の相対度数は、度数を横方向の合計で割りました。 これを横比と言います。 度数を縦方向の合計で割った、縦比の相対度数も考えられます。
体育 | 合計 | ||
---|---|---|---|
好き | 嫌い | ||
男子 | 5 42% |
1 33% |
6 40% |
女子 | 7 58% |
2 67% |
9 60% |
合計 | 12 100% |
3 100% |
15 100% |
さらに、度数を全度数で割った相対度数もあり得ます。
体育 | 合計 | ||
---|---|---|---|
好き | 嫌い | ||
男子 | 5 33% |
1 7% |
6 40% |
女子 | 7 47% |
2 13% |
9 60% |
合計 | 12 80% |
3 20% |
15 100% |
横比、縦比、全体比のどの相対度数を使うべきかはデータによりますが、多くの場合、横比が使われます。
量的な2次元データは散布図にする、質的な2次元データはクロス集計表にする、と分かりました。 では、質的データと量的データの組み合わせは、どうすればいいでしょうか。
以下のデータは、ある高校の生徒の性別と体重です。 男女(1=男子、2=女子)は質的データで、体重は量的データです。
生徒 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|---|---|---|---|---|---|---|---|---|---|
性別 | 2 | 1 | 1 | 2 | 1 | 1 | 1 | 2 | 2 | 1 |
体重(kg) | 51.0 | 71.1 | 67.2 | 56.1 | 55.1 | 61.0 | 57.6 | 50.5 | 50.1 | 68.0 |
このような場合は、量的データを適切な階級に分ければ、クロス集計表にまとめられます。
体重 | 合計 | |||
---|---|---|---|---|
50〜60 | 60〜70 | 70〜80 | ||
男子 | 2 | 3 | 1 | 6 |
女子 | 4 | 0 | 0 | 4 |
合計 | 6 | 3 | 1 | 10 |
それでは、Excelを利用して、クロス集計表を作成しましょう。 次のExcelファイルをダウンロードしてください。
児童 | 男女 | 体育 |
---|---|---|
1 | 2 | 2 |
2 | 2 | 1 |
3 | 2 | 1 |
... | ... | ... |
15 | 1 | 2 |
Excelでクロス集計表を作成するには、ピボットテーブルの作成機能を利用します。
まず、メニューバーで「データ」→「ピボットテーブルレポート」とクリックします。 すると、ピボットテーブルウィザードが開きます。
「Excelのリスト/データベース」をクリックして、「次へ」ボタンをクリックします。
データの範囲として、セルB1からC16まで($B$1:$C$16)と入力し、「次へ」ボタンをクリックします。
ピボットテーブルの作成先として、「既存のワークシート」をクリックし、余白(例えば$E$1)を入力し、「レイアウト」ボタンをクリックします。
「行」領域に「男女」をドラッグ・アンド・ドロップします。 「列」領域に「体育」をドラッグ・アンド・ドロップします。 「データ」領域「男女」をドラッグ・アンド・ドロップします。 これでピボットテーブルのレイアウトが決まるので、「OK」ボタンをクリックします。
最後に、「完了」ボタンをクリックします。
すると、ピボットテーブルが作成されます。
ただし、この表はデータの個数を数えているのではなく、データの合計をしています。 これを切り替えるために、表の左上(セルE1)を右クリックして「フィールドの設定」をクリックします。
「集計の方法」の「データの個数」をクリックして、「OK」ボタンをクリックします。
すると、データの個数を数えた表に切り替わります。
次に、このピボットテーブルをコピー・アンド・ペーストして、クロス集計表らしく直しましょう。 ただし、ピボットテーブル全体のドラッグがうまくいかないので、表の左上(セルE1)を右クリックして、「選択」→「テーブル全体」とクリックします。 そして、メニューバーで「編集」→「コピー」とクリックします。 あとは、ペースト先(例えばセルJ1)を右クリックし、「形式を選択してペースト」をクリックし、「値」をクリックします。
不要な文字を消し、「1」を「男子」、「2」を「女子」などと書き換えます。 最後に、読みやすくするために罫線を引きます。 これで、クロス集計表が完成します。
相対度数を追加したクロス集計表も作成しましょう。 相対度数は横比で計算することにします。
まず、クロス集計表を余白(例えばセルO1)にコピー・アンド・ペーストします。 ペーストは、値のみにしてください。
表を1行おきにするために、空けたい範囲(セルO4からR4まで)をドラッグし、右クリックして「挿入」をクリックします。
「下方向にシフト」をクリックして、「OK」ボタンをクリックします。
これを繰り返して、表を1行おきにします。
セルP4に数式=P3/$R3を入力し、セルの表示形式をパーセンテージにします。 このセルを1行おきにコピー・アンド・ペーストすると、すべての相対度数が計算されます。
罫線を引いて読みやすくすれば、完成です。
クロス集計表を分かりやすくするために、グラフ化してみましょう。 ここでは、3次元の棒グラフを作成します。
クロス集計表のラベルとデータの範囲(セルJ2からL4まで)をドラッグし、メニューバーで「挿入」→「グラフ」とクリックして、グラフウィザードを開きます。
「グラフの種類」は「縦棒」、「形式」は「3-D縦棒グラフ」をクリックし、「次へ」ボタンをクリックします。
「系列」を「列」に変更して、「次へ」ボタンをクリックします。
「グラフタイトル」に「小五男女の体育の好き嫌い」と入力し、「Y/系列軸」に「体育」と入力し、「Z/数値軸」に「人数(人)」と入力します。
同じウィンドウで「凡例」タブをクリックし、「凡例を表示する」のチェックを外して、「次へ」ボタンをクリックします。
「グラフの場所」が「オブジェクト」であることを確認して、「完了」ボタンをクリックします。
すると、3次元の棒グラフが完成します。
ある小学校で、2年生と5年生の合計75人の児童に対して、以下のアンケートを実施したとします。
小学生の学習塾への通学アンケート
問1 あなたの学年を教えてください。
( )年生
問2 あなたは学習塾に通っていますか。
1. 通っている 2. 通っていない
このアンケートの結果をまとめたExcelファイルをダウンロードしてください。
児童 | 学年 | 学習塾 |
---|---|---|
1 | 5 | 2 |
2 | 2 | 1 |
3 | 2 | 2 |
... | ... | ... |
75 | 5 | 1 |
(1)このデータのクロス集計表を作成してください。
(2)相対度数を追加したクロス集計表も作成してください。 相対度数は横比で計算してください。
(3)このクロス集計表を3次元の棒グラフにしてください。
今日の演習6の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(b08a001@cis.twcu.ac.jpなど)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(11月2日)を明記してください。