[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

情報処理技法(リテラシ)II 第3回

目次
索引

統計データの重要性

今、過疎化対策のレポートを作成しているとしましょう。

例1 東北地方は過疎化している

と書きたければ、根拠が必要になります。 同じことが書いてある資料を探してもいいですが、より説得力があるのは、統計データを利用することです。

例2 平成27年国勢調査結果(総務省統計局)によると、平成22年と比較して、青森県は4.7%、岩手県は3.8%、宮城県は0.6%、秋田県は5.8%、山形県は3.9%、福島県は5.7%、それぞれ人口が減少した。

と書けば、説得力があります。 しかも、国勢調査は国によって行われ、日本に住んでいるすべての人を対象としているので、極めて信頼性が高いです。

公共のデータか自分で集めるか

国勢調査は、日本の人口、就業状態、世帯構造など、基本的な内容に限られます。 それら以外でも、内容によっては、中央省庁や地方自治体が統計データを公開しています。 あるいは、研究者が研究の一環として、統計データを公開している場合もあります。

ただ、内容が特殊だったり、限定的だったりすると、統計データは存在しません。 例えば、

例3 東京女子大学の学生は東京での就職を希望している

と書きたければ、(過去の卒業論文などで調べられているかもしれませんが、)自分でアンケート調査などを行って、データを集めるしかありません。

レポート作成や論文作成で統計データを利用する場合、まず、公共のデータが存在するかどうかを探します。 次に、先行研究を調べ、使えるデータがあるかどうかを確認します。 もし、どうしてもなければ、自分でデータを集めることになります。

統計データの情報源

国勢調査に限らず、国が調査した統計データの多くは、総務省統計局のホームページから探せます。

それでは、一般の検索エンジンで「総務省統計局」を検索するか、URLを直接入力して、総務省統計局のホームページ( http://www.stat.go.jp/ )を開いてください。 そして、「統計データ」→「分野別一覧」とクリックしてください。 すると、「国勢調査」から始まって、「家計調査」、「労働力調査」、「社会生活基本調査」、「経済センサス」といった、レポート作成や論文作成で使える、色々な統計データが利用できます。 また、『日本統計年鑑』、『日本の統計』、『世界の統計』といった、総合的な統計データも閲覧できます。

なお、東京女子大学図書館のトップページ( http://library.twcu.ac.jp/ )を開き、「資料の探し方」→「資料の探し方ナビ」とクリックすると、資料の探し方ナビのページ( http://library.twcu.ac.jp/found/find/ )が開きます。 そこの「統計資料の探し方」には、総務省統計局の多くのリンクが紹介されています。

先ほどの、人口減少の統計データであれば、「国勢調査」→左側の「調査の結果」→人口等基本集計結果の「概要(第1部 結果の解説)」とクリックすると、報告書「平成27年国勢調査 人口等基本集計結果 結果の概要」( http://www.stat.go.jp/data/kokusei/2015/kekka/kihon1/pdf/gaiyou1.pdf )が表示され、そのp.9に都道府県の人口に関する統計データが載っています。

総務省統計局に限らず、日本の中央省庁は業務として統計調査を行い、統計データを公開しています。 それらの統計データは、政府統計ポータルサイト「e-Stat」で検索できます。

それでは、一般の検索エンジンで「e-Stat」を検索するか、URLを直接入力して、e-Statのトップページ( https://www.e-stat.go.jp/ )を開いてください。 例えば、都道府県別の大学の学生数を知りたいとしましょう。 入力欄に「都道府県 大学 学生数 2018」と入力して「検索」をクリックすると、「データベースから探す」が0件、「ファイルから探す」が13件見つかります。 「ファイルから探す」をクリックして13件の一覧表示を見ると、「統計でみる都道府県のすがた2018」や「社会生活統計指標−都道府県の指標−2018」といった報告書の、PDFファイルやExcelファイルがダウンロードできることが分かります。 この中で、「社会生活統計指標−都道府県の指標−2018/基礎データ」のExcelファイルをダウンロードすると、「大学学生数」という項目に、都道府県別の大学の学生数が載っています。

中央省庁に限らず、日本の地方自治体も色々な統計データを公開しています。 それらを探すのに、データカタログサイト「DATA GO JP」が役に立つかもしれません。 このサイトは、日本政府の「オープンデータ」への取組の一環として、開設されています。

それでは、一般の検索エンジンで「オープンデータ」を検索するか、URLを直接入力して、DATA GO JPのトップページ( http://www.data.go.jp/ )を開いてください。 右側の日本地図をクリックすると、大きな日本地図が表示され、その都道府県をクリックすると、日本地図の下に、統計データを公開している地方自治体が一覧表示されます。

統計データの形式

政府統計ポータルサイト「e-Stat」やデータカタログサイト「DATA GO JP」では、統計データをダウンロードできます。 それらのファイルの形式は、たいてい

のいずれかです。

PDFファイルの場合、統計データは、表やグラフの形で報告書の一部になっています。 そのような状態では、その統計データを他の種類のグラフで表すことや、他の統計データと組み合わせて新しい表を作ることなどが難しいです。 統計データを活用するなら、元になるExcelファイルを探してください。

CSVファイルとは、表の形のデータをコンマと改行のみで表したファイルです。 CSVファイルの拡張子は、.csvです。 CSVファイルはExcelで開けますので、ファイルのアイコンをダブルクリックしてください。

アンケート調査の考え方

公共のデータも先行研究のデータもなければ、自分でデータを集めるしかありません。 授業のレポートなら、そこまでやらなくてもいいですが、卒業論文なら、やらなくてはいけないでしょう。

ここでは、アンケート調査について、

の第10章「根拠を挙げる」の内容を紹介します。 なお、この本は、複数の大学教授によって、レポートや論文の書き方について書かれたものです。

文献[1]では、アンケート調査の例として、「余暇活動に対する意識調査」を取り上げています。

文献[1]のp.55では、「アンケート調査をすれば、自分の欲しい情報が集まる」とは考えるな、と注意しています。 つまり、

例4 あなたは余暇活動について、どのように考えていますか。(自由回答)

のような質問では、何も情報が集まらないということです。 なぜなら、この質問は質問者の意図が見えてこないので、回答者はどう答えたらよいか分からないからです。

ではどうするかというと、分析的な結論を予測して、それを確かめるためにアンケート調査を行う、と考えるのです。

まず、余暇活動の具体例を考えます。 映画を観るとか旅行に行くなどが思いつきます。 そこで、

例5 あなたは年に何本くらい映画を観ますか。(数値回答)

例6 あなたは年に何回くらい旅行に行きますか。(数値回答)

という質問を用意します。 これで、回答者は年平均何本映画を観る、年平均何回旅行に行く、といった、分析的な結果が得られます。

もし、「映画は年齢と関係なく観るが、旅行は年齢が高いほど積極的に行く。」という結果を予測するなら、年齢を質問します。

例7 あなたは何歳ですか(1. 0〜19歳   2. 20〜39歳   3. 40〜59歳   4. 60歳以上)

そして、アンケートの回答が集まった後で、映画を観る本数が(例えば)平均以上を積極的、平均未満を消極的と分類します。 最後に、積極的と消極的の比率が年齢層によって変わるかどうかを分析します。 旅行についても同様です。

なお、上記の、映画を観る本数、旅行に行く回数、年齢のような数値を、変数とよびます。 「映画を観る年平均本数」のような、変数そのものの特徴を調べることを記述的調査といい、「年齢が高いほど旅行に行く」のような、変数どうしの関係性を調べることを説明的調査といいます。

また、上記の年齢のように、アンケート調査の前に分類することをプリ・コーディングといい、映画を観るのが積極的、消極的のように、アンケート調査の後に分類することをアフター・コーディングといいます。

なお、アンケート調査が成立するためには、ある程度の人数の回答者が必要になります。 もし、調査対象が非常に特殊(難病患者の意識調査など)で、回答者がほとんど集められない場合は、インタビュー調査を検討してください。 インタビュー調査とは、回答者に比較的自由に発言してもらい、それらの発言をまとめる調査です。 インタビュー調査は、深い情報が得られるかもしれませんが、偏った情報になりがちという問題もあります。

数値を回答してもらう調査(多くのアンケート調査)を量的調査といい、自由に記述、発言してもらう調査(多くのインタビュー調査)を質的調査といいます。


演習3

[統計データ加工]まず、「最も文化的な都道府県は」、「最も働きやすい都道府県は」、「最も安全な都道府県は」のような、都道府県を比較するテーマを考えてください。 そして、そのテーマに関係する、都道府県別の統計データ(できるだけ順位を付ける)を3種類以上探してください。 最後に、それらの統計データを1つのExcelファイルにまとめてください。 総合1位の都道府県を決定してもいいですし、どの都道府県もあまり変わらないという結論でも構いません。

統計データのまとめ方の例
統計データのまとめ方の例

ヒント: 総務省統計局のホームページから「統計データ」→「分野別一覧」とクリックし、下の方にある「統計でみる都道府県のすがた」をクリックすると、『統計でみる都道府県のすがた』のホームページ( http://www.stat.go.jp/data/k-sugata/ )が開きます。 「統計でみる都道府県のすがた 2018」をクリックし、「I 社会生活統計指標」をクリックすると、PDFファイルとExcelファイルが一覧表示されます。 これらのExcelファイルには、色々な統計項目について、都道府県別の統計データと順位が載っています。 どの統計項目がどのExcelファイルにあるかは、PDFファイルのp.108以降で説明されています。


レポート課題

今日の演習3の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(学生番号@cis.twcu.ac.jp)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(10月10日)を明記してください。


参考文献


[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

2018年10月10日更新
小西 善二郎 <konishi@cis.twcu.ac.jp>
Copyright (C) 2018 Zenjiro Konishi. All rights reserved.