[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

情報処理技法(リテラシ)II 第6回

目次
索引

統計データの重要性

今、過疎化対策のレポートを作成しているとしましょう。

例1 東北地方は過疎化している

と書きたければ、根拠が必要になります。 同じことが書いてある資料を探してもいいですが、より説得力があるのは、統計データを利用することです。

例2 令和2年国勢調査結果(総務省統計局)によると、平成27年と比較して、青森県は5.4%、岩手県は5.4%、宮城県は1.4%、秋田県は6.2%、山形県は5.0%、福島県は4.2%、それぞれ人口が減少した。

と書けば、説得力があります。 しかも、 国勢調査 は国によって行われ、日本に住んでいるすべての人を対象としているので、極めて信頼性が高いです。

公共のデータか自分で集めるか

国勢調査は、日本の人口、就業状態、世帯構造など、基本的な内容に限られます。 それら以外でも、内容によっては、中央省庁や地方自治体が統計データを公開しています。 あるいは、研究者が研究の一環として、統計データを公開している場合もあります。

ただ、内容が特殊だったり、限定的だったりすると、統計データは存在しません。 例えば、

例3 東京女子大学の学生は東京での就職を希望している

と書きたければ、(過去の卒業論文などで調べられているかもしれませんが、)自分でアンケート調査などを行って、データを集めるしかありません。

レポート作成や論文作成で統計データを利用する場合、まず、公共のデータが存在するかどうかを探します。 次に、先行研究を調べ、使えるデータがあるかどうかを確認します。 もし、どうしてもなければ、自分でデータを集めることになります。

統計データの情報源

国勢調査に限らず、国が調査した統計データの多くは、 総務省統計局 のホームページから探せます。

それでは、一般の検索エンジンで「総務省統計局」を検索するか、URLを直接入力して、総務省統計局のホームページ( https://www.stat.go.jp/ )を開いてください。 そして、「統計データ」→「分野別一覧」とクリックしてください。 すると、「国勢調査」から始まって、「家計調査」、「労働力調査」、「社会生活基本調査」、「経済センサス」といった、レポート作成や論文作成で使える、色々な統計データが利用できます。 また、『日本統計年鑑』、『日本の統計』、『世界の統計』といった、総合的な統計データも閲覧できます。

なお、東京女子大学図書館のトップページ( https://library.twcu.ac.jp/ )を開き、「資料の探し方」→「資料の探し方ナビ」→「統計資料の探し方」とクリックすると、統計資料の探し方のページ( https://library.twcu.ac.jp/found/find/statistics/ )が開きます。 そこには、総務省統計局の多くのリンクが紹介されています。

先ほどの、人口減少の統計データであれば、「国勢調査」→「調査の結果」→人口等基本集計の「結果の概要」とクリックすると、報告書「令和2年国勢調査 人口等基本集計結果 結果の概要」( https://www.stat.go.jp/data/kokusei/2020/kekka/pdf/outline_01.pdf )が表示され、そのp.7に都道府県の人口に関する統計データが載っています。

総務省統計局に限らず、日本の中央省庁は業務として統計調査を行い、統計データを公開しています。 それらの統計データは、政府統計ポータルサイト「 e-Stat 」で検索できます。

それでは、一般の検索エンジンで「e-Stat」を検索するか、URLを直接入力して、e-Statのトップページ( https://www.e-stat.go.jp/ )を開いてください。 例えば、都道府県別の大学の学生数を知りたいとしましょう。 入力欄に「都道府県 大学 2022」と入力して「検索」をクリックすると、187件のデータ(データベースが15件、ファイルが172件)見つかります。 「データセット一覧」を見ると、「統計でみる都道府県のすがた2022」や「社会生活統計指標−都道府県の指標−2022」といった報告書の、PDFファイルやExcelファイルがダウンロードできることが分かります。 この中で、「社会生活統計指標−都道府県の指標−2022/基礎データ」の「E/教育」をクリックし、Excelファイルをダウンロードすると、「大学学生数」という項目に、都道府県別の大学の学生数が載っています。

中央省庁に限らず、日本の地方自治体も色々な統計データを公開しています。 それらを探すのに、データカタログサイト「 DATA GO JP 」が役に立つかもしれません。 このサイトは、日本政府の「 オープンデータ 」への取組の一環として、開設されています。

それでは、一般の検索エンジンで「オープンデータ」を検索するか、URLを直接入力して、DATA GO JPのトップページ( https://www.data.go.jp/ )を開いてください。 右側の日本地図をクリックすると、大きな日本地図が表示され、その都道府県をクリックすると、日本地図の下に、統計データを公開している地方自治体が一覧表示されます。

統計データの形式

政府統計ポータルサイト「e-Stat」やデータカタログサイト「DATA GO JP」では、統計データをダウンロードできます。 それらのファイルの形式は、たいてい

のいずれかです。

PDFファイルの場合、統計データは、表やグラフの形で報告書の一部になっています。 そのような状態では、その統計データを他の種類のグラフで表すことや、他の統計データと組み合わせて新しい表を作ることなどが難しいです。 統計データを活用するなら、元になるExcelファイルを探してください。

CSVファイル とは、表の形のデータをコンマと改行のみで表したファイルです。 CSVファイルの拡張子は、.csvです。 CSVファイルはExcelで開けますので、ファイルのアイコンをダブルクリックしてください。

アンケート調査の考え方

公共のデータも先行研究のデータもなければ、自分でデータを集めるしかありません。 授業のレポートなら、そこまでやらなくてもいいですが、卒業論文なら、やらなくてはいけないでしょう。

ここでは、アンケート調査の例として、新聞、テレビ、インターネットのうち、どれからニュースを知るかについて、調べたいとします。

この場合は、

例4 あなたは1日に何分くらい新聞を読みますか。(数値回答)

例5 あなたは1日に何分くらいテレビのニュースを見ますか。(数値回答)

例6 あなたは1日に何分くらいインターネットのニュースを読みますか。(数値回答)

という質問を用意します。 これで、回答者は1日平均何分間新聞を読む、1日平均何分間テレビのニュースを見る、といった、分析的な結果が得られます。

もし、「新聞は年齢が高いほど読む。テレビのニュースは年齢と関係なく見る。インターネットのニュースは年齢が低いほど見る。」という結果を予測するなら、年齢を質問します。

例7 あなたは何歳ですか(1. 0〜19歳   2. 20〜39歳   3. 40〜59歳   4. 60歳以上)

そして、アンケートの回答が集まった後で、新聞を読む時間が(例えば)平均以上を積極的、平均未満を消極的と分類します。 最後に、積極的と消極的の比率が年齢層によって変わるかどうかを分析します。 テレビのニュースやインターネットのニュースについても同様です。

なお、上記の、新聞を読む時間や年齢のような数値を、 変数 とよびます。 「新聞を読む平均時間」のような、変数そのものの特徴を調べることを 記述的調査 といい、「年齢が高いほど新聞を読む」のような、変数どうしの関係性を調べることを 説明的調査 といいます。

また、上記の年齢のように、アンケート調査の前に分類することを プリ・コーディング といい、新聞を読むのが積極的、消極的のように、アンケート調査の後に分類することを アフター・コーディング といいます。

なお、アンケート調査が成立するためには、ある程度の人数の回答者が必要になります。 もし、調査対象が非常に特殊(難病患者の意識調査など)で、回答者がほとんど集められない場合は、インタビュー調査を検討してください。 インタビュー調査 とは、回答者に比較的自由に発言してもらい、それらの発言をまとめる調査です。 インタビュー調査は、深い情報が得られるかもしれませんが、偏った情報になりがちという問題もあります。

数値を回答してもらう調査(多くのアンケート調査)を 量的調査 といい、自由に記述、発言してもらう調査(多くのインタビュー調査)を 質的調査 といいます。


演習6

[統計データ検索]政府統計ポータルサイト「e-Stat」のトップページ( https://www.e-stat.go.jp/ )を開き、「時系列表」をクリックすると、国や民間が提供している主な時系列データを利用できます。 (「ダウンロード」をクリックすると、データがダウンロードされます。)

これらのデータの中から、興味があるデータを2種類探し、新規のExcelファイルにコピー・アンド・ペーストし、必要に応じでデータの加工(期間を揃える、単位を揃えるなど)をしてから、折れ線グラフで表してください。 そして、2つの折れ線グラフから読み取れることを、Excelの余白に簡単に書き込んでください。

なお、e-Statの「時系列表」に希望するデータがない場合は、他のウェブサイトで時系列データを探してもよいです。

統計データのまとめ方の例
統計データのまとめ方の例

レポート課題

今日の演習6の答案(Excelファイル)をメールで提出してください。 差出人は大学発行のメール・アドレス(学生番号@cis.twcu.ac.jp)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(10月26日)を明記してください。


参考文献


[小西ホームページ]   [目次・索引]   [前の授業]   [次の授業]

2022年10月26日更新
小西 善二郎 <konishi@cis.twcu.ac.jp>
Copyright (C) 2022 Zenjiro Konishi. All rights reserved.