レポート作成や論文作成では、統計データが重要です。 ただし、うまく統計データが見つかっても、そのまま使えるわけではありません。 文字の置き換え、数値の並べ替え、合計や平均の計算といった、「データ加工」とよばれる作業が必要になります。
ここで、過疎化対策に興味があるとします。 具体的にどこが過疎化しているかを知るために、都道府県の人口データと面積データを入手し、人口密度と人口増減率を計算し、それらを分かりやすくまとめてみます。
一般的な統計データの探し方は、回を改めて説明します。 今回は、総務省統計局の「社会生活統計指標−都道府県の指標−2019」を利用します。
を開き、「II 基礎データ」の右の「e-Stat」アイコンをクリックすると、ダウンロードできるExcelファイルの一覧が表示されます。 「人口・世帯」の「EXCEL」アイコンをクリックすると、Excelファイルがダウンロードされます。 「自然環境」の「EXCEL」アイコンをクリックすると、もう1つExcelファイルがダウンロードされます。
都道府県の人口データは、「人口・世帯」のExcelファイルの「総人口」の部分を使います。 2010年、2015年、2017年の3年分のデータがありますが、2017年は推計なので使いません。 都道府県の面積データは、「自然環境」のExcelファイルの「総面積[北方地域及び竹島を除く]」の部分を使います。 2010年、2015年、2017年の3年分のデータがありますが、2015年の人口に対しては2015年の面積を使います。
一般的に、ダウンロードしたExcelファイルを直接いじると、うまくいきません。 作り込まれた表ほど、セルの書式やセルの結合が多用されて、思ったようには直せないものです。 それよりは、新しくExcelファイルを開き、そこに必要なデータをコピー・アンド・ペーストしたほうが、うまくいきます。 そのとき、「形式を選択して貼り付け」を選んで、余計な書式情報を取り除いたほうがよいです。
それでは、ファイル→新規、とクリックして、新しくExcelファイルを開いてください。 セルA1に「都道府県の人口密度」と入力し、セルA2からF2に、「都道府県」、「人口(2015年)」、「面積(2015年)」、「人口密度」、「順位」、「5段階評価」と入力します。
「人口・世帯」のExcelファイルの「北海道」から「沖縄県」までをドラッグし、右クリックして「コピー」をクリックし、新しいExcelファイルのセルA3を右クリックして、「形式を選択して貼り付け」をクリックしてください。 「形式を選択して貼り付け」ウィンドウが開くので、「値」ラジオボタンをクリックし、OKボタンをクリックします。
これで、余計な書式情報が取り除かれ、文字データのみが貼り付けられます。
次に、人口データをコピー・アンド・ペーストします。 「人口・世帯」のExcelファイルの「総人口」の2015年のデータ(一番上は全国なので注意)をドラッグし、右クリックして「コピー」をクリックし、新しいExcelファイルのセルB3を右クリックして、「形式を選択して貼り付け」をクリックしてください。 「形式を選択して貼り付け」ウィンドウが開くので、「値」ラジオボタンをクリックし、OKボタンをクリックします。 これで、余計な書式情報が取り除かれ、数値データのみが貼り付けられます。
貼り付けられた数値には、3桁ごとのコンマがないので、書式を設定します。 セルB3からセルB49までドラッグし、右クリックして「セルの書式設定」をクリックしてください。 「セルの書式設定」ウィンドウが開くので、「表示形式」タブをクリックし、「数値」をクリックし、「小数点以下の桁数」を0にし、「桁区切り(,)を使用する」をオンにして、OKボタンをクリックしてください。
すると、3桁ごとのコンマが表示されます。
同じようにして、面積データをコピー・アンド・ペーストします。 「自然環境」のExcelファイルの「総面積[北方地域及び竹島を除く]」の2015年のデータ(一番上は全国なので注意)をドラッグし、右クリックして「コピー」をクリックし、新しいExcelファイルのセルC3を右クリックして、「形式を選択して貼り付け」をクリックしてください。 「形式を選択して貼り付け」ウィンドウが開くので、「値」ラジオボタンをクリックし、OKボタンをクリックします。 これで、余計な書式情報が取り除かれ、数値データのみが貼り付けられます。
貼り付けられた数値には、3桁ごとのコンマがないので、書式を設定します。 セルC3からセルC49までドラッグし、右クリックして「セルの書式設定」をクリックしてください。 「セルの書式設定」ウィンドウが開くので、「表示形式」タブをクリックし、「数値」をクリックし、「小数点以下の桁数」を0にし、「桁区切り(,)を使用する」をオンにして、OKボタンをクリックしてください。 すると、3桁ごとのコンマが表示され、小数点以下が表示されなくなります。
次に、人口密度を計算します。 人口密度は「人口÷面積」で求められます。 Excelは、セルに数式を入力すると、その数式を計算してくれますが、掛け算は「*」割り算は「/」を使います。 では、セルD3に「=B3/C3」と入力してください。 これで、北海道の人口密度、すなわち1平方キロメートルあたりの人口が求められます。
セルD3をクリックし、右下のフィルハンドルを下にドラッグすると、数式がコピーされます。 これで、他の都道府県の人口密度も求められます。
計算結果には、3桁ごとのコンマがないので、書式を設定します。 セルD3からセルD49までドラッグし、右クリックして「セルの書式設定」をクリックしてください。 「セルの書式設定」ウィンドウが開くので、「表示形式」タブをクリックし、「数値」をクリックし、「小数点以下の桁数」を0にし、「桁区切り(,)を使用する」をオンにして、OKボタンをクリックしてください。 すると、3桁ごとのコンマが表示され、小数点以下が表示されなくなります。
都道府県の人口密度が計算できましたが、47個の数値を眺めても、東京や大阪は人口密度か高い、北海道や岩手は人口密度が低い、くらいしか理解できません。 データを理解しやすくする1つの方法は、順位付けをすることです。
ExcelにはRANKという関数があり、これで順位付けができます。 使い方は、
で、「参照」の範囲の中で「数値」が何位かを求めてくれます。 「順序」を0にすると大きい順、1にすると小さい順になります。 「参照」の範囲は、普通は絶対参照にします。
それでは、セルE3に
と入力してください。 絶対参照のドルマークは、範囲指定をしてからF4キーを押すと付きます。 47と表示されれば、北海道の人口密度は47位ということです。
セルE3をクリックし、右下のフィルハンドルを下にドラッグすると、数式がコピーされます。 これで、他の都道府県の順位も求められます。 人口密度そのものより、順位を見るほうが、理解しやすくなります。
順位付けの他に、データを理解しやすくする方法は、5段階評価をすることです。 5という数字に特別な意味はありませんが、人口密度の場合は、「低い」、「やや低い」、「普通」、「高い」、「やや高い」、となります。 ここで問題になるのが、区切りの値です。 これは、最小値、中間値、最大値を参考にして、分かりやすく区切ります。 ここで中間値とは、47個のデータの場合は24位のデータです。 また、区切りの幅は必ずしも等間隔とは限りません。 何倍、何倍という区切りもあり得ます。
この場合は、最小値(47位)が69、中間値(24位)が270、最大値(1位)が6,169なので、以下のように区切ってみます。 およそ3倍、3倍という区切りです。
区切り | 評価 |
---|---|
30以上100未満 | 低い |
100以上300未満 | やや低い |
300以上1000未満 | 普通 |
1000以上3000未満 | やや高い |
3000以上10000未満 | 高い |
セルH2に「区切り」、セルJ2に「評価」と入力します。 そして、セルH3より下に、区切りの数値を入力します。 セルI3より下に、「以上」を繰り返し入力します。 セルJ3より下に、評価の文字列を入力します。
ExcelにはVLOOKUPという関数があり、これで区切りと評価の表から、数値の評価を探すことができます。 使い方は、
で、「検索値」を「範囲」の1列目から探し、見つかればその範囲の「列番号」の値を返します。 「検索方法」を0にすると、見つからなかったらエラーです。 「検索方法」を1にすると、見つからなかったら、それ未満の最も近い区切り値を探します。 ただし、数値は小さい順に並んでいる必要があります。 「範囲」は、普通は絶対参照にします。
それでは、セルF3に
と入力してください。 「低い」と表示されれば、北海道の人口密度は低いということです。
セルF3をクリックし、右下のフィルハンドルを下にドラッグすると、数式がコピーされます。 これで、他の都道府県の評価も求められます。 順位と同様に、評価を見るほうが、理解しやすいです。
人口密度の次は、人口増減率です。 まず、セルL1に「都道府県の人口増減率」と入力し、セルL2からQ2に、「都道府県」、「人口(2010年)」、「人口(2015年)」、「人口増減率」、「順位」、「5段階評価」と入力します。 人口密度のときと同じように、セルL3から下に都道府県名を貼り付け、セルM3から下に2010年の人口データを貼り付け、セルN3から下に2015年の人口データを貼り付けます。
次に、人口増減率を計算します。 人口増減率は「(2015年の人口−2010年の人口)÷2010年の人口」で求められます。 セルO3に「=(N3-M3)/M3」と入力してください。 これで、北海道の人口増減率、すなわち5年間で人口がどのくらい増えたかが求められます。
セルO3をクリックし、右下のフィルハンドルを下にドラッグして、他の都道府県の人口増減率も求めます。 人口増減率の書式設定は、パーセンテージの小数点以下2桁にします。 「セルの書式設定」ウィンドウで、「表示形式」タブをクリックし、「パーセンテージ」をクリックし、「小数点以下の桁数」を2にして、OKボタンをクリックしてください。
すると、パーセンテージの小数点以下2桁になります。
順位付けも、人口密度のときと同じようにします。
5段階評価をするために、区切りの値を考えます。 最小値(47位)が−5.79%、中間値(24位)が−2.26%、最大値(1位)が2.93%なので、以下のように区切ってみます。 この場合は、パーセンテージの2ポイント間隔です。
区切り | 評価 |
---|---|
−7%以上−5%未満 | とても減少 |
−5%以上−3%未満 | 減少 |
−3%以上−1%未満 | やや減少 |
−1%以上1%未満 | 変わらない |
1%以上3%未満 | やや増加 |
セルS2からセルU7の範囲に、区切りと評価の表を入力します。
そして、人口密度のときと同じように、5段階評価をします。
[データ加工]今回利用した、総務省統計局の「社会生活統計指標−都道府県の指標−2019」
には、他にも都道府県のデータが載っています。
そこで、以下の例を参考にして、各自、興味があるデータをダウンロードし、必要に応じて数式で計算をして、都道府県に順位付けをしてください。 また、分かりやすい区切りを考え、都道府県を5段階評価してください。 分かりやすい区切りにできなければ、5段階評価にこだわらず、4段階評価や6段階評価でも構いません。
順位付けと5段階評価の表は、2種類作成してください。
今日の演習2の答案(Excelファイル)をメールで提出してください。 差出人は学内のメール・アドレス(学生番号@cis.twcu.ac.jp)とし、宛先はkonishi@cis.twcu.ac.jpとします。 メールの本文には、学生番号、氏名、科目名、授業日(10月2日)を明記してください。