正規化とは?

「正規化」とは、一般的には「特定のルールに基づいてデータを変形・加工すること」です。
GISの分野においても同様の意味で使われます。統計データの正規化の例を以下で紹介いたします。

統計データの正規化表現

「市の総人口に対する女性の人口の比率が最も高い市」を正規化で分かりやすく表現する

Step-1:GIS上で市区町村単位の統計情報の面データを展開したものが図①です。各市区町村の男女の人口数及び総人口をラベル表示していますが、ラベルだけでは視覚的に人口の多い地域少ない地域が判りづらいので、グラフでも表現してみます(図②)。

図①

Step-2:表現にグラフを加えることで、人口数の多い地域と少ない地域が、視覚的に判り易くなり、グラフのおかげで市ごとの総人口と男女の人口数が人目で判るようにはなりました。
図②のグラフの総人口と女性の人口数を見比べても、ある程度は判りますが、もう少し分かりやすい表現方法はないでしょうか?

図②

Step-3:解決策として「総人口に対する女性の人口の比率そのものをグラフ化」してしまうのが良いかもしれません。比率は「人口数_女」を「総人口」で割れば求まります。これは、「人口数_女」を「総人口」で正規化(図③)しているとも言えるのです。

図③

「人口数_女」を「総人口」で正規化したものをグラフで表したものが図④です。正規化の結果、最も女性の人口比率が高いのはJ市であることがわかりました。

(注)図に表示されている統計データは例として作成した架空のもので、実在の市区町村の統計情報ではありません。

図④

「世帯数の多少」を正規化を使って分かりやすく表現する

Step-1:A市からK市までの各市の世帯数の統計データをラベルで表示したものが図⑤です。ラベルだけでは視覚的表現に乏しいですので、今度は世帯数をドットで表現してみましょう。

図⑤

Step-2:1ドットを1世帯として表示したのが図⑥です。しかしドットの数が多すぎて塗り潰されてしまい、かえって分かりづらくなってしまいました。

図⑥

Step-3:1ドット=140世帯として各市の世帯数を表したのが図⑦です。世帯数の多い市と少ない市が視覚的に判別できるようになりました。

図⑦

このように、特定の規則でデータに加工を加えることで、情報を判りやすくすることも正規化の一例です。

(注)図に表示されている統計データは例として作成した架空のもので、実在の市区町村の統計情報ではありません。