分類手法とは?

データの羅列では見え難いものを視覚的にわかりやすく表示する過程で、分類エリアの範囲を定める際の手法を一般的に分類手法と呼びます。
図①をもとに、分類手法の一例を説明します。
これは、ある都市の「丁目・字界別人口総数」です。横軸が人口数、縦軸が ポリゴンの数です。ほとんどのポリゴンは1~5000人程度の人口に収まっています。

図① データの分布形

この数値を元にして、人口の"多い""少ない"を二分割で色分け表示する際に重要なのは、分類クラスの範囲(図1横軸 0~18722の範囲)と閾値(いきち)の設定(どこで区切るか)です。この設定方法によって地図の概観が大きく変わってくるからです。
分類手法では「自然分類」、「等量分類」、「等間隔分類」、「標準偏差分類」の4つが多く用いられます。
以下、これらの4分類を紹介します。

自然分類とは?

自然分類とは「データの変化量が比較的大きいところに閾値が設定される方法」です。英語では、「Natural breaks」と言われ、break pointすなわち、段差点で区切る方法です。段差が明確なデータにおいては、自然分類は視覚的に判断しやすい分類手法として広く利用されています。ただし、段差が無い"線形のデータ"には不向きです。

図② 自然分類 (クリックで拡大)

等量分類とは?

等量分類とは図③のように、「各階級に同じ数のポリゴンが含まれる分類」です。本来は、線形に分散しているデータに適しています。
各階級の図形の数によって分類されてしまうため、歪みが生じやすいのが、弱点ですが、階級数を増やすことによりその歪みを最小限におさえることができます。

図③ 等量分類

等間隔分類とは?

等間隔分類とは図④のように一目瞭然ですが、「属性値の範囲を等間隔で区切る方法」です。ここでは、他の分類手法と比較するために、人口総数という属性値を同じ数値幅で分割しています。
一般的に等間隔分類は、「総人口あたりの地区人口」などパーセンテージを色分け表示するときに利用します。
つまり、特定の属性値について、他の属性値と比較したときの総数を強調するときに利用されます。

図④ 等間隔分類

標準偏差分類とは?

標準偏差分類とは、「ある地区の人口数が、全体の平均人口数からどれだけ離れているかを示すことができる分類方法」です。 平均値から標準偏差を+-することによって、区切り位置を決定します。 右図は、他の分類方法と純粋な比較をするために、色分けを統一していますが、赤と青など2色使って、平均値の上の値(青色)と下の値(赤色)というようにすると、状況がよくわかります。

図⑤ 標準偏差分類

<補足>
この他にもポリゴンの総面積がほぼ同じになるように分類する「等面積分類」などもありますが、手法によっては、その地図の解釈に大きな影響を及ぼすため、これらの分類手法は用途によって使い分けが必要です。選択する分類手法によっては、見えてくるはずの情報を覆い隠してしまうこともあります。このような「情報の損失」を避けるためにも、それぞれの特性を理解し、使い分ける必要があります。 MarketPlanner GISやArcGISでは、図①のような、データの分布形を見ることができるため、どういった分類手法が適しているのかの判断することが出来、独自の閾値を設定することができるので、より高度な分析をすることが可能です。