ジオコーディングとは、住所、地名、目標物、郵便番号などが示す場所に対して座標を付与することです。具体的な例で説明すると、ユーザーが検索したい住所を入力すると実際に地図上でその場所に移動したり、あるいは住所の一覧からポイントデータを作成したりする機能のことを指します。場所が地点(例:市役所、東京タワーなど)の場合は 1 点に定まりますが、ある特定の範囲(例:東京都千代田区、郵便番号 102-0093 など)の場合は代表点を 1 点で示す場合と領域を面(ポリゴン)で示す場合があります。ジオコーディングは、コンピューター処理で自動的に行う場合もありますが、自動処理できないような判断が必要な場合は人手で行うこともあります。
反対に地図上の座標から住所、地名などの情報を取得することを「リバースジオコーディング(逆ジオコーディング)」といいます。リバースジオコーディングは、検索用の面(ポリゴン)データを用意することもあれば、指定した検索距離に基づいてポイント位置に最も近い住所などを返すこともあります。
日本の住所は大きな区分から細かい区分の順序で表記されます。街区方式の住居表示を実施している区域においては、
「都道府県 – (郡) – 市町村・特別区 – (政令指定都市の区) – 町・字 – 街区符号 – 住居番号 – (方書)」[1]
となり、街区方式の住居表示を実施していない区域では、
「都道府県 – (郡) – 市町村・特別区 – (政令指定都市の区) – 町・字 – 地番 – (支号) – (方書)」[1]
となります。
例えば「東京都千代田区平河町2-7-1」は街区方式で、
「東京都 – 千代田区 – 平河町 – 2丁目 – 7番 – 1号」と分解できます。
海外の住所は国によってさまざまです。たとえばインドの住所は日本とは逆で細かい区分から始まり、
部屋番号 – 建物名 – 町名 – 最寄りの街道名 – 地域名 – 市名・地区名 – 郵便番号 – 州名 – 国名
となります。また、Nr.(~の近く)やBeside(~の隣)といった表記も見受けられます。
ジオコーディングの対象のデータ精度や実際に落としたい精度、日本国内だけを対象としたいのか、海外も含めた住所を取り扱うのかによってそろえるべき住所データベースも異なります。日本国内の住所を対象とする場合はある程度の住所表記の違いにも対応できます。たとえば、「が」、「ケ」、「ケ」、「ガ」といった表記のゆれに対しても同じ住所と認識してジオコーディングを自動で行うことが可能です。
例)霞ヶ浦、霞ケ浦、霞が浦、霞ケ浦、霞が浦 → 霞ヶ浦
ただし、基になるユーザーデータの住所項目がこうした表記のゆれでは吸収できないぐらいの精度の場合、対応できないこともあります。その場合は、ユーザーデータの住所項目の誤記修正、不必要な文字列の削除、必要な文字列の追加など住所データの品質を高めることが必要です。これを「データクレンジング」と呼びます。
また、住所から座標へ変換する際の精度が街区レベルでよい場合と住居番号(号)レベルでよい場合では用意すべき住所データベースも異なります。一般的な利用方法としては、個人の住所からは精度の高い座標までは特定せずに統計を行いたい場合などは街区レベルまでの住所データベースでジオコーディングを行い、業務上の理由などにより個人の精度の高い住所を特定すべき時には住居番号(号)レベルまでの住所データベースでジオコーディングを行います。
ESRIジャパンの ArcGIS 製品である「ESRIジャパン データコンテンツ」では、以下の 2 種類の住所レベルが用意されています。
海外の住所も含めてジオコーディングを行いたい場合は当然ながら国内の住所データベースでは対応できません。海外を含んだ住所を利用したジオコーディングを行うには、世界レベルで住所を扱う製品やサービスなどを検討する必要が生じます。国によって住所データベースの整備状況なども千差万別ですが、たとえば ArcGIS Online から提供されるオンラインサービスの 1 つである「World Geocoding Service」は、世界中の住所に対応しています。
現実世界の住所や地名などの文字列と実際の地理座標をリンクさせ GIS データ化することにより、GIS 上でそれらを可視化して自由に重ね合わせたり、解析したりすることができます。そして、そこから住所文字列のリストでは取り扱えなかった現実世界での地理的パターン、マーケティング活動、配送業務などさまざまな分野で活用していくことが可能です。
出典 [1] 住居表示に関する法律(昭和三十七年五月十日法律第百十九号)