歴史的行政区域データセットβ版 | Geoshapeリポジトリ

概要

標準地域コード インデックス

歴史的行政区域データセットβ版 インデックス

歴史的行政区域データセットβ版は、行政区域の歴史的変遷をたどることが可能なデータセットです。時代ごとの行政区域データをGeoJSON形式で提供することにより、ウェブ地図上に簡単に行政区域を表示できるようになります。また過去の行政区域の変化をアニメーション表示すれば、市区町村が歴史的にどのように変化してきたかを学ぶこともできるでしょう。現在、行政区域GeoJSONの数は約82,000件です。

歴史的行政区域データセットβ版の特徴は、行政区域を上記のポリゴンとして提供するだけでなく、ポリゴンを代表する点の情報も合わせて提供する点にあります。そのために、複数のオープンデータを統合して行政区域の代表点を推定するアルゴリズムも開発しました。

ただし、過去の行政区域については記録が不確かである部分も多く、正式な記録に基づくデータセットを構築するのは大変難しい課題です。そこで現在のところは「β版」として公開し、今後のデータの充実に向けた要望の調査やコラボレーションの可能性などを探りたいと考えています。

データセットの作成

利用したデータ

⾏政区域データ
国土数値情報ダウンロードサービスで入手できるXML形式のデータ(N03) 1920年〜2016年
市区町村役場データ
国土数値情報ダウンロードサービスで入手できるXML形式のデータ(P34) 2014年
市町村役場等及び公的集会施設データ
国土数値情報ダウンロードサイトで入手できるXML形式のデータ(P05) 2008年
廃置分合等情報
政府統計の総合窓口(e-Stat)の「廃置分合等情報」を探すから入手できるCSV形式のデータ 1970年4月1⽇以降
標準地域コード
政府統計の総合窓口(e-Stat)の「標準地域コードを探す」から入手できるCSV形式のデータ

なお政府統計の総合窓口(e-Stat)については、計算機処理に適したフォーマットでデータを配布するサイト統計LODもあります。こちらからも上記のデータの一部を入手することができます。

市区町村IDの付与

1968年以降は市区町村のための標準化されたコードが存在しますが、問題は1968年12月1日以前までに消滅して市区町村コードが付与されていない場合です。こうした市区町村に対して、名称の連続性や廃置分合等情報、さらにはその他の特殊な場合などを調べることで、市区町村コードが存在しない場合にもユニークなIDを付与しました。これにより、過去に存在した市区町村を一意に特定することが可能です。

代表点の付与

行政区域のポリゴンは、国土数値情報ダウンロードサービスからダウンロードしたデータをGeoJSON形式に変換することで、それぞれの年代ごとに用意することができます。しかしGeoNLPやその他のサービスでは、ポリゴンではなくポイントとして地理情報を扱いたい場合があるため、ポリゴンを代表するポイントを定めることが必要になります。

現在も存在する市区町村ならば、国土数値情報「市区町村役場データ」2014年版を用いて、市区町村役場の場所を代表点と定めることができます。ただし2014年時点で存在しない市区町村では、この方法は使えません。そこでかつて存在していた市区町村の代表点を定めるために、別のオープンデータである国土数値情報「市町村役場等及び公的集会施設データ」を利用します。このとき注目したのはかつての市区町村役場の痕跡です。市町村合併によって市区町村役場でなくなった公的施設は、その後すぐに消えるわけではなく、今でも「支所」や「出張所」などの名称で使われていることが多いからです。また、かつての市区町村役場でないとしても、公的施設は中心的な集落に位置することが多いため、代表点として妥当な場合が多いと考えています。

しかし公的施設として適当なものが見つからない場合には、ポリゴンの重心を代表点とすることにしました。これは行政区域を代表する点として適切な点と言えない場合もありますが、その解決は今後の課題とします。

行政区域の地図表示

歴史的行政区域データβ版の表示には、国土地理院の地理院タイル(標準地図)を利用しています。

行政区域は時期ごとに表示/非表示を選ぶことができます。ヘッダ行のチェックボックスを使えば全データをオン/オフできます。このあと全データをオンすると、最初から最後までの行政区域の変化をアニメーション表示します。また個別データをオンにしていくと、1920年以降の時期ごとに行政区域がどんな形状だったかを、じっくり見ることができます。

歴史的に拡大を続けてきた市区町村の例を以下にいくつか紹介します。

近隣行政区域

関連する行政区域として、距離が近い行政区域をリストアップします。距離には本サイトで選定した代表点を使い、距離が近い方から上位約30件を表示しています。

最新行政区域データ

標準地域コード インデックス

本サイトは歴史的な行政区域のアーカイブを目的としてはいますが、一方で最新の行政区域を入手したいという場合も多いと考えられます。そこで、市区町村コード(標準地域コード)ごとに、最新のポリゴンデータに入手するインタフェースも用意しました。こちらのIDから歴史的行政区域データにアクセスすることも可能です。

その他

地名に関しては例外的なケースもありますので、例外扱いで代表点を定めている場合もあります。

また本サイト構築の過程で、国土数値情報「行政区域データ」に不整合や表記揺れなどの問題が多数見付かったため、その結果は「国土情報提供サイト運営事務局」にフィードバックしています。

ライセンス

このウェブサイトのコンテンツは、CC BY-SA 4.0の下に提供されています。ただし、行政区域データについては基準年月日ごとに利用許諾条件が異なっており、複製には承認が必要な場合があります。また利用規約については、国土数値情報ダウンロードサービスで定められている規約が本サイトの規約よりも優越します。したがって、本サイトの目的は行政区域データと地図とを重ね合わせて確認することとし、APIのような形で広く活用することは現時点では対象外とします。

関連ウェブサービス

GeoNLP
自然言語文から地名を抽出してマッピングするためのデータ、ソフトウェア、アプリ環境。GeoNLPからGeoshapeのGeoJSONデータを指定すると、市区町村内に限定した解析が可能となる。
GeoNames.jp
日本地名のURI基盤。市区町村に加えて街区レベルでユニークなURIを提供しているが、URIには時間が含まれないため、現在と過去で区域が変化した市区町村などを一意に指定することはできない。また区域データは提供していない。
Linked Open Addresses Japan
日本の住所データを変換してLinked Dataとして提供しており、市区町村や町・丁目については行政区域データも提供している。ただしURIに時間が含まれていないため、過去のデータにさかのぼることはできない。

つまり、歴史的行政区域データセットは時間方向で行政区域を区別するとともに、過去の市区町村のポリゴンもさかのぼって表示できる点に特徴があります。また、過去の市区町村の代表点の定め方にも独自の方法を導入しています。ただしLinked Dataとしての活用はあまり考えていません。「リポジトリ」という名称が示すように、オープンなデータの可視化と共有を主な目的とするサービスです。

ニュース

2017-05-20
歴史的行政区域データセットβ版のインタフェースを修正し、表示時期を選択しやすくしました。
2017-03-18
歴史的行政区域データセットβ版に2016年版データを追加するとともに、一部のデータの不具合に対して変更または削除を行いました。
2017-01-15
歴史的行政区域データセットβ版を公開しました。