歴史的行政区域データセットβ版 | Geoshapeリポジトリ

個別市区町村データ

  1. 標準地域コード インデックス - 現在の行政区域のみのリスト
  2. 市区町村ID インデックス - 過去の行政区域も含むリスト
  3. 市区町村ID 件数の歴史的推移 - 各時点における市区町村IDのインデックスと件数の歴史的推移

複数市区町村データ

  1. コロプレス地図 インデックス - 塗り分け地図のための境界データリスト
  2. ベクトルタイル地図 - 各時点における全国の市区町村境界を詳細かつ軽量に閲覧できる地図
  3. 行政境界データセット ベクトルタイル地図 - 全国の市区町村から町丁・字までを連続的にズームイン/アウトできる地図(2015年)

検索/データセット

  1. 歴史的地名/現代地名による境界データ検索 - 歴史的地名/現代地名を対象とした境界データセットの検索
  2. データセット - 市区町村IDをまとめたデータセット

概要

歴史的行政区域データセットβ版は、1920年以降の市区町村境界の歴史的変遷を中心としたデータセットです。昔の市区町村境界を現在のウェブ地図上に可視化する「アニメーション表示可能な歴史地図」を実現するため、シェープファイルフォーマットのデータをGeoJSON/TopoJSONフォーマットに変換し、国土地理院の「地理院タイル」にオーバーレイ表示します。過去の複数の年代にわたる市区町村境界のデータベースとして、調査や教育などにご活用ください。2020年8月現在、行政区域件数=16,447件、行政区域境界データ件数=99,296件(うち統合境界データ件数=10,832件)を提供しています。

歴史的行政区域データセットβ版の特徴は、行政区域を上記のポリゴンとして提供するだけでなく、ポリゴンを代表する点の情報も合わせて提供する点にあります。そのために、複数のオープンデータを統合して行政区域の代表点を推定するアルゴリズムも開発しました。

ただし、過去の行政区域については記録が不確かである部分も多く、正式な記録に基づくデータセットを構築するのは大変難しい課題です。そこで当面は「β版」として公開し、昔の地図を確認する際の補助データとしてご活用いただきつつ、今後のデータの充実に向けた要望の調査やコラボレーションの可能性などを探りたいと考えています。

なお、市区町村よりも細かい町丁・字等を単位とした境界データについては、国勢調査町丁・字等別境界データセットをご利用下さい。

データセットの作成

利用したデータ

国土数値情報「⾏政区域データ」 (N03) 2020年2016年〜2019年1920年〜2015年
国土数値情報「市区町村役場データ」 (P34) 2014年
国土数値情報「市町村役場等及び公的集会施設データ」 (P05) 2010年
国土数値情報「郵便局データ」 (P30) 2013年
政府統計の総合窓口(e-Stat)「廃置分合等情報」 CSV形式「廃置分合等情報」1970年4月1⽇以降
政府統計の総合窓口(e-Stat)「標準地域コード」 CSV形式「標準地域コード」
政府統計の総合窓口(e-Stat)「統計LOD」 CSV形式データ

なお「⾏政区域データ」は、その元となった情報源の違いにより、境界の位置に差異が生じる場合があります。各時点の境界データ作成に用いた元データは以下の通りです。

1920年 「旧版地図」から作成
1950年〜1985年 「平成7年国勢調査統計地理情報 町丁・字等別境界」をベースに作成
1995年〜2000年 「2万5千分1地形図」から作成
2005年〜2006年 「数値地図(空間データ基盤)」から作成
2007年 「数値地図(行政界・海岸線)」から作成
2009年〜2012年 「数値地図25000(地図画像)」から作成
2013年 「数値地図(国土基本情報)」の行政区画データから作成
2014年 「数値地図25000(空間データ基盤)」から作成
2015年以降 「数値地図(国土基本情報)」の行政区画データから作成

なお1985年以前と1995年以降では情報源の種類が異なるため、実際には重なっていない、または隣接していない市区町村でも、リストに出現する場合があります。またそれ以後のデータについても、情報源の違いによって、実態とは異なる市区町村がリストに出現する場合があります。こうした情報はノイズとみなせる場合もありますが、市区町村の境界変更によって小さな領域が重なる場合との区別がつけにくいため、現在は重なりが小さい場合でも表示しています。

ちなみに1920年は第1回の国勢調査が行われた年でもあり、ここから近代統計調査がスタートしました。

市区町村ID(Geoshape City ID)の付与

1968年以降は市区町村のための標準化されたコードが存在しますが、問題は1968年12月1日以前までに消滅して市区町村コードが付与されていない場合です。こうした市区町村に対しても、名称の連続性や廃置分合等情報、その他の特殊な場合などを調べ、データセットに出現するすべての市区町村にユニークなID(Geoshape City ID)を付与しました。これにより、現在は存在しない市区町村でも一意に特定することが可能です。

なおデータセットは時間的に不連続なため、その狭間に誕生して消滅した市区町村はここに含まれていません。したがって市区町村IDは過去のすべての市区町村を網羅したものではない点にご注意下さい。

代表点の付与

行政区域のポリゴンは、国土数値情報ダウンロードサービスからダウンロードしたデータを、ウェブと親和性が高いGeoJSONやTopoJSONフォーマットに変換することで、それぞれの年代ごとに用意することができます。しかしGeoNLPやその他のサービスでは、ポリゴンではなくポイントとして地理情報を扱いたい場合があるため、ポリゴンを代表するポイントを定めることが必要になります。

現在も存在する市区町村ならば、国土数値情報「市区町村役場データ」を用いて、市区町村役場の場所を代表点と定めることができます。ただし2014年時点で存在しない市区町村では、この方法は使えません。

そこでかつて存在していた市区町村の代表点を定めるために、別のオープンデータである国土数値情報「市町村役場等及び公的集会施設データ」を利用します。このとき注目したのはかつての市区町村役場の痕跡です。市町村合併によって市区町村役場でなくなった公的施設は、その後すぐに消えるわけではなく、今でも「支所」や「出張所」などの名称で使われていることが多いからです。また、かつての市区町村役場でないとしても、公的施設は中心的な集落に位置することが多いため、代表点として妥当な場合が多いと考えています。

それでも代表点が定まらない場合は、国土数値情報「郵便局データ」を活用します。郵便局もかつては国が運営する事業であり、立地の選定は公的なプロセスで進んだと考えられるため、代表点の候補としてふさわしいと考えました。

以上のデータに当てはまるものが一つもない場合は、ポリゴンの重心を代表点とすることにしました。ただしポリゴンの重心がポリゴンの内部に入らないような場合は、それがポリゴンの内部に入るような補正を行いました。重心は人口の分布などを考慮しない計算方法のため、行政区域を代表する点として適切でない場合があります。これをどのように改良するかは今後の課題です。

なお代表点の選定プロセスは、現在から過去にさかのぼって進めていきます。まず、現在まで存続している市区町村の代表点を、最も新しい境界データに基づき選定します。次に、過去に消滅した市区町村については、最後の時点でどこの市区町村にも選ばれていないポイントを代表点に選びます。この方式で1920年までさかのぼり、すべての市区町村の代表点を選定します。

なお上記の方法ごとの件数は、「市区町村役場データ」が8,784件、「市町村役場等及び公的集会施設データ」が6,747件、「郵便局データ」が615件、そして重心が312件です。

行政区域の地図表示

歴史的行政区域データβ版の表示には、国土地理院の地理院タイル(標準地図)を利用しています。

行政区域は時期ごとに表示/非表示を選ぶことができます。ヘッダ行のチェックボックスを使えば全データをオン/オフできます。このあと全データをオンすると、最初から最後までの行政区域の変化をアニメーション表示します。また個別データをオンにしていくと、1920年以降の時期ごとに行政区域がどんな形状だったかを、じっくり見ることができます。

歴史的に拡大を続けてきた市区町村の例を以下にいくつか紹介します。

近隣行政区域

関連する行政区域として、距離が近い行政区域をリストアップします。距離には本サイトで選定した代表点を使い、距離が近い方から上位約30件を表示しています。

最新行政区域データ

標準地域コード インデックス

本サイトは歴史的な行政区域のアーカイブを目的としてはいますが、一方で最新の行政区域を入手したいという場合も多いと考えられます。そこで、市区町村コード(標準地域コード)ごとに、最新のポリゴンデータに入手するインタフェースも用意しました。こちらのIDから歴史的行政区域データにアクセスすることも可能です。

フォーマット

本サイトで公開する市区町村境界データは、すべてGeoJSONまたはTopoJSONフォーマットを利用しています。一方、地理情報システム(GIS)で広く使われているシェープファイル(shp)フォーマットは利用していません。その理由は、シェープファイルフォーマットがバイナリ形式であるのに対して、GeoJSONやTopoJSONフォーマットはテキスト形式であり、しかもJSON形式であるため、ウェブアプリなどから呼び出して使いやすいことにあります。

その他

地名に関しては例外的なケースもありますので、例外扱いで代表点を定めている場合もあります。

また本サイト構築の過程で、国土数値情報「行政区域データ」に不整合や表記揺れなどの問題が多数見付かったため、その結果は「国土情報提供サイト運営事務局」にフィードバックしています。

コロプレス地図

コロプレス地図 インデックス

市区町村ごとに独立した境界データを統合し、塗り分け地図(コロプレス地図)が可能なデータとして提供します。境界線ごとに解像度を落とすため、境界線の間に隙間ができないことが特徴です。それぞれの境界にはGeoshape IDを付与しているため、これとデータをバインドすることで塗り分け地図を作成できます。

解像度は5種類あります。フル解像度は国土数値情報で提供する解像度のデータですが、これで全国を描画しようとすると、ブラウザのメモリを使い切って固まってしまいます。そこで解像度を落としたデータとして、高い順から「高解像度」「中解像度」「低解像度」「粗解像度」の4種類を用意しました。一つ解像度を落とすことで、データ量はおおむね80%小さくなります(1/5になります)。おすすめは「低解像度」ですが、速度重視の場合は「粗解像度」でも実用的には十分かもしれません。データ形式としては、TopoJSON形式のみを提供します。

ベクトルタイル地図

塗り分け地図をさらに軽量化する技術がベクトルタイル地図です。タイル分割によって表示に必要なデータのみを送信すれば済み、さらに解像度に応じて詳細度を自動的に調整できるため、TopoJSON形式では不可能な全国の市区町村境界のをフル解像度表示も可能となります。

データセット

データセット

本サイトで提供するデータの一部を、ダウンロード可能な形式で提供します。

ライセンス

このウェブサイトのコンテンツは、CC BY 4.0の下に提供されています。

ただし、本サイトで利用している国土数値情報「行政区域データ」の利用規約については、国土数値情報ダウンロードサービスをご参照下さい。

データセットをご利用の際には、以下のようなクレジットを表示して下さい。

『歴史的行政区域データセットβ版』(CODH作成)

GeoNLP
自然言語文から地名を抽出してマッピングするためのデータ、ソフトウェア、アプリ環境。GeoNLPからGeoshapeのGeoJSONデータを指定すると、市区町村内に限定した解析が可能となる。
GeoNames.jp
日本地名のURI基盤。市区町村に加えて街区レベルでユニークなURIを提供しているが、URIには時間が含まれないため、現在と過去で区域が変化した市区町村などを一意に指定することはできない。また区域データは提供していない。
Linked Open Addresses Japan
日本の住所データを変換してLinked Dataとして提供しており、市区町村や町・丁目については行政区域データも提供している。ただしURIに時間が含まれていないため、過去のデータにさかのぼることはできない。

歴史的行政区域データセットと他のデータセットとの大きな違いは、時間方向で行政区域を区別するために独自IDを付与したこと、そして各IDに対するポリゴンの履歴を取得できる点にあります。また、行政区域の代表点の定め方に独自の方法を導入している点も特徴です。このIDはもちろんLinked Dataの基盤となりうるものですが、本サイトはLinked Dataとしてのサービスは提供していません。本サイトは「リポジトリ」という名称が示すように、オープンなデータの可視化と共有を主な目的としています。

論文/発表

  1. 北本 朝展, 村田 健史, "歴史的行政区域データセットβ版をはじめとする地名情報基盤の構築と歴史ビッグデータへの活用", 情報処理学会技術報告, Vol. 2020-CH-124, No. 1, pp. 1-8, 2020年9月
  2. 北本 朝展, 村田 健史, "歴史的行政区域データセットβ版をはじめとする幾何データ共有サイト「Geoshape」の構築", 日本地球惑星科学連合(JpGU)2020年大会, No. MGI41-15, 2020年7月 (招待講演)

ニュース

2020-09-19
歴史的行政区域データセットβ版の市区町村名を精査し、表記ミスを修正して統合した結果、行政区域件数=16,447件に減少しました。なお、今回の処理で利用しなくなった市区町村IDは欠番としているため、その他のIDは変更ありません。また行政区域境界データ件数=99,296件(うち統合境界データ件数=10,832件)も変化ありません。
2020-08-24
歴史的行政区域データセットβ版のデータ処理の誤りを修正し、行政区域件数=16,460件、行政区域境界データ件数=99,296件(うち統合境界データ件数=10,832件)となりました。新たに追加したのが、東京府東京市および東京都特別区部です。
2020-08-07
歴史的行政区域データセットβ版 ベクトルタイル地図を公開しました。バイナリベクトルタイルを用いることで、行政区域境界の変遷をより詳細にかつ軽量に確認することができます。
2020-07-31
歴史的行政区域データセットβ版のデータ処理の誤りを修正し、行政区域境界データ件数=99,268件(うち統合境界データ件数=10,832件)となりました。
2020-07-28
歴史的行政区域データセットβ版を、以下の点について更新しました。(1) 2020年版のデータを追加し、行政区域件数=16,458件、行政区域境界データ件数=99,243件(うち統合境界データ件数=10,832件)となりました。(2) 市区町村IDを4件変更しました(01472A1968→01472A2010,01520A1968→01520A2010,07505A1968→07505A1994,09410A1968→09410A1982)。(3) 代表点を選ぶアルゴリズムを改良しました。郵便局データを新たに代表点候補に追加するとともに、現在から過去への連続性を優先させた代表点決定方法に変更することで、重複のない代表点が選定できるようになりました。(4) 現在と過去の市区町村の重なりに対して、しきい値以下の重なりは表示しないようにしました。(5) 市区町村ID 件数の歴史的推移を公開しました。
2020-06-04
歴史的行政区域データセットβ版において、市区町村の歴史的変遷の表示方法を変更し、歴史的変遷の前後関係がより詳細につかめるよう可視化しました。
2019-08-08
歴史的行政区域データセットβ版において、今回の更新で追加した政令指定都市に関するデータの問題を修正し、行政区域件数=16,459件、行政区域境界データ件数=86,107件、統合境界データ件数=10,822件となりました。
2019-07-28
歴史的行政区域データセットβ版に2019年版データを追加し、行政区域件数=16,438件、行政区域境界データ件数=86,107件となりました。またTopoJSONファイル(コロプレス地図含む)のメタデータ構造を変更しました。また過去の行政区域と現在の行政区域の対応づけ、および1970年以前の行政区域の変遷についてもデータを追加しました。
2019-01-17
歴史的行政区域データセットβ版に、「市区町村の歴史的変遷」(1970年4月以降)、「隣接行政区域」、「リンクトオープンデータ」の項目を追加しました。また歴史的地名/現代地名による境界データ検索をリリースしました。
2018-11-21
歴史的行政区域データセットβ版に2018年版データを追加し、行政区域GeoJSON件数が82,318件から84,199件に増えました。またコロプレス地図の公開やデータセットの公開など、機能が充実しました。なおTopoJSONの拡充に伴って、GeoJSONのURLを変更しましたので、ご注意下さい。
2018-07-29
歴史的行政区域データセットβ版にTopoJSONデータを追加するとともに、一部の不具合を修正することで、行政区域件数が16,429件から16,436件に、行政区域GeoJSON件数が82,311件から82,318件に増えました。
2018-06-02
歴史的行政区域データセットβ版で一部の行政区域が出力されていなかった問題を修正しました。
2017-07-01
歴史的行政区域データセットβ版の近隣行政区域を地図表示できるようにしました。
2017-06-23
歴史的行政区域データセットβ版に2017年版データを追加し、本日時点までの各種データ修正も適用した結果、行政区域件数が16,428件から16,429件に、行政区域GeoJSON件数が82,311件に増えました。
2017-05-20
歴史的行政区域データセットβ版のインタフェースを修正し、表示時期を選択しやすくしました。
2017-03-18
歴史的行政区域データセットβ版に2016年版データを追加するとともに、一部のデータの不具合に対して変更または削除を行いました。
2017-01-15
歴史的行政区域データセットβ版を公開しました。