市区町村を探すには、「市区町村のリストから探す」、「市区町村の一覧地図から探す」、「市区町村名を入れて検索する」という3つの方法があります。
歴史的行政区域データセットβ版とは、歴史的に存在した市区町村に識別子を付与し、そこに市区町村境界の歴史的変遷を紐づけたデータセットです。1889年の市制・町村制以降の市区町村を対象とし、市区町村境界の変遷を現在のウェブ地図(地理院タイル)上に可視化する「アニメーション表示可能な歴史地図」も提供します。過去の複数の年代にわたる市区町村境界のデータベースとして、調査や教育などにご活用ください。2023年10月現在、行政区域件数=16,856件、行政区域境界データ件数=577,857件(うち統合境界データ件数=31,432件)を提供しています。
さらに、行政区域をポリゴンとして提供するだけでなく、ポリゴンを代表する点も合わせて提供します。そのために、複数のオープンデータを統合して行政区域の代表点を推定するアルゴリズムも開発しました。また、国勢調査町丁・字等別境界データセットと連携することで、現在の市区町村については、より粒度の細かい町丁・字等を単位とした境界データも確認できるようにしました。
ただし、過去の行政区域については記録が不確かである部分も多く、正式な記録に基づくデータセットを構築するのは大変難しい課題です。そこで当面は「β版」として公開し、昔の地図を確認する際の補助データとしてご活用いただきつつ、今後のデータの充実に向けた要望の調査やコラボレーションの可能性などを探りたいと考えています。
なお、プロジェクトの全体像については、れきちめ:日本歴史地名統合データベースをご覧ください。
国土数値情報「⾏政区域データ」 (N03) | 1920年〜2023年。 ただし公開データに対して、ごく一部の属性値に修正を適用している。 |
---|---|
筑波大学「行政界変遷データベース」 | 1889年〜1968年。 筑波大学大学院 生命環境科学研究科空間情報科学分野 村山祐司研究室が公開。 1889年から2006年まで公開されているデータセットのうち、1968年以前のデータセットを利用する。 またオリジナルのデータセットに対して、日本測地系から世界測地系への変換、一部のポリゴンの結合、市区町村名などの属性値の修正を適用している。 |
『日本歴史地名大系』行政地名変遷データセット | 1889年以前。 1889年以前の市町村との連続性を確認するために利用する。 |
まず国土数値情報「⾏政区域データ」については、各時点で参照したデータソースの違いにより、境界データが異なります。
1920年 | 「旧版地図」から作成 |
---|---|
1950年〜1985年 | 「平成7年国勢調査統計地理情報 町丁・字等別境界」をベースに作成 |
1995年〜2000年 | 「2万5千分1地形図」から作成 |
2005年〜2006年 | 「数値地図(空間データ基盤)」から作成 |
2007年 | 「数値地図(行政界・海岸線)」から作成 |
2009年〜2012年 | 「数値地図25000(地図画像)」から作成 |
2013年 | 「数値地図(国土基本情報)」の行政区画データから作成 |
2014年 | 「数値地図25000(空間データ基盤)」から作成 |
2015年以降 | 「数値地図(国土基本情報)」の行政区画データから作成 |
特に1985年以前のデータは、1995年以降と比較するとデータソースが大きく異なるため、市区町村の重なりや隣接関係について実態とは異なる結果が生じやすくなります。こうしたデータソースの変化による一時的な重なりや隣接関係は、ノイズとして無視してよい場合も多いと言えます。しかし、市区町村の境界が実際に細かく変化することもあるため、完全に無視してよいわけではありません。そのため、「重なりが小さい市区町村を隱す」オプションにより、そうした市区町村の情報に関する表示をオン/オフできるようにしました。
ちなみに、国土数値情報の最初の年である1920年は、第1回の国勢調査が行われた年であり、この時から近代統計調査がスタートしました。
次に、筑波大学「行政界変遷データベース」は、1995年時点の町丁字界を単位地域として,1889年(明治22)から2006年(平成18)現在まで,その所属自治体の変遷を年次毎に採録したデータベースです。そのため、国土数値情報の1950年〜1985年の作成方法と類似していますが、細かな違いがあり一致しません。そのため「国土数値情報」と「行政界変遷データベース」を分けて扱うことにします。
このデータセットは1889年から始まっていますが、現在のところ国土数値情報との統合が完了したのは1920年以降です。また、1968年以降は、全国地方公共団体コードにより地方自治体の識別子が公式に管理されていることから、1968年以前のデータのみを利用します。
ちなみに、行政界変遷データベースの最初の年である1889年は、市制・町村制が施行された年であり、この時から現代に続く地方自治制度がスタートしました。1889年以前については、本データセットと連続する『日本歴史地名大系』行政地名変遷データセットをご利用ください。ただしこのデータセットでは、ポリゴンデータは提供していません。
なお、すべてのデータセットに共通する問題として、小さな飛地などのポリゴンが省略されていたり、詳細に見ると正確な境界になっていなかったりする問題があります。より正確なデータが必要な場合は、しかるべき資料を参照して下さい。また現在については国勢調査町丁・字等別境界データセットの方が、境界を詳細に確認することができます。
国土数値情報「市区町村役場データ」 (P34) | 2014年 |
---|---|
国土数値情報「市町村役場等及び公的集会施設データ」 (P05) | 2010年 |
国土数値情報「郵便局データ」 (P30) | 2013年 |
国土数値情報「警察署データ」 (P18) | 2012年 |
国土数値情報「消防署データ」 (P17) | 2012年 |
国土数値情報「国・都道府県の機関データ」 (P28) | 2014年 |
これらのポイントデータは、代表点の付与に用いています。
政府統計の総合窓口(e-Stat)「廃置分合等情報」 | CSV形式「廃置分合等情報」1970年4月1⽇以降 |
---|---|
政府統計の総合窓口(e-Stat)「標準地域コード」 | CSV形式「標準地域コード」 |
政府統計の総合窓口(e-Stat)「統計LOD」 | CSV形式データ |
これらの変遷データは、市区町村ID(Geoshape City ID)の付与に用いています。
1968年以降は市区町村のための標準化されたコードが存在しますが、問題は1968年12月1日以前までに消滅して市区町村コードが付与されていない場合です。こうした市区町村に対しても、名称の連続性や廃置分合等情報、その他の特殊な場合などを調べ、データセットに出現するすべての市区町村にユニークなID(Geoshape City ID)を付与しました。これにより、現在は存在しない市区町村でも一意に特定することが可能です。
なお情報源となるポリゴンデータには、市区町村に含まれない領域(所属未定地など)も含まれており、これらのIDには「999」という文字列が含まれています。このような市区町村IDについては、市区町村ID件数の歴史的推移やデータセットからは除外しています。
行政区域のポリゴンは、国土数値情報ダウンロードサービスからダウンロードしたデータを、ウェブと親和性が高いGeoJSONやTopoJSONフォーマットに変換することで、それぞれの年代ごとに用意することができます。しかしGeoNLPやその他のサービスでは、ポリゴンではなくポイントとして地理情報を扱いたい場合があるため、ポリゴンを代表するポイントを定めることが必要になります。
現在も存在する市区町村ならば、国土数値情報「市区町村役場データ」を用いて、市区町村役場の場所を代表点と定めることができます。ただし2014年時点で存在しない市区町村では、この方法は使えません。
そこでかつて存在していた市区町村の代表点を定めるために、別のオープンデータである国土数値情報「市町村役場等及び公的集会施設データ」を利用します。このとき注目したのはかつての市区町村役場の痕跡です。市町村合併によって市区町村役場でなくなった公的施設は、その後すぐに消えるわけではなく、今でも「支所」や「出張所」などの名称で使われていることが多いからです。また、かつての市区町村役場でないとしても、公的施設は中心的な集落に位置することが多いため、代表点として妥当な場合が多いと考えています。
それでも代表点が定まらない場合は、国土数値情報「郵便局データ」を活用します。郵便局もかつては国が運営する事業であり、立地の選定は公的なプロセスで進んだと考えられるため、代表点の候補としてふさわしいと考えました。
以上のデータに当てはまるものが一つもない場合は、ポリゴンの重心を代表点とすることにしました。ただしポリゴンの重心がポリゴンの内部に入らないような場合は、それがポリゴンの内部に入るような補正を行いました。重心は人口の分布などを考慮しない計算方法のため、行政区域を代表する点として適切でない場合があります。これをどのように改良するかは今後の課題です。
なお代表点の選定プロセスは、現在から過去にさかのぼって進めていきます。まず、現在まで存続している市区町村の代表点を、最も新しい境界データに基づき選定します。次に、過去に消滅した市区町村については、最後の時点でどこの市区町村にも選ばれていないポイントを代表点に選びます。この方式で1920年までさかのぼり、すべての市区町村の代表点を選定します。2023年3月時点のデータでは、代表点の種類ごとの件数は以下のようになりました。
市区町村役場データ(P34) | 8,928 |
---|---|
市町村役場等及び公的集会施設データ(P05) | 6,896 |
郵便局データ(P30) | 635 |
警察署データ(P18) | 59 |
消防署データ(P17) | 7 |
国・都道府県の機関データ(P28) | 1 |
上記以外のデータを参照 | 1 |
重心 | 289 |
歴史的行政区域データβ版の表示には、国土地理院の地理院タイル(標準地図)を利用しています。
行政区域は時期ごとに表示/非表示を選ぶことができます。ヘッダ行のチェックボックスを使えば全データをオン/オフできます。このあと全データをオンすると、最初から最後までの行政区域の変化をアニメーション表示します。また個別データをオンにしていくと、行政区域がどのように変化してきたかを比較することができます。
歴史的に拡大を続けてきた市区町村の例を以下にいくつか紹介します。
関連する行政区域として、距離が近い行政区域をリストアップします。距離の計算は本サイトで選定した代表点を基準とし、距離が小さい方から上位約30件を表示しています。
本サイトは歴史的な行政区域のアーカイブを目的としてはいますが、一方で最新の行政区域を入手したいという場合も多いと考えられます。そこで、標準地域コードごとに、最新のポリゴンデータに入手するインタフェースも用意しました。こちらのIDから歴史的行政区域データにアクセスすることも可能です。なお、市区町村コードとしてよく使われる「全国地方公共団体コード」は、「標準地域コード」と最初の5桁が共通しています。また行政区域を一意に識別するための「行政コード」は、JIS X 0401に定められた都道府県コード(2桁)と、JIS X 0402に定められた市区町村コード(3桁)を結合した5桁の値からなり、「標準地域コード」と一致します。
本サイトで公開する市区町村境界データは、すべてGeoJSONまたはTopoJSONフォーマットを利用しています。一方、地理情報システム(GIS)で広く使われているシェープファイル(shp)フォーマットは利用していません。その理由は、シェープファイルフォーマットがバイナリ形式であるのに対して、GeoJSONやTopoJSONフォーマットはテキスト形式であり、しかもJSON形式であるため、ウェブアプリなどから呼び出して使いやすいことにあります。
国土数値情報については、データが定義する基準年月日を参照していますが、同じ年度のデータであっても基準年月日が異なる場合があります。
一方、行政界変遷データベースについては、基準年は明確ですが月日が明確ではないため、月日にはともに00を入力しています。
本サイト構築の過程で、国土数値情報「行政区域データ」に不整合や表記揺れなどの問題が多数見付かったため、その結果は「国土情報提供サイト運営事務局」にフィードバックしています。
市区町村ごとに独立した境界データを統合し、市区町村を色塗りするためのコロプレス地図(塗り分け地図)データセットを提供します。境界線を統合した上で解像度を落とすため、境界線に隙間ができないことが大きな特徴です。それぞれのポリゴンにはGeoshape IDを付与しているため、データとバインドすることで塗り分け地図が作成できます。
解像度は5種類あります。フル解像度は国土数値情報で提供する解像度のデータですが、これで全国を描画しようとすると、ブラウザのメモリを使い切って固まってしまいます。そこで解像度を落としたデータとして、高い順から「高解像度」「中解像度」「低解像度」「粗解像度」の4種類を用意しました。一つ解像度を落とすことで、データ量はおおむね80%小さくなります(1/5になります)。おすすめは「低解像度」ですが、速度重視の場合は「粗解像度」でも実用的には十分かもしれません。データ形式としては、TopoJSON形式のみを提供します。
塗り分け地図をさらに軽量化する技術がベクトルタイル地図です。タイル分割を用いると、表示に必要なデータのみを送信し、解像度に応じて詳細度を自動的に調整できるようになります。そのため、TopoJSON形式では不可能な、全国の市区町村境界のフル解像度表示も可能となります。
なお1889年から1919年については、都道府県ごとに順次作業を進めているため、一部の都道府県しかデータがないことにご注意ください。
本サイトで提供するデータの一部を、ダウンロード可能な形式で提供します。
このウェブサイトのコンテンツは、CC BY 4.0の下に提供されています。
ただし、本サイトで利用している国土数値情報「行政区域データ」の利用規約については、国土数値情報ダウンロードサービスをご参照下さい。
データセットをご利用の際には、以下のようなクレジットを表示して下さい。
『歴史的行政区域データセットβ版』(CODH作成)
歴史的行政区域データセットと他のデータセットとの大きな違いは、時間方向で行政区域を区別するために独自IDを付与したこと、そして各IDに対するポリゴンの履歴を取得できる点にあります。また、行政区域の代表点の定め方に独自の方法を導入している点も特徴です。このIDはもちろんLinked Dataの基盤となりうるものですが、本サイトはLinked Dataとしてのサービスは提供していません。本サイトは「リポジトリ」という名称が示すように、オープンなデータの可視化と共有を主な目的としています。