『日本歴史地名大系』地名項目データセット | Geoshapeリポジトリ

メニュー

  1. 地名項目 一覧
  2. 歴史的地名/現代地名による統合検索 - 歴史的地名/現代地名を対象とした統合検索
  3. 『日本歴史地名大系』行政地名変遷データセット
  4. 『日本歴史地名大系』施設・地点項目データセット

概要

『日本歴史地名大系』地名項目データセットは、ジャパンナレッジで公開する平凡社刊行の『日本歴史地名大系』(全50巻)の地名項目と関連情報をまとめたデータセットです。2025年5月現在、地名項目=80,502件を提供しています。

なお、プロジェクトの全体像については、れきちめ:日本歴史地名統合データベース、あるいは以下のプレスリリースをご覧ください。

  1. 歴史的地名の「行政区画変遷」を大規模オープンデータ化~『日本歴史地名大系』を平凡社地図出版との協働により機械可読データとして強化~, 国立情報学研究所

データセット(オープンデータ)

地名項目データセット

地名項目データセット(2025年5月12日版)

ジャパンナレッジ版『日本歴史地名大系』の項目IDに対して、読みや緯度経度を付与したデータセットです。

GeoNLP地名語辞書

地名項目データセットをGeoNLPの地名語辞書形式に変換したデータセットを以下で公開しています。

『日本歴史地名大系』地名項目データセット地名辞書

ライセンス

本データセットは、CC BY 4.0の下に提供されています。データセットをご利用の際には、以下のようなクレジットを表示して下さい。

『日本歴史地名大系』地名項目データセット(CODH作成) doi:10.20676/00000448

利用したデータ

日本歴史地名大系 | ジャパンナレッジ

ジャパンナレッジは、株式会社ネットアドバンスが運営するオンライン辞書・事典検索サイトです。ジャパンナレッジに登録されている『日本歴史地名大系』の項目数は15万件以上ですが、本データセットはこのうち行政地名のみ約8万件を対象とします。寺社や遺跡、城跡など、行政地名以外の項目については、『日本歴史地名大系』場所項目データセットをご利用ください。

位置の推定手法

『日本歴史地名大系』(以下、『大系』)では、採録項目の位置情報は、『大系』編集当時に推定した「現在」地名として各項目に付与されています(一部の項目には、未掲載)。そこで、本データセットでは、地図から地名の位置を閲覧/検索できるように、町村の位置情報を、「現在」地名を手掛かりとして間接的に推定して追加しました。その方法は以下の通りです。

1. Jageocoder

Python版住所ジオコーダー「Jageocoder」(ver.2.1.8)を用いて、上記「現在」地名のジオコーディングにより緯度経度を取得しました。『大系』編集当時の「現在」地名が2025年現在とは異なる場合、現在の地名に変更してジオコーディングした場合があります。また、複数の「現在」地名が指定されている場合には、ジオコーディンに成功したものの中心点を代表点としました。Jageocoderが返す緯度経度の精度は、Jageocoderが参照するデータセットに依存します。

Jageocoderによるジオコーディング以外に、以下のデータセットを参照しました。

2. 歴史地名データ

人間文化研究機構やH-GIS研究会が公開する「歴史地名データ」を参照して緯度経度を付与しました。この場合、地名が指す範囲の中心または代表点ではなく、古地図上に描かれた地名の文字ラベルの中心点が選択されていることに注意してください。

3. 幕末期近世村領域データ

本田 謙一氏が公開する「幕末期近世村領域データ」の02_kyudaka_v2.0を参照して緯度経度を付与したものがあります。このデータセットの点データは、ほとんどが中心集落におかれているので、上記のジオコーディングの結果と一つひとつ比較をしたうえで、活用させていただきました。

4. 手動推定

以上の方法では推定できない場合、他の資料も参照しながら代表点を決定します。

5. 困難/不明

他の資料を参照しても位置の決定が困難な場合や、不明な場合は、代表点を設定しません。

謝辞

  1. 『日本歴史地名大系』地名項目データセットの位置情報は、株式会社平凡社地図出版が整備しました。
  2. 位置情報の推定には、情報試作室の相良毅氏が開発するJageocoderによるジオコーディング、本田 謙一氏が公開する「幕末期近世村領域データ」、および人間文化研究機構とH-GIS研究会の歴史地名データを参照しました。特に歴史地名データについては、故 桶谷猪久夫先生(大阪国際大学名誉教授)に深くお礼申し上げます。
  3. データの整備を進めるにあたり、その公開にご理解いただいた株式会社ネットアドバンスおよび株式会社平凡社に心より感謝申し上げます。

研究費

  1. 歴史ビッグデータ:史料とデータ駆動型モデルを結合する分野横断型研究基盤の構築, 科学研究費補助金 基盤研究(A)
  2. 人文学・社会科学のDX化に向けた研究開発推進事業

論文/発表

  1. 北本 朝展, "地名の情報学と歴史地名データベース構想", 月刊「地理」, Vol. 68, No. 11, pp. 48-55, 2023年11月
  2. 北本 朝展, "GeoとNLPをつなぐ地名の情報学", 地理空間情報と自然言語処理勉強会, 2023年7月 (招待講演)
  3. 北本 朝展, "地名の情報学とデータ駆動型研究の展開", 公開シンポジウム「地名標準化の現状と課題:地名データベースの構築と地名標準化機関の設置に向けて」, 2022年12月 (招待講演)

ソーシャルメディア

歴史的地名の大規模オープンデータを公開しました。https://t.co/Im0dFliHqJ

江戸時代の村までさかのぼる、79,502件の行政地名のデータです。平凡社地図出版と協働し、『日本歴史地名大系』の一部をオープン化しました。自分の先祖がどこに住んでいたかなど、地名から探っていくのも面白いですね。 pic.twitter.com/uikx9bNlLs

- Center for Open Data in the Humanities (CODH) (@rois_codh) October 18, 2023

更新情報

2025-05-09
地図のデザインを変更しました。一部、利用できなくなっている機能がありますが、順次復旧させていく予定です。
2025-05-08
位置の推定手法を全般的に見直し、位置情報の精度が向上しました。また1件の地名を削除し、1件の地名を追加したため、件数は80,502件で変わりません。
2023-11-24
データ処理上の問題で漏れていた全国の地名を追加し、件数が80,439件→80,502件に増えました。
2023-11-09
データ処理上の問題で漏れていた全国の地名を追加し、件数が80,425件→80,439件に増えました。
2023-11-07
データ処理上の問題で漏れていた全国の地名を追加し、件数が80,277件→80,425件に増えました。
2023-10-25
データ処理上の問題で漏れていた北海道の地名を追加し、件数が79,919件→80,277件に増えました。
2023-10-21
データ処理上の問題で漏れていた沖縄県の地名を追加し、件数が79,552件→79,919件に増えました。
2023-10-20
データ処理上の問題で漏れていた沖縄県の地名を追加し、件数が79,502件→79,552件に増えました。
2023-10-18
『日本歴史地名大系』地名項目データセットを公開しました。件数は79,502件です。