TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025119232
公報種別公開特許公報(A)
公開日2025-08-14
出願番号2024013999
出願日2024-02-01
発明の名称情報処理装置、情報処理方法、および情報処理プログラム
出願人楽天グループ株式会社
代理人個人,個人,個人
主分類G06F 16/387 20190101AFI20250806BHJP(計算;計数)
要約【課題】住所情報からトークン化されたトークンを用いて精度高くジオコーディングを行う。
【解決手段】情報処理装置は、対象住所情報を、階層的な住所区分に対応する複数のトークンにトークン化してトークン列を生成し、所定の住所情報のリストに含まれる住所情報と、該トークン列との類似度を予測し、該リストから、該トークン列との類似度が最も高い住所情報を一致住所情報として特定し、該リストと、該リストに含まれる住所情報に対応する緯度経度情報とが格納されたデータベースから、該一致住所情報に対応する緯度経度情報を、該対象住所情報の緯度経度情報として決定する。
【選択図】図1
特許請求の範囲【請求項1】
対象住所情報を、階層的な住所区分に対応する複数のトークンにトークン化してトークン列を生成する生成部と、
所定の住所情報のリストに含まれる住所情報と、前記トークン列との類似度を予測する予測部と、
前記リストから、前記トークン列との類似度が最も高い住所情報を一致住所情報として特定する特定部と、
前記リストと、前記リストに含まれる住所情報に対応する緯度経度情報とが格納されたデータベースから、前記一致住所情報に対応する緯度経度情報を、前記対象住所情報の緯度経度情報として決定する決定部と、
を有する、情報処理装置。
続きを表示(約 1,600 文字)【請求項2】
前記生成部は、前記対象住所情報を、自然言語処理のために学習された機械学習モデルに入力することにより、前記トークン列を生成する、請求項1に記載の情報処理装置。
【請求項3】
前記機械学習モデルは、前記対象住所情報から、前記複数のトークンと、前記対象住所情報における前記複数のトークンの各トークンの位置を出力するように構成されており、
前記生成部は、前記複数のトークンと、前記各トークンの位置から、前記トークン列を生成する、
請求項2に記載の情報処理装置。
【請求項4】
前記予測部は、学習済みの機械学習モデルを用いて、前記リストに含まれる住所情報と前記トークン列との類似度を予測する、請求項1に記載の情報処理装置。
【請求項5】
前記予測部は、前記トークン列に基づいて、前記リストから複数の一致住所情報候補を選択し、前記一致住所情報候補と前記トークン列との類似度を予測し、
前記特定部は、前記一致住所情報候補のうち、前記トークン列との類似度が最も高い候補を前記一致住所情報として特定する、請求項4に記載の情報処理装置。
【請求項6】
前記トークン列は、先頭から、都・道・府・県のトークン、市・区・郡・村のトークン、町または字のトークン、街区符号と住居番号の少なくともいずれかを表すコードのトークンを含む、請求項1に記載の情報処理装置。
【請求項7】
前記トークン列が、前記コードのトークンに続いて建物名のトークンを含む場合に、生成部は、前記トークン列から、前記建物名のトークン以降の1つ以上のトークンを削除した修正トークン列を生成し、
前記予測部は、前記リストに含まれる住所情報と、前記修正トークン列との類似度を予測し、
前記特定部は、前記リストから、前記修正トークン列との類似度が最も高い住所情報を前記一致住所情報として特定する、請求項6に記載の情報処理装置。
【請求項8】
前記リストから、前記トークン列との類似度が最も高い住所情報を第1住所情報として選択する第1選択部と、
前記リストから、前記修正トークン列との類似度が最も高い住所情報を第2住所情報として選択する第2選択部を更に有し、
前記特定部は、前記第1住所情報と前記第2住所情報が異なる場合に、前記第2住所情報を前記一致住所情報として特定する、請求項7に記載の情報処理装置。
【請求項9】
前記リストから、前記トークン列との類似度が最も高い住所情報を第1住所情報として選択する第1選択部と、
前記リストから、前記修正トークン列との類似度が最も高い住所情報を第2住所情報として選択する第2選択部を更に有し、
前記特定部は、前記第1住所情報と前記第2住所情報が異なる場合に、前記第1住所情報と前記第2住所情報が異なる場合に、ユーザにより選択された前記第1住所情報または前記第2住所情報を前記一致住所情報として特定する、請求項7に記載の情報処理装置。
【請求項10】
前記トークン列を、前記コードのトークンより前の複数のトークンを含む住所テキストトークン列と、前記コードのトークン以降の1つ以上のトークンを含むコードトークン列とに分割する分割部を更に有し、
前記予測部は、前記リストのそれぞれの住所情報と、前記住所テキストトークン列との類似度と前記コードトークンとの類似度を、それぞれ住所テキスト類似度とコード類似度として予測し、
前記特定部は、前記リストから、前記住所テキスト類似度と前記コード類似度に基づいて、前記一致住所情報を特定する、請求項6に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明は、ジオコーディングのための技術に関する。
続きを表示(約 2,000 文字)【背景技術】
【0002】
従来、住所情報を緯度経度情報に変換するジオコーディング処理の技術が開発されている。例えば、特許文献1には、行政区画で階層的に構成された木構造を用いることにより、リアルタイムに、住所情報から緯度経度情報への変換を高速に行う住所/緯度経度変換装置が開示されている。
【0003】
具体的には、当該文献による住所/緯度経度変換装置は、住所情報を木構造に変換して、住所木情報を生成し、メモリに記憶させる。ここで、住所木情報は、第1階層(最上位層)をルートノードとし、第2階層を都道府県、第3階層を区または市町村、第4階層を市町村または区、第5階層以下を住居表示(街区符号および住居番号)または地番で構成される。さらに、住所木情報は、最下層のノードに緯度経度情報を関連付けるように構成される。これにより、与えられた住所情報から、当該住所情報に対する緯度緯度情報を効率的に探索することが可能となる。
【先行技術文献】
【特許文献】
【0004】
特開2016-091315号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
このように、従来では、住所情報から分割した、都道府県や市町村といった行政区画を表す文字列、すなわち、住所情報をトークン化した文字列(トークン)を利用したジオコーディングが行われている。ここで、トークン化が手作業で(マニュアルで)行われる場合、作業が煩雑であるだけでなく、住所に関する知識によってトークン化の精度が変わりうる。また、誤った住所情報に基づいてトークン化が行われた場合は、当該住所情報は現実には存在しないため、ジオコーディングが正確に行われない可能性がある。
【0006】
本発明は上記課題に鑑みてなされたものであり、住所情報からトークン化されたトークンを用いて精度高くジオコーディングを行うための技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
上記課題を解決するために、本発明による情報処理装置の一態様は、対象住所情報を、階層的な住所区分に対応する複数のトークンにトークン化してトークン列を生成する生成部と、所定の住所情報のリストに含まれる住所情報と、前記トークン列との類似度を予測する予測部と、前記リストから、前記トークン列との類似度が最も高い住所情報を一致住所情報として特定する特定部と、前記リストと、前記リストに含まれる住所情報に対応する緯度経度情報とが格納されたデータベースから、前記一致住所情報に対応する緯度経度情報を、前記対象住所情報の緯度経度情報として決定する決定部と、を有する。
【0008】
上記課題を解決するために、本発明による情報処理方法の一態様は、対象住所情報を、階層的な住所区分に対応する複数のトークンにトークン化してトークン列を生成することと、所定の住所情報のリストに含まれる住所情報と、前記トークン列との類似度を予測することと、前記リストから、前記トークン列との類似度が最も高い住所情報を一致住所情報として特定することと、前記リストと、前記リストに含まれる住所情報に対応する緯度経度情報とが格納されたデータベースから、前記一致住所情報に対応する緯度経度情報を、前記対象住所情報の緯度経度情報として決定すること、を含む。
【0009】
上記課題を解決するために、本発明による情報処理プログラム一態様は、情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、該コンピュータに、対象住所情報を、階層的な住所区分に対応する複数のトークンにトークン化してトークン列を生成する生成処理と、所定の住所情報のリストに含まれる住所情報と、前記トークン列との類似度を予測する予測処理と、前記リストから、前記トークン列との類似度が最も高い住所情報を一致住所情報として特定する特定処理と、前記リストと、前記リストに含まれる住所情報に対応する緯度経度情報とが格納されたデータベースから、前記一致住所情報に対応する緯度経度情報を、前記対象住所情報の緯度経度情報として決定する決定処理と、を含む処理を実行させるためのものである。
【発明の効果】
【0010】
本発明によれば、住所情報からトークン化されたトークンを用いて精度高くジオコーディングを行うことが可能となる。
上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。
【図面の簡単な説明】
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
裁判のAI化
1か月前
個人
フラワーコートA
11日前
個人
工程設計支援装置
3日前
個人
情報処理システム
1か月前
個人
記入設定プラグイン
1か月前
個人
検査システム
1か月前
個人
介護情報提供システム
18日前
個人
携帯情報端末装置
4日前
個人
設計支援システム
24日前
個人
設計支援システム
24日前
個人
不動産売買システム
1か月前
キヤノン電子株式会社
携帯装置
1か月前
株式会社サタケ
籾摺・調製設備
1か月前
株式会社カクシン
支援装置
27日前
個人
備蓄品の管理方法
1か月前
個人
アンケート支援システム
13日前
サクサ株式会社
中継装置
14日前
サクサ株式会社
中継装置
1か月前
キヤノン株式会社
情報処理装置
1か月前
個人
ジェスチャーパッドのガイド部材
17日前
キヤノン株式会社
情報処理装置
1か月前
キヤノン電子株式会社
名刺管理システム
1か月前
東洋電装株式会社
操作装置
1か月前
アスエネ株式会社
排水量管理方法
1か月前
東洋電装株式会社
操作装置
1か月前
株式会社アジラ
移動方向推定装置
12日前
個人
リテールレボリューションAIタグ
10日前
株式会社ワコム
電子消去具
1か月前
ホシデン株式会社
タッチ入力装置
1か月前
株式会社東芝
電子機器
1か月前
株式会社寺岡精工
システム
17日前
株式会社JVCケンウッド
管理装置
1か月前
株式会社ゼロワン
ケア支援システム
3日前
個人
パターン抽出方法及び通信多重化方法
1か月前
日本電気株式会社
システム及び方法
26日前
飛鳥興産株式会社
物品買取システム
6日前
続きを見る