TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025079075
公報種別
公開特許公報(A)
公開日
2025-05-21
出願番号
2023191502
出願日
2023-11-09
発明の名称
検索式作成装置および検索式作成方法
出願人
株式会社日立製作所
代理人
ポレール弁理士法人
主分類
G06F
16/33 20250101AFI20250514BHJP(計算;計数)
要約
【課題】
入力テキストに対して、類似する文書を全文検索可能な検索式の作成を容易にすることを目的とする。
【解決手段】
入力テキスト1000に基づいて文書を検索するための検索式の作成を支援する検索式作成装置100において、前記入力テキストから抽出したキーワードを用いて検索式を作成する検索式作成部111と、前記検索式を用いて文書を検索して第1の文書集合を作成する検索実行部112と、前記第1の文書集合に対する評価結果に応じて、検索式を修正して検索式修正候補を作成する検索式修正候補作成部114と、前記第1の文書集合と、前記検索式修正候補を用いて作成される第2の文書集合の差分を示す差分集合であって、当該検索式作成装置のユーザに提示された差分集合に対する確認結果であるフィードバックを受け付け、当該確認結果に応じて、前記検索式修正候補から修正検索式を特定するフィードバック部115を有する。
【選択図】 図1
特許請求の範囲
【請求項1】
入力テキストに基づいて文書を検索するための検索式の作成を支援する検索式作成装置において、
前記入力テキストから抽出したキーワードを用いて検索式を作成する検索式作成部と、
前記検索式を用いて文書を検索して第1の文書集合を作成する検索実行部と、
前記第1の文書集合に対する評価結果に応じて、検索式を修正して検索式修正候補を作成する検索式修正候補作成部と、
前記第1の文書集合と、前記検索式修正候補を用いて作成される第2の文書集合の差分を示す差分集合であって、当該検索式作成装置のユーザに提示された差分集合に対する確認結果であるフィードバックを受け付け、当該確認結果に応じて、前記検索式修正候補から修正検索式を特定するフィードバック部を有する検索式作成装置。
続きを表示(約 1,100 文字)
【請求項2】
請求項1に記載の検索式作成装置において、
前記検索式、検索論理和ごとの前記第1の文書集合、前記検索式修正候補および検索論理和ごとの前記第2の文書集合を含む検索情報を作成する検索情報可視化部113をさらに有する検索式作成装置。
【請求項3】
請求項2に記載の検索式作成装置において、
前記検索式修正候補作成部は、前記差分集合に対するユーザからの前記フィードバックに応じて、前記評価結果を算出する検索式作成装置。
【請求項4】
請求項1に記載の検索式作成装置において、
前記検索実行部は、ベクトル検索を実行して、前記第1の文書集合、前記第2の文書集合および前記差分集合を作成し、
前記検索式修正候補作成部は、前記差分集合に含まれる前記入力テキストに対する類似度に応じて、前記評価結果を算出する検索式作成装置。
【請求項5】
入力テキストに基づいて文書を検索するための検索式の作成を支援する検索式作成装置による検索式作成方法において、
検索式作成部により、前記入力テキストから抽出したキーワードを用いて検索式を作成し、
検索実行部により、前記検索式を用いて文書を検索して第1の文書集合を作成し、
検索式修正候補作成部により、前記第1の文書集合に対する評価結果に応じて、検索式を修正して検索式修正候補を作成し、
フィードバック部により、前記第1の文書集合と、前記検索式修正候補を用いて作成される第2の文書集合の差分を示す差分集合であって、当該検索式作成装置のユーザに提示された差分集合に対する確認結果であるフィードバックを受け付け、当該確認結果に応じて、前記検索式修正候補から修正検索式を特定する検索式作成方法。
【請求項6】
請求項5に記載の検索式作成方法において、
検索情報可視化部により、前記検索式、検索論理和ごとの前記第1の文書集合、前記検索式修正候補および検索論理和ごとの前記第2の文書集合を含む検索情報を作成する検索式作成方法。
【請求項7】
請求項6に記載の検索式作成方法において、
前記検索式修正候補作成部により、前記差分集合に対するユーザからの前記フィードバックに応じて、前記評価結果を算出する検索式作成方法。
【請求項8】
請求項5に記載の検索式作成方法において、
前記検索実行部により、ベクトル検索を実行して、前記第1の文書集合、前記第2の文書集合および前記差分集合を作成し、
前記検索式修正候補作成部により、前記差分集合に含まれる前記入力テキストに対する類似度に応じて、前記評価結果を算出する検索式作成方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、文書の検索を支援するための技術に関する。
続きを表示(約 1,900 文字)
【背景技術】
【0002】
現在、文書データベースを検索する方法は複数存在する。1つはキーワードを入力してそのキーワードマッチングよりテキストを検索する方法であり、他にはテキストを入力してベクトルを作成し、文書データベース内の文書をベクトル化したものとの類似度に基づいて検索を行う方法がある。
【0003】
前者の方法は一般的にキーワード検索や全文検索と呼ばれ、広く用いられている。特に、特許検索においては、キーワードの論理式(検索論理式)を用いて全文検索する方法が一般的である。キーワード検索を採用している検索システムは、一般的にユーザの入力キーワードに対して同義語は考慮することがないため、例えば検索キーワードとして「窓」を入力して検索したとしても、同義語である「ウィンドウ」を「窓」と同義で用いている文書は検索されない。
【0004】
後者の手法は一般的にベクトル検索と呼ばれ、そのベクトル化手法にはTF-IDF、BM-25、BERT等が存在する。この検索方法では入力キーワードや入力テキストと、検索対象の文書内のキーワードが必ずしも一致している必要はなく、入力テキストと検索対象文書の類似度を測定し、類似度順に表示する形式となっている。このため、ベクトル検索はキーワード検索と比較して検索精度が高い傾向にある。
【0005】
しかしながら、上記のようなベクトルを用いた検索方式では、入力されたテキストに対してなぜその文書が検索されたのかというエビデンスを得ることが難しいため、検索式を用いて全文検索を行うことへの需要は依然として高い。一方で、ユーザが入力テキストから検索式を作成することは、キーワードの選定や同義語の考慮漏れを生じやすく、試行錯誤的な検索を行う必要があり、難易度が高い。以上のような検索に関しては、特許文献1が提案されている。特許文献1では、入力テキストを構成単位に分解し、検索クエリとして構成単位に含まれるキーワードに基づく構成単位ごとの検索式を作成する技術を開示している。
【先行技術文献】
【特許文献】
【0006】
国際公開第2021/245814号
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献1では、入力テキストから生成された検索式に対してユーザがキーワードを追加したり、検索範囲を変更したりといった編集を行うことが可能である。このように、文書検索においては、検索式を変更しながら試行錯誤的に、また、繰り返し実行されることが多い。試行錯誤的に検索を実行する場合、当初の検索式は粗削りであることが多く、精錬させより適切な検索式に変更する必要がある。
【0008】
しかしながら、検索式を変更した場合、必ずしもユーザが意図した文書集合が検索されるように変更されるとは限らない。例えば、経験の少ないユーザの場合、検索式を変更した結果、意図した文書が検索結果である文書集合から外れることがある。このため、検索式を変更する場合、より適切なもの、つまり、所望の文書が含まれる可能性がより高い文書集合を検索できるよう変更することが望まれる。しかしながら、特許文献1ではこの点について考慮されていなかった。
【0009】
なお、このように検索式をより適切なものに変更する場合、例えば、その前後での検索結果(文書集合)がどのように変化したか、つまり、意図した文書集合に近づいているかを確認することでも実現できる。しかしながら、特許文献1では、生成検索式はその入力テキストで表示されるのみであり、どのような文書集合が検索されるのかは把握できない。このため、その検索式の妥当性の判断がつかないまま、検索された文書一覧を確認することとなり、検索式を修正することのユーザ負担は大きい。そこで、本発明では、文書検索において、より適切な検索式の作成を支援することを目的とする。
【課題を解決するための手段】
【0010】
本発明では、入力テキストから作成した検索式での第1の文書集合に対する評価結果に応じて、検索式を修正ないし変更した検索式修正候補を作成し、第1の文書集合と、検索式修正候補での第2の文書集合の差分を示す差分集合を提示し、提示された差分集合に対する確認結果(フィードバック)に応じて、検索式修正候補から修正検索式を特定する。なお、本発明での「差分」とは、その相違が示されるものであればよく、変化など、他の表現も含まれる。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社日立製作所
撮像システム
3日前
株式会社日立製作所
情報処理装置
今日
株式会社日立製作所
融通取引提案システム
6日前
株式会社日立製作所
埋設物判別装置及び方法
今日
株式会社日立製作所
塗装装置、及び塗装方法
3日前
株式会社日立製作所
設計支援装置および設計支援方法
2日前
株式会社日立製作所
匿名化システムおよび匿名化方法
6日前
株式会社日立製作所
計画分析方法及び計画分析システム
今日
株式会社日立製作所
通信中継システム及び通信中継装置
今日
株式会社日立製作所
開発支援システム及び開発支援方法
2日前
株式会社日立製作所
データ出力装置およびデータ出力方法
3日前
株式会社日立製作所
移動体管制装置、車両管制方法、及び車両
6日前
株式会社日立製作所
マルチテナントサービス提供方法及びシステム
2日前
株式会社日立製作所
回転ガントリ、及びそれを用いた粒子線治療システム
今日
株式会社日立製作所
荷電粒子ビーム輸送装置及び荷電粒子ビームの中和方法
3日前
株式会社日立製作所
ユーザセントリックおよびLLM強化の適応型ETLコード合成
3日前
株式会社日立製作所
病的意義判定装置、病的意義判定方法、機械学習方法及び学習済みモデルの生成方法
2日前
株式会社日立製作所
ワークロード制御支援装置、及びワークロード制御支援方法
2日前
個人
非正規コート
1か月前
個人
政治のAI化
16日前
個人
物品給付年金
21日前
個人
RFタグ読取装置
1か月前
個人
人物再現システム
1か月前
個人
在宅介護システム
1か月前
個人
プラグインホームページ
7日前
個人
AI飲食最適化プラグイン
1か月前
キヤノン株式会社
通信装置
22日前
有限会社ノア
データ読取装置
1か月前
個人
電話管理システム及び管理方法
1か月前
キヤノン株式会社
画像処理装置
14日前
個人
広告提供システムおよびその方法
1か月前
個人
全アルゴリズム対応型プログラム
17日前
株式会社CROSLAN
支援装置
1か月前
大同特殊鋼株式会社
輝線検出方法
16日前
シャープ株式会社
電子機器
16日前
個人
日誌作成支援システム
1か月前
続きを見る
他の特許を見る