TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025115310
公報種別
公開特許公報(A)
公開日
2025-08-06
出願番号
2024009794
出願日
2024-01-25
発明の名称
検索装置、検索方法、及び検索プログラム
出願人
株式会社日立製作所
代理人
弁理士法人一色国際特許事務所
主分類
G06F
16/33 20250101AFI20250730BHJP(計算;計数)
要約
【課題】クエリテキストに類似するテキストを、その類似根拠とともに特定する。
【解決手段】検索装置は、複数の検索対象テキストから、入力されたクエリテキストに類似する1又は複数の類似テキストを検索する検索部と、各類似テキストについて、クエリテキストの各部分が、類似テキスト及びクエリテキストの間の類似度に寄与する程度を表す第1寄与率を算出する寄与率算出部と、各類似テキストについて、第1寄与率が所定の閾値以上の部分を、クエリテキスト及び類似テキストの間の類似性を根拠づけるクエリテキストの部分となる第1類似根拠部分と特定する類似根拠特定部と、類似テキスト及び第1類似根拠部分を出力する出力部と、を備える。
【選択図】図2
特許請求の範囲
【請求項1】
プロセッサ及びメモリを有し、
複数の検索対象テキストから、入力されたクエリテキストに類似する1又は複数の類似テキストを検索する検索部と、
各類似テキストについて、前記クエリテキストの各部分が、前記類似テキスト及び前記クエリテキストの間の類似度に寄与する程度を表す第1寄与率を算出する寄与率算出部と、
各類似テキストについて、前記第1寄与率が所定の閾値以上の部分を、前記クエリテキスト及び前記類似テキストの間の類似性を根拠づける前記クエリテキストの部分となる第1類似根拠部分と特定する類似根拠特定部と、
前記類似テキスト及び前記第1類似根拠部分を出力する出力部と、
を備える検索装置。
続きを表示(約 1,600 文字)
【請求項2】
各類似テキストについて、前記クエリテキストの各部分の前記第1寄与率を特徴量としたベクトルを生成し、生成した前記各類似テキストのベクトルをクラスタリングして前記ベクトルのグループを生成するグループ決定部と、
前記グループ毎に、前記クエリテキストの各部分について前記第1寄与率の平均値である平均寄与率を算出するグループ寄与率算出部と、
を備え、
前記類似根拠特定部は、前記平均寄与率が前記閾値以上の部分を、前記グループの前記第1類似根拠部分と特定し、
前記出力部は、前記グループ毎に、前記類似テキスト及び前記第1類似根拠部分を出力する、
請求項1に記載の検索装置。
【請求項3】
前記出力部は、前記グループ毎に、前記類似テキストに対応づけて、前記クエリテキストのうち前記第1類似根拠部分を強調表示する、
請求項2に記載の検索装置。
【請求項4】
前記寄与率算出部は、各類似テキストについて、前記類似テキストの各部分が、前記類似テキスト及び前記クエリテキストの間の類似度に寄与する程度を表す第2寄与率を算出し、
前記類似根拠特定部は、各類似テキストについて、前記第2寄与率が所定の閾値以上の部分を、前記クエリテキスト及び前記類似テキストの間の類似性を根拠づける前記類似テキストの部分となる第2類似根拠部分と特定し、
前記出力部は、前記類似テキスト、前記第1類似根拠部分、及び前記第2類似根拠部分を出力する、
請求項1に記載の検索装置。
【請求項5】
前記検索部は、テキストの単語埋込みベクトルに基づいて、前記クエリテキストと前記検索対象テキストとの間の前記類似度を算出する、
請求項1に記載の検索装置。
【請求項6】
前記クエリテキスト及び前記検索対象テキストは、ソースコードである、
請求項1に記載の検索装置。
【請求項7】
前記寄与率算出部は、各類似テキストについて、前記クエリテキストの各行が、前記類似テキスト及び前記クエリテキストの間の類似度に寄与する程度を表す第1寄与率を算出し、
前記類似根拠特定部は、各類似テキストについて、前記第1寄与率が所定の閾値以上の行を前記第1類似根拠部分と特定する、
請求項6に記載の検索装置。
【請求項8】
情報処理装置が、
複数の検索対象テキストから、入力されたクエリテキストに類似する1又は複数の類似テキストを検索する検索処理と、
各類似テキストについて、前記クエリテキストの各部分が、前記類似テキスト及び前記クエリテキストの間の類似度に寄与する程度を表す第1寄与率を算出する寄与率算出処理と、
各類似テキストについて、前記第1寄与率が所定の閾値以上の部分を、前記クエリテキスト及び前記類似テキストの間の類似性を根拠づける前記クエリテキストの部分となる第1類似根拠部分と特定する類似根拠特定処理と、
前記類似テキスト及び前記第1類似根拠部分を出力する出力処理と、
を実行する検索方法。
【請求項9】
情報処理装置に、
複数の検索対象テキストから、入力されたクエリテキストに類似する1又は複数の類似テキストを検索する検索処理と、
各類似テキストについて、前記クエリテキストの各部分が、前記類似テキスト及び前記クエリテキストの間の類似度に寄与する程度を表す第1寄与率を算出する寄与率算出処理と、
各類似テキストについて、前記第1寄与率が所定の閾値以上の部分を、前記クエリテキスト及び前記類似テキストの間の類似性を根拠づける前記クエリテキストの部分となる第1類似根拠部分と特定する類似根拠特定処理と、
前記類似テキスト及び前記第1類似根拠部分を出力する出力処理と、
を実行させる検索プログラム。
発明の詳細な説明
【技術分野】
【0001】
本発明は、検索装置、検索方法、及び検索プログラムに関する。
続きを表示(約 1,600 文字)
【背景技術】
【0002】
プログラムの開発において、ソースコードをレビューすることにより品質を確保することは重要である。そして、レビューにおいて不具合等が発見された場合には、そのコードと類似するコードを大量のソースコードから検索し、確認する必要がある。しかしながら、人手で大量のソースコードを確認すると、工数が多く発生し、また、確認漏れが発生するおそれがある。
【0003】
特許文献1には、単語埋込みモデルを用いて、クエリされているテキスト文書に類似する文書セグメントを出力する技術が開示されている。
【0004】
また、特許文献2には、訓練データを用いて訓練された機械学習モデルによる予測に対する個々の訓練データ点の影響を、SHAP(Shapley Additive exPlanations)を用いて算出する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
特表2022-536241号公報
特表2022-552980号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、上述した技術では、クエリされているクエリテキストの中に類似の根拠となり得る部分が複数含まれる場合に、異なる類似根拠による複数の類似テキストが検索結果に混在することがある。そのため、検索結果として得られた複数の類似テキストのそれぞれがクエリテキストのどの部分と類似するかを判別することが困難である。類似の根拠となり得る部分のみをクエリテキストとして検索すれば、その部分に類似するテキストのみを検索結果として得ることは可能だが、類似の根拠となり得る部分を検索前にユーザが把握することは難しい。
【0007】
本発明は、このような事情に鑑みてなされたものであり、その目的は、クエリテキストに類似するテキストを、その類似根拠とともに特定可能な検索装置、検索方法、及び検索プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記課題を解決するための本発明の一つは、プロセッサ及びメモリを有し、複数の検索対象テキストから、入力されたクエリテキストに類似する1又は複数の類似テキストを検索する検索部と、各類似テキストについて、前記クエリテキストの各部分が、前記類似テキスト及び前記クエリテキストの間の類似度に寄与する程度を表す第1寄与率を算出する寄与率算出部と、各類似テキストについて、前記第1寄与率が所定の閾値以上の部分を、前記クエリテキスト及び前記類似テキストの間の類似性を根拠づける前記クエリテキストの部分となる第1類似根拠部分と特定する類似根拠特定部と、前記類似テキスト及び前記第1類似根拠部分を出力する出力部と、を備える検索装置である。
【発明の効果】
【0009】
本発明によれば、クエリテキストに類似するテキストを、その類似根拠とともに特定することができる。
上記した以外の構成及び効果等は、以下の実施形態の説明により明らかにされる。
【図面の簡単な説明】
【0010】
検索システムのハードウェア構成例を示す図である。
検索システムの機能構成例を示すブロック図である。
第1の実施形態における検索システムで行われる処理の概要を説明する処理フロー図である。
類似コードを検索する処理の概要を説明する図である。
類似根拠を特定する処理の概要を説明する図である。
第1の実施形態における第1類似コード検索結果の一例を示す図である
第2の実施形態における検索システムで行われる処理の概要を説明する処理フロー図である。
第2の実施形態における第2類似コード検索結果の一例を示す図である。
【発明を実施するための形態】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社日立製作所
蓄電装置
6日前
株式会社日立製作所
制御基板
8日前
株式会社日立製作所
回転電機
21日前
株式会社日立製作所
回転電機
2日前
株式会社日立製作所
エレベーター
15日前
株式会社日立製作所
エレベーター
6日前
株式会社日立製作所
コントローラー
29日前
株式会社日立製作所
回転子および回転電機
1か月前
株式会社日立製作所
輸送計画装置及び方法
1日前
株式会社日立製作所
巻上機及びエレベーター
8日前
株式会社日立製作所
分析システム及び分析方法
15日前
株式会社日立製作所
エレベーター及び保護カバー
13日前
株式会社日立製作所
現新比較テスト支援システム
7日前
株式会社日立製作所
プログラム検証支援システム
2日前
株式会社日立製作所
療養指導支援装置および方法
6日前
株式会社日立製作所
接点浄化装置及び風力発電装置
7日前
株式会社日立製作所
釣合いおもり及びエレベーター
9日前
株式会社日立製作所
生産計画立案支援装置及び方法
1か月前
株式会社日立製作所
めっき装置及びめっき形成方法
21日前
株式会社日立製作所
情報提供装置及び情報提供方法
1か月前
株式会社日立製作所
振動解析装置および振動解析方法
1か月前
株式会社日立製作所
電力融通システム、電力システム
7日前
株式会社日立製作所
情報処理装置および情報処理方法
6日前
株式会社日立製作所
補修指示装置および補修指示方法
14日前
株式会社日立製作所
計算機システム及びデータ抽出方法
1か月前
株式会社日立製作所
契約照会システム及び契約照会方法
1日前
株式会社日立製作所
施策策定方法及び施策策定システム
2日前
株式会社日立製作所
画像解析システム及び画像解析方法
2日前
株式会社日立製作所
ラベル付与装置およびラベル付与方法
6日前
株式会社日立製作所
水素の混焼を制御する装置および方法
14日前
株式会社日立製作所
可搬記憶機器および情報処理システム
7日前
株式会社日立製作所
巻線切替回転電機および電動システム
1か月前
株式会社日立製作所
業務支援システム、及び業務支援方法
10日前
株式会社日立製作所
電力系統制御装置及び電力系統制御方法
13日前
株式会社日立製作所
電気機器、電気機器の筐体、及び航空機
3日前
株式会社日立製作所
判定システム、判定装置、及び判定方法
21日前
続きを見る
他の特許を見る