TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025093111
公報種別公開特許公報(A)
公開日2025-06-23
出願番号2023208640
出願日2023-12-11
発明の名称情報処理装置、情報処理方法およびプログラム
出願人株式会社東芝
代理人弁理士法人酒井国際特許事務所
主分類G06F 16/332 20250101AFI20250616BHJP(計算;計数)
要約【課題】より適切に情報を検索可能な情報処理装置、情報処理方法およびプログラムを提供する。
【解決手段】情報処理装置は、処理部を備える。処理部は、1つ以上の語句と1つ以上の論理演算子とを含む検索条件に含まれる1つ以上の語句ごとに、検索対象である複数の対象情報それぞれと、語句と、が関連する確からしさを表し、離散値で表される確信度を算出する。処理部は、1つ以上の語句ごとに、確信度に応じて定められた範囲内に含まれるように、対象情報と語句との類似度を変換した連続値であるスコアを算出する。処理部は、1つ以上の語句それぞれに対して算出されたスコアを、論理演算子に応じて定められた変換方法に従って変換スコアに変換する。
【選択図】図1
特許請求の範囲【請求項1】
1つ以上の語句と1つ以上の論理演算子とを含む検索条件に含まれる1つ以上の前記語句ごとに、検索対象である複数の対象情報それぞれと、前記語句と、が関連する確からしさを表し、離散値で表される確信度を算出し、
1つ以上の前記語句ごとに、前記確信度に応じて定められた範囲内に含まれるように、前記対象情報と前記語句との類似度を変換した連続値であるスコアを算出し、
1つ以上の前記語句それぞれに対して算出されたスコアを、前記論理演算子に応じて定められた変換方法に従って変換スコアに変換する、
処理部
を備える情報処理装置。
続きを表示(約 1,100 文字)【請求項2】
前記処理部は、
複数の前記対象情報ごとに、前記類似度に基づく順位と、前記対象情報が前記語句を含むか否かを示す判定情報と、を用いて、前記確信度を算出する、
請求項1に記載の情報処理装置。
【請求項3】
前記処理部は、
前記確信度を算出する前記対象情報の前記順位に対する、前記確信度を算出する前記対象情報の前記順位以上の順位の前記対象情報のうち、前記判定情報が前記語句を含むことを示す前記対象情報の個数の割合を用いて、前記確信度を算出する、
請求項2に記載の情報処理装置。
【請求項4】
前記処理部は、
前記類似度に基づく順位と、前記対象情報が前記語句に関連する情報として選択されたか否かを示す判定情報と、を用いて、前記確信度を算出する、
請求項1に記載の情報処理装置。
【請求項5】
前記処理部は、
前記範囲内で、前記類似度の大小関係を維持した値である前記スコアを算出する、
請求項1に記載の情報処理装置。
【請求項6】
前記処理部は、
線形補間または非線形補間により前記類似度を変換した前記スコアを算出する、
請求項5に記載の情報処理装置。
【請求項7】
前記論理演算子は、AND演算子を含み、
前記処理部は、
前記AND演算子が適用される2つの前記語句それぞれに対して算出された2つのスコアのうち小さいスコアに近い値を、2つの前記語句に対する前記変換スコアとして算出する、
請求項1に記載の情報処理装置。
【請求項8】
前記処理部は、
前記AND演算子が適用される2つの前記語句それぞれに対して算出された2つのスコアのうち小さいスコアの値を前記変換スコアとして算出する、
請求項7に記載の情報処理装置。
【請求項9】
前記論理演算子は、OR演算子を含み、
前記処理部は、
前記OR演算子が適用される2つの前記語句それぞれに対して算出された2つのスコアのうち大きいスコアに近い値を、2つの前記語句に対する前記変換スコアとして算出する、
請求項1に記載の情報処理装置。
【請求項10】
前記処理部は、
前記OR演算子が適用される2つの前記語句それぞれに対して算出された2つのスコアのうち大きいスコアの値を前記変換スコアとして算出する、
請求項9に記載の情報処理装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本発明の実施形態は、情報処理装置、情報処理方法およびプログラムに関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
近年、表現ベクトルを用いて情報を検索する技術が提案されている。この技術では、検索条件に含まれる各検索語、および、検索対象である文書は、表現ベクトルと呼ばれる高次元のベクトルで表される。表現ベクトルの求め方については様々な手法が提案されている。基本的には、類似する意味を持つ検索語および文書は、互いに類似する表現ベクトルを持つように学習される。
【0003】
このような表現ベクトルさえ学習できれば、例えば、“深層学習”と“ディープラーニング”とは類似する表現ベクトルを有することが期待できる。そして、“深層学習”の表現ベクトルと類似する表現ベクトルを有する文書を検索することは、“ディープラーニング”とも類似する文書を検索することを意味することになる。従って、類義語を幅広く扱うことができる。
【0004】
検索条件は、複数の検索語を含む場合がある。また、この場合、検索条件は、AND、ORおよびNOTなどの論理演算子を含む複雑な検索条件を記述することが可能である。表現ベクトルを用いた検索であって、かつ、論理演算子を含む複雑な検索条件を用いる検索について、検索条件に適合する情報をより適切に検索できるようにすることが求められている。
【先行技術文献】
【特許文献】
【0005】
国際公開第2021/005433号
特開2022-126131号公報
国際公開第2019/180546号
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、より適切に情報を検索可能な情報処理装置、情報処理方法およびプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
実施形態の情報処理装置は、処理部を備える。処理部は、1つ以上の語句と1つ以上の論理演算子とを含む検索条件に含まれる1つ以上の語句ごとに、検索対象である複数の対象情報それぞれと、語句と、が関連する確からしさを表し、離散値で表される確信度を算出する。処理部は、1つ以上の語句ごとに、確信度に応じて定められた範囲内に含まれるように、対象情報と語句との類似度を変換した連続値であるスコアを算出する。処理部は、1つ以上の語句それぞれに対して算出されたスコアを、論理演算子に応じて定められた変換方法に従って変換スコアに変換する。
【図面の簡単な説明】
【0008】
第1の実施形態の情報処理装置のブロック図。
文書DBのデータ構造の一例を示す図。
転置インデックスDBのデータ構造の一例を示す図。
単語ベクトルDBのデータ構造の一例を示す図。
文書ベクトルDBのデータ構造の一例を示す図。
類似度DBのデータ構造の一例を示す図。
確信度DBのデータ構造の一例を示す図。
スコアDBのデータ構造の一例を示す図。
第1の実施形態における検索処理のフローチャート。
確信度算出処理のフローチャート。
スコア算出処理のフローチャート。
スコア変換処理のフローチャート。
AND演算子を含む検索条件の場合の変換スコアの例を示す図。
OR演算子を含む検索条件の場合の変換スコアの例を示す図。
NOT演算子を含む検索条件の場合の変換スコアの例を示す図。
第2の実施形態の情報処理装置のブロック図。
フィードバックDBのデータ構造の一例を示す図。
確信度算出処理のフローチャート。
第3の実施形態の情報処理装置のブロック図。
入力画面の一例を示す図。
実施形態の情報処理装置のハードウェア構成図。
【発明を実施するための形態】
【0009】
以下に添付図面を参照して、この発明にかかる情報処理装置の好適な実施形態を詳細に説明する。
【0010】
近年、IoT(Internet of Things)の進展に伴い記憶装置が大規模化しつつあり、多種多様な文書データ(以下、単に文書ともいう)をサーバに記憶できるような環境が整いつつある。それに伴い利用者が入力した検索条件(検索式)に応じた文書を選定する需要が高まっている。このような文書検索の要求に対して、検索条件とのマッチングを用いた手法が主に活用されてきた。この手法は、利用者が入力した検索条件と(完全または部分)一致するような文書を選択する手法であり、多くの場面で活用されている。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

株式会社東芝
センサ
1か月前
株式会社東芝
回転電機
2か月前
株式会社東芝
立て看板
19日前
株式会社東芝
回転電機
2か月前
株式会社東芝
制御装置
21日前
株式会社東芝
回転電機
2か月前
株式会社東芝
半導体装置
27日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
19日前
株式会社東芝
半導体装置
2か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
25日前
株式会社東芝
真空バルブ
1か月前
株式会社東芝
アイソレータ
6日前
株式会社東芝
車両システム
1か月前
株式会社東芝
情報表示装置
2か月前
株式会社東芝
静止誘導電器
1か月前
株式会社東芝
配線支援装置
2か月前
株式会社東芝
電力変換装置
1か月前
株式会社東芝
静止誘導電器
1か月前
株式会社東芝
区分システム
26日前
株式会社東芝
スイッチギヤ
14日前
株式会社東芝
スイッチギヤ
1か月前
株式会社東芝
ディスク装置
18日前
株式会社東芝
電子計算機装置
2か月前
株式会社東芝
粒子線治療装置
1か月前
株式会社東芝
光注入同期装置
2か月前
株式会社東芝
電池モジュール
1か月前
株式会社東芝
紙葉類処理装置
5日前
株式会社東芝
物品区分システム
7日前
株式会社東芝
回転電機の回転子
2か月前
株式会社東芝
バックアップ回路
5日前
株式会社東芝
X線厚み測定装置
1か月前
株式会社東芝
磁気ディスク装置
27日前
株式会社東芝
有機物分解システム
1か月前
株式会社東芝
空転・滑走学習装置
1か月前
続きを見る