TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025109137
公報種別公開特許公報(A)
公開日2025-07-24
出願番号2024002871
出願日2024-01-11
発明の名称問答文検索装置及び問答文検索プログラム
出願人株式会社NDKCOM
代理人個人,個人,個人
主分類G06F 16/90 20190101AFI20250716BHJP(計算;計数)
要約【課題】質問に基づいて入力された文字列が完全な文章でなくとも、質問に適した問答文を安定して検索可能な問答文検索装置及び問答文検索プログラムを提供する。
【解決手段】対となる質問テキスト文11及び回答テキスト文12からなる問答文13を記憶したテキスト記憶部14と、質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列15を基に入力文字列15に対応する問答文13を検索する検索手段とを有する問答文検索装置であって、複数の質問テキスト文11をベクトルにそれぞれ変換した複数の質問ベクトル21を記憶したベクトル記憶部22と、入力文字列15を入力ベクトル20に変換するベクトル変換手段19とを備え、検索手段は、入力ベクトル20に対する質問ベクトル21の類似度として、コサイン類似度を補正した修正コサイン類似度を採用して、入力文字列15に対応する問答文13に優先的に選出する問答文13を決定する。
【選択図】図2
特許請求の範囲【請求項1】
それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文を記憶したテキスト記憶部と、質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に該入力文字列に対応する前記問答文を検索する検索手段とを有する問答文検索装置であって、
複数の前記質問テキスト文を特徴空間のベクトルにそれぞれ変換した複数の質問ベクトルを記憶したベクトル記憶部と、
前記入力文字列を前記特徴空間のベクトルで表現した入力ベクトルに変換するベクトル変換手段とを備え、
前記検索手段は、前記入力ベクトルに対する前記質問ベクトルの類似度として、コサイン類似度を補正した修正コサイン類似度を採用し、該修正コサイン類似度が大きい前記質問ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出し、
前記修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記質問ベクトルの基となった前記質問テキスト文に含まれている語句との一致割合が高いほど、大きくなることを特徴とする問答文検索装置。
続きを表示(約 3,500 文字)【請求項2】
請求項1記載の問答文検索装置において、前記ベクトル記憶部に記憶されている前記質問ベクトルの数をN個とした際、前記検索手段は、近似最近傍検索によって、前記N個より少ない数の前記質問ベクトルを、前記修正コサイン類似度を算出する対象として選択することを特徴とする問答文検索装置。
【請求項3】
それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文を記憶したテキスト記憶部と、質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に該入力文字列に対応する前記問答文を検索する検索手段とを有する問答文検索装置であって、
複数の前記回答テキスト文を特徴空間のベクトルにそれぞれ変換した複数の回答ベクトルを記憶したベクトル記憶部と、
前記入力文字列を前記特徴空間のベクトルで表現した入力ベクトルに変換するベクトル変換手段とを備え、
前記検索手段は、前記入力ベクトルに対する前記回答ベクトルの類似度として、コサイン類似度を補正した修正コサイン類似度を採用し、該修正コサイン類似度が大きい前記回答ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出し、
前記修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記回答ベクトルの基となった前記回答テキスト文に含まれている語句との一致割合が高いほど、大きくなることを特徴とする問答文検索装置。
【請求項4】
請求項3記載の問答文検索装置において、前記ベクトル記憶部に記憶されている前記回答ベクトルの数をM個とした際、前記検索手段は、近似最近傍検索によって、前記M個より少ない数の前記回答ベクトルを、前記修正コサイン類似度を算出する対象として選択することを特徴とする問答文検索装置。
【請求項5】
それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文を記憶したテキスト記憶部と、質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に該入力文字列に対応する前記問答文を検索する検索手段とを有する問答文検索装置であって、
複数の前記質問テキスト文を特徴空間のベクトルにそれぞれ変換した複数の質問ベクトル及び複数の前記回答テキスト文を前記特徴空間のベクトルにそれぞれ変換した複数の回答ベクトルを記憶したベクトル記憶部と、
前記入力文字列を前記特徴空間のベクトルで表現した入力ベクトルに変換するベクトル変換手段とを備え、
前記検索手段は、前記入力ベクトルに対する前記質問ベクトルの類似度及び該入力ベクトルに対する前記回答ベクトルの類似度として、コサイン類似度をそれぞれ補正した第1及び第2の修正コサイン類似度をそれぞれ採用し、該第1の修正コサイン類似度が大きい前記質問ベクトルに対応する前記問答文及び前記第2の修正コサイン類似度が大きい前記回答ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出し、
前記第1の修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記質問ベクトルの基となった前記質問テキスト文に含まれている語句との一致割合が高いほど、大きくなり、前記第2の修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記回答ベクトルの基となった前記回答テキスト文に含まれている語句との一致割合が高いほど、大きくなることを特徴とする問答文検索装置。
【請求項6】
請求項5記載の問答文検索装置において、前記ベクトル記憶部に記憶されている前記質問ベクトルの数及び前記回答ベクトルの数をそれぞれN個及びM個とした際、前記検索手段は、近似最近傍検索によって、前記N個より少ない数の前記質問ベクトルを前記第1の修正コサイン類似度の算出対象として選択し、前記M個より少ない数の前記回答ベクトルを前記第2の修正コサイン類似度の算出対象として選択することを特徴とする問答文検索装置。
【請求項7】
質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に、テキスト記憶部に記憶されている、それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文から、前記入力文字列に対応する前記問答文を検索する処理を、コンピュータに行わせる問答文検索プログラムであって、
前記入力文字列を特徴空間のベクトルで表現した入力ベクトルに変換する処理と、
複数の前記質問テキスト文を前記特徴空間のベクトルにそれぞれ変換した複数の質問ベクトルの、前記入力ベクトルに対する各類似度として、コサイン類似度を補正した修正コサイン類似度を採用し、該修正コサイン類似度が大きい前記質問ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出する処理とを、前記コンピュータに行わせ、
前記修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記質問ベクトルの基となった前記質問テキスト文に含まれている語句との一致割合が高いほど、大きくなることを特徴とする問答文検索プログラム。
【請求項8】
質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に、テキスト記憶部に記憶されている、それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文から、前記入力文字列に対応する前記問答文を検索する処理を、コンピュータに行わせる問答文検索プログラムであって、
前記入力文字列を特徴空間のベクトルで表現した入力ベクトルに変換する処理と、
複数の前記回答テキスト文を前記特徴空間のベクトルにそれぞれ変換した複数の回答ベクトルの、前記入力ベクトルに対する各類似度として、コサイン類似度を補正した修正コサイン類似度を採用し、該修正コサイン類似度が大きい前記回答ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出する処理とを、前記コンピュータに行わせ、
前記修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記回答ベクトルの基となった前記回答テキスト文に含まれている語句との一致割合が高いほど、大きくなることを特徴とする問答文検索プログラム。
【請求項9】
質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に、テキスト記憶部に記憶されている、それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文から、前記入力文字列に対応する前記問答文を検索する処理を、コンピュータに行わせる問答文検索プログラムであって、
前記入力文字列を特徴空間のベクトルで表現した入力ベクトルに変換する処理と、
複数の前記質問テキスト文を前記特徴空間のベクトルにそれぞれ変換した複数の質問ベクトルの、前記入力ベクトルに対する各類似度として、コサイン類似度を補正した第1の修正コサイン類似度を採用し、該第1の修正コサイン類似度が大きい前記質問ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出する処理と、
複数の前記回答テキスト文を前記特徴空間のベクトルにそれぞれ変換した複数の回答ベクトルの、前記入力ベクトルに対する各類似度として、コサイン類似度を補正した第2の修正コサイン類似度を採用し、該第2の修正コサイン類似度が大きい前記回答ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出する処理とを、前記コンピュータに行わせ、
前記第1の修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記質問ベクトルの基となった前記質問テキスト文に含まれている語句との一致割合が高いほど、大きくなり、前記第2の修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記回答ベクトルの基となった前記回答テキスト文に含まれている語句との一致割合が高いほど、大きくなることを特徴とする問答文検索プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、質問を表すものとして入力された文字列に対応する問答文を検索する問答文検索装置及び問答文検索プログラムに関する。
続きを表示(約 2,800 文字)【背景技術】
【0002】
コールセンターのオペレータ業務のように問い合わせに対して回答を返す現場では、問い合わせ内容に対応する回答文を検索して出力(例えば、モニタに表示)するシステムが利用され、その具体例が特許文献1に記載されている。特許文献1に記載されたシステムは、問い合わせが想定される質問及びその質問に対する回答の組み合わせからなるFAQを記憶したデータベースを具備している。
【0003】
当該システムは、質問者と質問者から質問を受けた応対者の会話からキーワードの抽出等を行って検索クエリを生成し、その検索クエリを基に、データベースに記憶されている問答文(FAQ)を対象に、質問者からの質問に対応する問答文を検索してモニタに表示する。このシステムを利用すれば、応対者はモニタに表示された問答文を参照して質問者に返す回答を決定できる。
特許文献1には、検索クエリを基にした最適な問答文の検索を、検索クエリと問答文のキーワードマッチや概念検索によってなす旨が開示されている。
【0004】
ここで、検索クエリ及び問答文は共に文字列であるところ、異なる文字列について各文字列が有する意味の類似性を比較する手法として、例えば、特許文献2に記載されたコサイン類似度の採用が考えられる。コサイン類似度は、文字列を特徴空間のベクトルとして表現し、ベクトルのなす角度から異なる文字列の意味の類似度を数値で定量的に表すものである。ベクトルが文字列の持つ意味を表現することを考慮すると、文字列の持つ意味が一意に定義できることが重要である。
【先行技術文献】
【特許文献】
【0005】
特開2022-66489号公報
特開2023-084644号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
この点、例えば、コールセンターのオペレータ業務において、応対者が質問者との会話を通じて回答を検索するためのキーワードを入力し、データベースに記憶している問答文から適切な問答文を検索する場合、即ち、文章として成立しておらず、意味を一意に定めることができない文字列(例えば、3つの名詞がスペースを空けて入力された文字列)を基に問答文を検索する場合、単純にコサイン類似度を利用しても質問に対応する問答文が検索できないという問題が生じる。
【0007】
本発明は、かかる事情に鑑みてなされたもので、質問に基づいて入力された文字列が完全な文章でなくとも、質問に適した問答文を安定して検索可能な問答文検索装置及び問答文検索プログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
前記目的に沿う第1の発明に係る問答文検索装置は、それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文を記憶したテキスト記憶部と、質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に該入力文字列に対応する前記問答文を検索する検索手段とを有する問答文検索装置であって、複数の前記質問テキスト文を特徴空間のベクトルにそれぞれ変換した複数の質問ベクトルを記憶したベクトル記憶部と、前記入力文字列を前記特徴空間のベクトルで表現した入力ベクトルに変換するベクトル変換手段とを備え、前記検索手段は、前記入力ベクトルに対する前記質問ベクトルの類似度として、コサイン類似度を補正した修正コサイン類似度を採用し、該修正コサイン類似度が大きい前記質問ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出し、前記修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記質問ベクトルの基となった前記質問テキスト文に含まれている語句との一致割合が高いほど、大きくなる。
【0009】
前記目的に沿う第2の発明に係る問答文検索装置は、それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文を記憶したテキスト記憶部と、質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に該入力文字列に対応する前記問答文を検索する検索手段とを有する問答文検索装置であって、複数の前記回答テキスト文を特徴空間のベクトルにそれぞれ変換した複数の回答ベクトルを記憶したベクトル記憶部と、前記入力文字列を前記特徴空間のベクトルで表現した入力ベクトルに変換するベクトル変換手段とを備え、前記検索手段は、前記入力ベクトルに対する前記回答ベクトルの類似度として、コサイン類似度を補正した修正コサイン類似度を採用し、該修正コサイン類似度が大きい前記回答ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出し、前記修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記回答ベクトルの基となった前記回答テキスト文に含まれている語句との一致割合が高いほど、大きくなる。
【0010】
前記目的に沿う第3の発明に係る問答文検索装置は、それぞれ対となる質問テキスト文及び回答テキスト文からなる複数の問答文を記憶したテキスト記憶部と、質問を表す文字列として与えられる1つ又は複数の語句からなる入力文字列を基に該入力文字列に対応する前記問答文を検索する検索手段とを有する問答文検索装置であって、複数の前記質問テキスト文を特徴空間のベクトルにそれぞれ変換した複数の質問ベクトル及び複数の前記回答テキスト文を前記特徴空間のベクトルにそれぞれ変換した複数の回答ベクトルを記憶したベクトル記憶部と、前記入力文字列を前記特徴空間のベクトルで表現した入力ベクトルに変換するベクトル変換手段とを備え、前記検索手段は、前記入力ベクトルに対する前記質問ベクトルの類似度及び該入力ベクトルに対する前記回答ベクトルの類似度として、コサイン類似度をそれぞれ補正した第1及び第2の修正コサイン類似度をそれぞれ採用し、該第1の修正コサイン類似度が大きい前記質問ベクトルに対応する前記問答文及び前記第2の修正コサイン類似度が大きい前記回答ベクトルに対応する前記問答文ほど、前記入力文字列に対応する前記問答文として優先的に選出し、前記第1の修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記質問ベクトルの基となった前記質問テキスト文に含まれている語句との一致割合が高いほど、大きくなり、前記第2の修正コサイン類似度は、前記入力ベクトルの基となった前記入力文字列に含まれている語句と前記回答ベクトルの基となった前記回答テキスト文に含まれている語句との一致割合が高いほど、大きくなる。
(【0011】以降は省略されています)

この特許をJ-PlatPatで参照する

関連特許

個人
対話装置
1か月前
個人
情報処理装置
1か月前
個人
物品給付年金
2か月前
個人
政治のAI化
2か月前
個人
裁判のAI化
11日前
個人
情報処理システム
18日前
個人
RFタグ読取装置
2か月前
個人
在宅介護システム
2か月前
個人
記入設定プラグイン
1か月前
個人
情報処理装置
1か月前
個人
検査システム
20日前
個人
設計支援システム
3日前
個人
設計支援システム
3日前
個人
プラグインホームページ
2か月前
株式会社サタケ
籾摺・調製設備
19日前
キヤノン電子株式会社
携帯装置
19日前
個人
不動産売買システム
26日前
個人
情報入力装置
1か月前
キヤノン株式会社
通信装置
2か月前
個人
物価スライド機能付生命保険
1か月前
株式会社カクシン
支援装置
6日前
個人
備蓄品の管理方法
18日前
個人
マイホーム非電子入札システム
1か月前
キヤノン株式会社
情報処理装置
19日前
株式会社BONNOU
管理装置
1か月前
個人
全アルゴリズム対応型プログラム
2か月前
サクサ株式会社
中継装置
19日前
キヤノン株式会社
画像処理装置
2か月前
キヤノン株式会社
情報処理装置
19日前
アスエネ株式会社
排水量管理方法
19日前
ホシデン株式会社
タッチ入力装置
26日前
株式会社ワコム
電子消去具
26日前
東洋電装株式会社
操作装置
19日前
キヤノン電子株式会社
名刺管理システム
20日前
シャープ株式会社
電子機器
2か月前
大同特殊鋼株式会社
輝線検出方法
2か月前
続きを見る