TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025112821
公報種別
公開特許公報(A)
公開日
2025-08-01
出願番号
2024007316
出願日
2024-01-22
発明の名称
情報処理装置および情報処理方法
出願人
株式会社日立製作所
代理人
弁理士法人サンネクスト国際特許事務所
主分類
G06F
16/36 20190101AFI20250725BHJP(計算;計数)
要約
【課題】
単語ペアを定義する工数を削減すること。
【解決手段】
抽出された単語から、所定の条件を満たすカテゴリ間の単語ペアを生成する単語ペア生成部と、検索キーワードの入力履歴を蓄積し、検索キーワードの入力履歴から取得したい単語間の関係性を推定する関係性推定部と、当該関係性に基づき、単語ペア初期辞書に登録する単語ペアの候補をフィルタリングするフィルタリング部と、単語ペアの候補を外部に提示するとともに単語ペア初期辞書に登録するか否かの判断の結果、単語ペア初期辞書に登録すると判断された単語ペアの候補を単語ペア初期辞書に登録する初期辞書登録部と、を有する。
【選択図】 図3
特許請求の範囲
【請求項1】
1つ以上の文により構成される文書情報から2つのカテゴリに属する単語間の関係性に基づいた単語ペア初期辞書の作成を支援する情報処理装置であって、
前記文書情報から前記2つのカテゴリに属する単語を抽出する単語抽出部と、
前記文書情報から前記2つのカテゴリの少なくともいずれかのカテゴリに属し、かつ、入力された検索キーワードに該当する単語を含むか否かを判定し、前記単語を含むと判定した前記文書情報を外部に提示する検索部と、
抽出された単語から、所定の条件を満たすカテゴリ間の単語ペアを生成する単語ペア生成部と、
前記検索キーワードの入力履歴を蓄積し、前記検索キーワードの入力履歴から取得したい単語間の関係性を推定する関係性推定部と、
前記関係性に基づき、前記単語ペア初期辞書に登録する単語ペアの候補をフィルタリングするフィルタリング部と、
前記単語ペアの候補を外部に提示するとともに前記単語ペア初期辞書に登録するか否かの判断の結果、前記単語ペア初期辞書に登録すると判断された前記単語ペアの候補を前記単語ペア初期辞書に登録する初期辞書登録部と、
を有することを特徴とする情報処理装置。
続きを表示(約 2,000 文字)
【請求項2】
前記各カテゴリにそれぞれ属する複数の単語が辞書として管理されるとともに、前記カテゴリに特有の単語にカテゴリ特有タグが付与されており、
前記単語ペア生成部は、前記所定の条件として、1つの文内に前記カテゴリに属する単語をそれぞれ1つ以上含み、かつ、1つの文内に少なくともいずれかのカテゴリの前記カテゴリ特有タグが付与されている単語を含む
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記単語ペアを抽出するためのモデルを管理するモデル管理テーブルを有し、
前記モデル管理テーブルは、
前記モデルの名称であるモデル名と、
前記モデルを生成際に用いた文書情報を特定する情報と、
前記単語間の関係性に関する関係性情報と、
2つのカテゴリ名と、
前記単語ペア初期辞書に関するカテゴリ間単語ペア初期辞書名と、を有し、
前記関係性推定部は、
前記検索キーワードの履歴からログインユーザの検索履歴レコードを取得し、前記検索履歴レコード毎の前記検索キーワードの組合せの出現頻度を算出し、
予め定める閾値以上の頻度の前記検索キーワードがある場合、前記モデル管理テーブルの各レコードの関係性情報と前記閾値以上の検索キーワードとの類似度を算出し、
当該類似度が予め定める閾値以上のレコードがあって、かつ、当該レコードの2つのカテゴリ名が前記2つのカテゴリではないときに、当該レコードの検索キーワードを関係性情報の候補とする
ことを特徴とする請求項1に記載の情報処理装置。
【請求項4】
前記関係性推定部は、
前記2つのカテゴリと前記検索キーワードの組を、前記モデル管理テーブルのレコードとの類似度算出の対象とし、当該検索キーワードの組を関係性とするレコードがない場合、前記検索キーワードの組を関係性情報の候補とし、前記検索キーワードの組を含む単語ペア抽出モデル作成を推薦する旨を作成し、外部へ提示する
ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記フィルタリング部は、
一つ以上の候補フィルタリングパターンと、
各候補フィルタリングパターンと合致するか否かを検証するフィルタリング検証処理と、を有し、
前記単語ペアの候補が前記関係性情報の候補に含まれているかどうかを判定し、前記単語ペアの候補が前記関係性情報の候補に含まれている場合、各候補フィルタリングパターンに紐づくフィルタリング検証処理を行い、前記フィルタリング検証処理において合致すると、当該単語ペア候補に候補フィルタリングパターンの識別情報を付加して初期辞書候補リストに追加する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記候補フィルタリングパターンは、
前記文書情報内に、少なくとも単語の意味を変化させる語句を含む
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記候補フィルタリングパターンは、
前記フィルタリング検証処理により検証した結果抽出された単語とその属するカテゴリとを含む
ことを特徴とする請求項5に記載の情報処理装置。
【請求項8】
1つ以上の文により構成される文書情報から2つのカテゴリに属する単語間の関係性に基づいた単語ペア初期辞書の作成を支援する情報処理装置の情報処理方法であって、
単語抽出部が、前記文書情報から、前記2つのカテゴリに属する単語を抽出する単語抽出ステップと、
検索部が、前記文書情報から前記2つのカテゴリの少なくともいずれかのカテゴリに属し、かつ、入力された検索キーワードに該当する単語を含むか否かを判定し、前記単語を含むと判定した前記文書情報を外部に提示する検索ステップと、
単語ペア生成部が、抽出した単語から、所定の条件を満たすカテゴリ間の単語ペアを生成する単語ペア生成ステップと、
フィルタリング部が、前記検索キーワードの入力履歴を蓄積し、前記検索キーワードの入力履歴から取得したい単語間の関係性を推定する関係性推定ステップと、
前記関係性に基づき、前記単語ペア初期辞書に登録する単語ペアの候補をフィルタリングするフィルタリングステップと、
初期辞書登録部が、前記単語ペアの候補を外部に提示するとともに前記単語ペア初期辞書に登録するか否かの判断の結果、前記単語ペア初期辞書に登録すると判断された前記単語ペアの候補を前記単語ペア初期辞書に登録する初期辞書登録ステップと、
を有することを特徴とする情報処理方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、情報処理装置および情報処理方法に関し、例えば、自然言語処理に用いる辞書の作成を支援する技術に関する情報処理装置および情報処理方法に適用して好適なものである。
続きを表示(約 2,500 文字)
【背景技術】
【0002】
近年、様々な分野において機械学習の利用が進んでいる。こうした機械学習の利用形態の一つに、多数の文書から様々な単語を抽出し、抽出した単語同士の関連性を学習して文書の構造を解析する文書解析技術がある。例えば、特許文献1には、入力した文書を文単位で構文を解析し、2つのカテゴリに属する単語間の関係性を定義するルールに従って単語ペアを抽出する方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
特開2023-72885号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に記載された技術において、文書内に含まれる単語が属する全てのカテゴリ間の関係性を定義するルールは、構文木のノード間の距離と単語の属するカテゴリとを紐付けて定義している。このため、特許文献1に記載された技術では、所望のカテゴリ間の関係性に基づいて単語ペアを抽出して単語ペアの初期辞書を作成することができず、これを実現しようとすると、手動で単語ペアを全て定義する必要があった。
【0005】
本発明は以上の点を考慮してなされたもので、単語ペアを定義する工数を削減することができる情報処理装置及び情報処理方法を提案しようとするものである。
【課題を解決するための手段】
【0006】
かかる課題を解決するため本発明においては、1つ以上の文により構成される文書情報から2つのカテゴリに属する単語間の関係性に基づいた単語ペア初期辞書の作成を支援する情報処理装置であって、前記文書情報から前記2つのカテゴリに属する単語を抽出する単語抽出部と、前記文書情報から前記2つのカテゴリの少なくともいずれかのカテゴリに属し、かつ、入力された検索キーワードに該当する単語を含むか否かを判定し、前記単語を含むと判定した前記文書情報を外部に提示する検索部と、抽出された単語から、所定の条件を満たすカテゴリ間の単語ペアを生成する単語ペア生成部と、前記検索キーワードの入力履歴を蓄積し、前記検索キーワードの入力履歴から取得したい単語間の関係性を推定する関係性推定部と、前記関係性に基づき、前記単語ペア初期辞書に登録する単語ペアの候補をフィルタリングするフィルタリング部と、前記単語ペアの候補を外部に提示するとともに前記単語ペア初期辞書に登録するか否かの判断の結果、前記単語ペア初期辞書に登録すると判断された前記単語ペアの候補を前記単語ペア初期辞書に登録する初期辞書登録部と、を有するようにした。
【0007】
また、本発明においては、1つ以上の文により構成される文書情報から2つのカテゴリに属する単語間の関係性に基づいた単語ペア初期辞書の作成を支援する情報処理装置の情報処理方法であって、単語抽出部が、前記文書情報から、前記2つのカテゴリに属する単語を抽出する単語抽出ステップと、検索部が、前記文書情報から前記2つのカテゴリの少なくともいずれかのカテゴリに属し、かつ、入力された検索キーワードに該当する単語を含むか否かを判定し、前記単語を含むと判定した前記文書情報を外部に提示する検索ステップと、単語ペア生成部が、抽出した単語から、所定の条件を満たすカテゴリ間の単語ペアを生成する単語ペア生成ステップと、フィルタリング部が、前記検索キーワードの入力履歴を蓄積し、前記検索キーワードの入力履歴から取得したい単語間の関係性を推定する関係性推定ステップと、前記関係性に基づき、前記単語ペア初期辞書に登録する単語ペアの候補をフィルタリングするフィルタリングステップと、初期辞書登録部が、前記単語ペアの候補を外部に提示するとともに前記単語ペア初期辞書に登録するか否かの判断の結果、前記単語ペア初期辞書に登録すると判断された前記単語ペアの候補を前記単語ペア初期辞書に登録する初期辞書登録ステップと、を有するようにした。
【発明の効果】
【0008】
本発明によれば、単語ペアを定義する工数を削減することができる。
【図面の簡単な説明】
【0009】
本実施形態に係る情報処理装置を含む情報処理システムの構成例を示すブロック図である。
図1に示す情報処理システムの計算機の構成例を示すブロック図である。
主記憶装置に記憶される単語抽出処理プログラム及び情報等の一例を示す図である。
カテゴリ辞書の一例を示す図である。
関連語辞書の一例を示す図である。
変化語管理テーブルの一例を示す図である。
モデル管理テーブルの一例を示す図である。
文章データの一例を示す図である。
検索キーワード履歴管理テーブルの一例を示す図である。
関係性情報候補リストの一例を示す図である。
候補フィルタリングパターンの一例を示す図である。
候補フィルタリング処理リストの一例を示す図である。
カテゴリ間単語ペア初期辞書の一例を示す図である。
抽出単語・単語ペアDBの一例を示す図である。
図1の情報処理装置が提示する操作画面の一例を示す図である。
図1の情報処理装置が提示する操作画面の一例を示す図である。
初期辞書作成支援処理の手順の一例を示すフローチャートである。
単語ペア関係性取得処理の手順の一例を示すフローチャートである。
図17に示す単語ペア候補フィルタリング処理の手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、図面に基づいて、本発明の一実施形態を詳細に説明する。但し、本発明は以下に示す実施例の記載内容に限定して解釈されるものではない。本発明の思想ないし趣旨から逸脱しない範囲で、その具体的構成を変更しうることは当業者であれば容易に理解される。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
個人
裁判のAI化
18日前
個人
情報処理システム
25日前
個人
介護情報提供システム
4日前
個人
設計支援システム
10日前
個人
設計支援システム
10日前
株式会社サタケ
籾摺・調製設備
26日前
キヤノン電子株式会社
携帯装置
26日前
株式会社カクシン
支援装置
13日前
個人
備蓄品の管理方法
25日前
サクサ株式会社
中継装置
今日
サクサ株式会社
中継装置
26日前
個人
ジェスチャーパッドのガイド部材
3日前
キヤノン株式会社
情報処理装置
26日前
キヤノン株式会社
情報処理装置
26日前
東洋電装株式会社
操作装置
26日前
株式会社寺岡精工
システム
3日前
東洋電装株式会社
操作装置
26日前
アスエネ株式会社
排水量管理方法
26日前
日本電気株式会社
システム及び方法
12日前
株式会社アザース
企業連携システム
4日前
株式会社リ・パワー
電力入札システム
今日
個人
会話評価装置
10日前
株式会社mov
情報処理システム
12日前
株式会社NONAME
物々交換システム
25日前
個人
竹資源の生産・販売・分配システム
7日前
アスエネ株式会社
廃棄物排出量管理方法
26日前
国立大学法人大阪大学
漏洩情報抑制回路
10日前
株式会社セラク
集出荷方法及びシステム
11日前
キヤノン株式会社
通信端末
27日前
株式会社カノア
物流業務事故予測システム
25日前
本田技研工業株式会社
画像処理装置
3日前
株式会社カノア
物流拠点無人監視システム
25日前
株式会社寺岡精工
システム、サーバ
25日前
日本放送協会
用語検出装置及びプログラム
12日前
協栄産業株式会社
乱数生成装置
25日前
株式会社デンソー
電子制御装置
12日前
続きを見る
他の特許を見る