TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025091546
公報種別
公開特許公報(A)
公開日
2025-06-19
出願番号
2023206812
出願日
2023-12-07
発明の名称
知識抽出装置及び知識抽出方法
出願人
株式会社日立製作所
代理人
弁理士法人サンネクスト国際特許事務所
主分類
G06F
16/28 20190101AFI20250612BHJP(計算;計数)
要約
【課題】
多くの人手を必要とせず、オントロジの変更に伴う対応工数を削減すること。
【解決手段】
知識抽出の対象となる事例文章を外部から受け付け、事例文章を対象文章データとして出力する文章入力部と、オントロジ定義データ、事例データ、対象文章データ及び所定のプロントテンプレートを含む知識抽出プロンプトを出力するプロンプト作成部と、知識抽出プロンプトと、知識抽出の抽出条件が定められた知識抽出制御設定データを入力として、知識抽出を実行すべき旨の知識抽出命令を出力する知識抽出制御部と、知識抽出命令を入力とし、抽出した知識に関する抽出知識を出力する言語モデルと、抽出知識を入力として、抽出知識の妥当性を検証する知識検証部と、を備える。
【選択図】 図1
特許請求の範囲
【請求項1】
抽出すべき知識のオントロジの定義を外部から受け付け、前記オントロジの定義をオントロジ定義データとして出力するオントロジ定義部と、
前記オントロジ定義データを入力とし、事例文章と、前記事例文章から抽出された抽出知識と、の組み合わせを事例として外部から受け付け、前記組み合わせを事例データとして出力する事例作成部と、
知識抽出の対象となる事例文章を外部から受け付け、前記事例文章を対象文章データとして出力する文章入力部と、
前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを入力とし、前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを含む知識抽出プロンプトを出力するプロンプト作成部と、
前記知識抽出プロンプトと、前記知識抽出の抽出条件が定められた知識抽出制御設定データを入力として、前記知識抽出を実行すべき旨の知識抽出命令を出力する知識抽出制御部と、
前記知識抽出命令を入力とし、抽出した知識に関する抽出知識を出力する言語モデルと、
前記抽出知識を入力として、前記抽出知識の妥当性を検証する知識検証部と、
を備えることを特徴とする知識抽出装置。
続きを表示(約 1,700 文字)
【請求項2】
前記知識検証部は、
前記抽出知識に関する抽出知識グラフを作成し、前記抽出知識の妥当性を検証する
ことを特徴とする請求項1に記載の知識抽出装置。
【請求項3】
前記知識検証部は、
前記抽出知識グラフに基づいて、入力された前記抽出知識が前記オントロジ定義データによる定義内容に照らして妥当であるか否かを判断する
ことを特徴とする請求項2に記載の知識抽出装置。
【請求項4】
前記知識検証部は、
前記抽出知識の妥当性の検証結果を出力する
ことを特徴とする請求項1に記載の知識抽出装置。
【請求項5】
前記知識検証部によって、入力された前記抽出知識が妥当であると判断された場合、前記抽出知識が蓄積される記憶部を備える
ことを特徴とする請求項3に記載の知識抽出装置。
【請求項6】
前記プロンプト作成部は、
前記言語モデルが処理しやすいようにデータを変換する変換部と、
前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを統合して前記知識抽出プロンプトを作成する情報統合部と、
を備えることを特徴とする請求項3に記載の知識抽出装置。
【請求項7】
前記オントロジ定義データは、
前記抽出知識を構成する要素である少なくとも1つのクラスと、
前記クラスがとるべき属性を表すプロパティと、を含み、
前記知識検証部は、
前記クラスが前記プロパティと整合性があるか否かに応じて前記抽出知識の妥当性を検証する
ことを特徴とする請求項3に記載の知識抽出装置。
【請求項8】
前記オントロジ定義データは、
前記抽出知識を構成する要素である少なくとも1つのクラスと、
前記クラスに対応するべきインスタンスと、を含み、
前記知識検証部は、
前記クラスが前記インスタンスと対応しているか否かに応じて前記抽出知識の妥当性を検証する
ことを特徴とする請求項3に記載の知識抽出装置。
【請求項9】
前記抽出知識と前記検証結果を入力として、確認及び修正を依頼する確認対象知識を出力する知識確認部と、
前記確認対象知識に対する、外部からの修正知識を受け付け、前記抽出知識を修正し、修正済抽出知識として出力する知識修正部と、
を備えることを特徴とする請求項4に記載の知識抽出装置。
【請求項10】
オントロジ定義部が、抽出すべき知識のオントロジの定義を外部から受け付け、前記オントロジの定義をオントロジ定義データとして出力するオントロジ定義ステップと、
事例作成部が、前記オントロジ定義データを入力とし、事例文章と、前記事例文章から抽出された抽出知識と、の組み合わせを事例として外部から受け付け、前記組み合わせを事例データとして出力する事例作成ステップと、
文章入力部が、知識抽出の対象となる事例文章を外部から受け付け、前記事例文章を対象文章データとして出力する文章入力ステップと、
プロンプト作成部が、前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを入力とし、前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを含む知識抽出プロンプトを出力するプロンプト作成ステップと、
知識抽出制御部が、前記知識抽出プロンプトと、前記知識抽出の抽出条件が定められた知識抽出制御設定データを入力として、前記知識抽出を実行すべき旨の知識抽出命令を出力する知識抽出制御ステップと、
知識検証部が、言語モデルを用いて、前記知識抽出命令を入力として、抽出した知識に関する抽出知識を出力させ、前記抽出知識の妥当性を検証する知識検証ステップと、
を有することを特徴とする知識抽出方法。
発明の詳細な説明
【技術分野】
【0001】
本発明は、知識抽出装置及び知識抽出方法に関し、例えば、特許文献や論文などの文献から知識を抽出する技術に関する知識抽出装置に適用して好適なものである。
続きを表示(約 2,400 文字)
【背景技術】
【0002】
特許文献や論文などの文献には、最新の研究成果に基づく知識が記述されている。これらの文献に記述された知識を用いることにより、研究動向の把握や最新のデータに基づく分析などを行うことができる。例えば、新規な材料の開発を目的として、特許文献や論文などの文献に記載されている実験データなどの知識を活用することにより、新規な材料の特性を予測する統計モデルなどを作成することができる。
【0003】
特許文献や論文などの文献は、自然文や図や表などから構成される非構造化データであることが多い。このため、データ分析などに活用するためには、当該文献から知識を抽出し、当該抽出した知識を、例えば、テーブルデータなどの構造化データに変換する必要がある。上述した抽出の作業は、人手で行われる場合が多く、例えば、特許文献や論文などの文献を各々読み解いて必要な知識を抽出することから、非常に手間が掛かるという問題点がある。また、特許文献や論文などの文献は、日々大量に公開されており、このような文献を人手で抽出することは現実的ではない。
【0004】
このような背景の下、特許文献1には、自然言語処理を用いて文献から有用な知識を自動で抽出する技術が開示されている。特許文献1に開示された技術では、領域固有の自然言語処理エンジン及び領域固有のオントロジに基づいて、文献から必要な情報を抽出している。ここで、オントロジとは、自然言語処理を用いて抽出すべき概念(クラス)やその関係(リレーション)を定義したものをいう。
【先行技術文献】
【特許文献】
【0005】
国際公開第2021/156684号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
特許文献1に開示された技術では、領域固有のオントロジに対応した自然言語処理エンジンをあらかじめ用意する必要があるが、領域によっては、完全なオントロジを事前に用意することは現実的ではなく、運用開始後にオントロジの変更が必要になる場合も多い。仮にオントロジの変更が行われると、それに対応して自然言語処理エンジンの変更が必要になる。自然言語エンジンには、ルールベース、機械学習などの手法が用いられる。このようなオントロジの変更が行われた際には、ルールの追加及び見直しや、教師データの作成及び再学習などの対応が必要になる。この対応は、通常、データサイエンティストなどによって人手で行う必要があり、対応工数が大きいという問題点があった。
【0007】
本発明は以上の点を考慮してなされたもので、多くの人手を必要とせず、オントロジの変更に伴う対応工数を削減することができる知識抽出装置及び知識抽出方法を提案しようとするものである。
【課題を解決するための手段】
【0008】
かかる課題を解決するため本発明においては、抽出すべき知識のオントロジの定義を外部から受け付け、前記オントロジの定義をオントロジ定義データとして出力するオントロジ定義部と、前記オントロジ定義データを入力とし、事例文章と、前記事例文章から抽出された抽出知識と、の組み合わせを事例として外部から受け付け、前記組み合わせを事例データとして出力する事例作成部と、知識抽出の対象となる事例文章を外部から受け付け、前記事例文章を対象文章データとして出力する文章入力部と、前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを入力とし、前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを含む知識抽出プロンプトを出力するプロンプト作成部と、前記知識抽出プロンプトと、前記知識抽出の抽出条件が定められた知識抽出制御設定データを入力として、前記知識抽出を実行すべき旨の知識抽出命令を出力する知識抽出制御部と、前記知識抽出命令を入力とし、抽出した知識に関する抽出知識を出力する言語モデルと、前記抽出知識を入力として、前記抽出知識の妥当性を検証する知識検証部と、を備えるようにした。
【0009】
また、本発明においては、オントロジ定義部が、抽出すべき知識のオントロジの定義を外部から受け付け、前記オントロジの定義をオントロジ定義データとして出力するオントロジ定義ステップと、事例作成部が、前記オントロジ定義データを入力とし、事例文章と、前記事例文章から抽出された抽出知識と、の組み合わせを事例として外部から受け付け、前記組み合わせを事例データとして出力する事例作成ステップと、文章入力部が、知識抽出の対象となる事例文章を外部から受け付け、前記事例文章を対象文章データとして出力する文章入力ステップと、プロンプト作成部が、前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを入力とし、前記オントロジ定義データ、前記事例データ、前記対象文章データ及び所定のプロントテンプレートを含む知識抽出プロンプトを出力するプロンプト作成ステップと、知識抽出制御部が、前記知識抽出プロンプトと、前記知識抽出の抽出条件が定められた知識抽出制御設定データを入力として、前記知識抽出を実行すべき旨の知識抽出命令を出力する知識抽出制御ステップと、知識検証部が、言語モデルを用いて、前記知識抽出命令を入力として、抽出した知識に関する抽出知識を出力させ、前記抽出知識の妥当性を検証する知識検証ステップと、を有するようにした。
【発明の効果】
【0010】
本発明によれば、多くの人手を必要とせず、オントロジの変更に伴う対応工数を削減することができる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社日立製作所
軌条車両
11日前
株式会社日立製作所
軌条車両
11日前
株式会社日立製作所
電力変換器
9日前
株式会社日立製作所
電力変換装置
15日前
株式会社日立製作所
電力変換装置
15日前
株式会社日立製作所
情報処理装置
12日前
株式会社日立製作所
撮像システム
19日前
株式会社日立製作所
情報処理装置
16日前
株式会社日立製作所
荷電粒子線装置
25日前
株式会社日立製作所
電力調整システム
24日前
株式会社日立製作所
対策計画作成支援装置
5日前
株式会社日立製作所
融通取引提案システム
22日前
株式会社日立製作所
塗装装置、及び塗装方法
19日前
株式会社日立製作所
埋設物判別装置及び方法
16日前
株式会社日立製作所
乗りかご及びエレベーター
5日前
株式会社日立製作所
認可システム及び認可方法
2日前
株式会社日立製作所
電池診断装置、電池診断方法
24日前
株式会社日立製作所
情報処理装置及び情報処理方法
5日前
株式会社日立製作所
知識抽出装置及び知識抽出方法
2日前
株式会社日立製作所
ネットワーク可視化装置及び方法
23日前
株式会社日立製作所
窒化処理部品およびその製造方法
11日前
株式会社日立製作所
設計支援装置および設計支援方法
18日前
株式会社日立製作所
水処理システム、及び水処理方法
12日前
株式会社日立製作所
部材管理装置、及び部材管理方法
24日前
株式会社日立製作所
匿名化システムおよび匿名化方法
22日前
株式会社日立製作所
営業支援装置、及び営業支援方法
5日前
株式会社日立製作所
情報処理システム及び指標算出方法
10日前
株式会社日立製作所
計画分析方法及び計画分析システム
4日前
株式会社日立製作所
分析システムおよび分析プログラム
9日前
株式会社日立製作所
計算機システム及びデータ管理方法
4日前
株式会社日立製作所
情報処理システム及び情報処理方法
25日前
株式会社日立製作所
通信中継システム及び通信中継装置
16日前
株式会社日立製作所
開発支援システム及び開発支援方法
18日前
株式会社日立製作所
計画分析方法及び計画分析システム
16日前
株式会社日立製作所
運行管理システムおよび運行管理方法
12日前
株式会社日立製作所
データ出力装置およびデータ出力方法
19日前
続きを見る
他の特許を見る