TOP特許意匠商標
特許ウォッチ Twitter
公開番号2025146406
公報種別公開特許公報(A)
公開日2025-10-03
出願番号2024047157
出願日2024-03-22
発明の名称知識グラフ生成装置、知識グラフ生成方法、及び知識グラフ生成プログラム
出願人KDDI株式会社
代理人個人
主分類G06F 16/28 20190101AFI20250926BHJP(計算;計数)
要約【課題】エッジに信頼性を付与した知識グラフを生成する知識グラフ生成装置を提供すること。
【解決手段】知識グラフ生成装置10は、情報ソースからテキストデータを取得するテキストデータ取得部121と、テキストデータをクレンジングするクレンジング処理部122と、クレンジングされたテキストデータに情報抽出モデルを適用して、トリプルを抽出するトリプル抽出部131と、トリプルの信頼性に基づく重みを前記トリプルに付与する重み付け部132と、を含む。
【選択図】図1
特許請求の範囲【請求項1】
情報ソースからテキストデータを取得するテキストデータ取得部と、
前記テキストデータをクレンジングするテキストデータクレンジング処理部と、
クレンジングされたテキストデータに情報抽出モデルを適用して、トリプルを抽出するトリプル抽出部と、
前記トリプルの信頼性に基づく重みを前記トリプルに付与する重み付け部と、
を含む知識グラフ生成装置。
続きを表示(約 830 文字)【請求項2】
前記トリプルの信頼性が、前記情報ソースの信頼性である、請求項1に記載の知識グラフ生成装置。
【請求項3】
前記トリプルの信頼性が、前記情報抽出モデルの信頼性である、請求項1に記載の知識グラフ生成装置。
【請求項4】
前記トリプルの信頼性が、前記情報ソースの信頼性と前記情報抽出モデルの信頼性の乗算値である、請求項1に記載の知識グラフ生成装置。
【請求項5】
前記トリプルの信頼性が、前記情報抽出モデルのニューラルネットワークの最終層のソフトマックス関数の出力値である、請求項1に記載の知識グラフ生成装置。
【請求項6】
前記トリプルの信頼性が、前記情報ソースの信頼性と前記情報抽出モデルのニューラルネットワークの最終層のソフトマックス関数の出力値の乗算値である、請求項1に記載の知識グラフ生成装置。
【請求項7】
情報ソースからテキストデータを取得するテキストデータ取得ステップと、
前記テキストデータをクレンジングするテキストデータクレンジング処理ステップと、
クレンジングされたテキストデータに情報抽出モデルを適用して、トリプルを抽出するトリプル抽出ステップと、
前記トリプルの信頼性に基づく重みを前記トリプルに付与する重み付けステップと、
を含む知識グラフ生成方法。
【請求項8】
情報ソースからテキストデータを取得するテキストデータ取得ステップと、
前記テキストデータをクレンジングするテキストデータクレンジング処理ステップと、
クレンジングされたテキストデータに情報抽出モデルを適用して、トリプルを抽出するトリプル抽出ステップと、
前記トリプルの信頼性に基づく重みを前記トリプルに付与する重み付けステップと、
をコンピュータに実行させる、知識グラフ生成プログラム。

発明の詳細な説明【技術分野】
【0001】
本発明は、テキストから知識グラフを自動的に生成する装置であって、情報ソースの信頼性と情報抽出モデルの信頼性に基づく重みを付加した知識グラフを構築する装置に関する。
続きを表示(約 1,700 文字)【背景技術】
【0002】
従来、ビデオから画像情報とテキスト情報を抽出し、それぞれについて重み付き知識グラフを生成している。(特許文献1)
従来、複数の文書から抽出された複数の単語間の関連性スコアを重みとして持つ重み付き知識グラフを生成している。(特許文献2)
従来、重み付き知識グラフの埋め込み手法を提案している。(非特許文献1)
従来、不確実な情報を含むWeb上のテキストに対して確率的分類法を用いて、自動的に正確な知識・曖昧な知識を推論するフレームワークを提案している。(非特許文献2)
【先行技術文献】
【特許文献】
【0003】
特表2022-502376号公報
特表2023-513886号公報
【非特許文献】
【0004】
Kun, Kong Wei, et al. "WeExt: A Framework of Extending Deterministic Knowledge Graph Embedding Models for Embedding Weighted Knowledge Graphs." IEEE Access (2023).
Wu, Wentao, et al. "Probase: A probabilistic taxonomy for text understanding." Proceedings of the 2012 ACM SIGMOD international conference on management of data. 2012.
【発明の概要】
【発明が解決しようとする課題】
【0005】
WebページSNSの投稿などにより、様々な情報が公開されている。一方、セキュリティドメインにおいては、様々な脅威情報が、SNS等のプラットフォームに公開されており、これらを早期に収集して利用することが肝要である。しかしながら、WebページやSNSの投稿は自然言語で記載されているため、機械的処理への適用が難しい。
【0006】
自然言語で記載された非構造化データを効率的に活用するには、一度構造化データに変換することが必要である。しかし、テキストから必要なデータを人手で抽出し、構造化データに変換することはコストが高い。そのため、自然言語処理を用いて自動で情報抽出を行うことが望ましい。
【0007】
情報抽出を行い変換できる構造化データの1つに、知識グラフと呼ばれる構造化形式がある。知識グラフはエンティティ(entity:物、実体)をノード(node)とし、関係性をエッジ(edge:辺)とした柔軟なグラフ構造を持っている。
【0008】
情報抽出技術を用いて、主語(subject)/述語(predicate)/目的語(object)の組(この3つの要素の組を「トリプル(triple)」という。)を適切に文章中から抽出することにより、知識グラフの自動抽出が可能になる。この自然言語処理による知識抽出技術(Knowledge Acquisition)により、知識グラフを自動的に生成しようとする取り組みが行われている。
【0009】
知識グラフの自動生成においては、自然言語処理モデルの誤検知や、入力した情報ソース自体に誤りがあることで、誤った知識や信頼性の低い知識が混入することがある。これが含まれることで、誤った知識を含むノードに隣接するノードもその誤りの影響を受けてしまい、知識グラフを用いた推論タスクの精度が低下したり、知識グラフ自体の可視性の悪化を招くことになる。
【0010】
一方で、モデルの抽出精度には限度があるため、自動生成される知識グラフにおいて、誤検知による誤った知識が混入することは許容せざるを得ない。また、誤った知識が混入することを回避するために、知識グラフの基となる入力ソースを信頼できるソースのみにすると、知識に含まれる知識の多様性及び即時性の低下が起こり得る。
(【0011】以降は省略されています)

特許ウォッチbot のツイートを見る
この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

KDDI株式会社
光増幅器
17日前
KDDI株式会社
光増幅器
17日前
KDDI株式会社
光増幅器
4日前
KDDI株式会社
光増幅器
4日前
KDDI株式会社
光接続ノード
4日前
KDDI株式会社
解析装置及びプログラム
1か月前
KDDI株式会社
緊急ネットワーク分離方法
5日前
KDDI株式会社
ユーザ端末及び通信制御方法
2か月前
KDDI株式会社
ユーザ端末及び通信制御方法
2か月前
KDDI株式会社
情報処理装置及び情報処理方法
1か月前
KDDI株式会社
情報処理装置及び情報処理方法
1か月前
KDDI株式会社
情報処理装置及び情報処理方法
1か月前
KDDI株式会社
情報処理装置及び情報処理方法
27日前
KDDI株式会社
情報処理装置及び情報処理方法
17日前
KDDI株式会社
情報処理装置及び情報処理方法
3日前
KDDI株式会社
情報処理装置及び情報処理方法
3日前
KDDI株式会社
情報処理装置及び情報処理方法
3日前
KDDI株式会社
情報処理装置及び情報処理方法
17日前
KDDI株式会社
通信制御システム及び通信制御方法
11日前
KDDI株式会社
通信制御システム及び通信制御方法
11日前
KDDI株式会社
通信制御システム及び通信制御方法
11日前
KDDI株式会社
通信制御システム及び通信制御方法
11日前
KDDI株式会社
ネットワーク制御装置及びプログラム
1か月前
KDDI株式会社
飛行体、情報処理装置及び情報処理方法
7日前
KDDI株式会社
通信装置、無線デバイス及びプログラム
7日前
KDDI株式会社
中継装置、中継方法及び中継プログラム
26日前
KDDI株式会社
認証装置、認証方法及び認証プログラム
1か月前
KDDI株式会社
通信装置、無線デバイス及びプログラム
1か月前
KDDI株式会社
通信装置、無線デバイス及びプログラム
1か月前
KDDI株式会社
認証装置、認証方法及び認証プログラム
26日前
KDDI株式会社
無線デバイス及びコンピュータプログラム
1か月前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
1か月前
KDDI株式会社
支援処理装置、支援処理方法及びプログラム
17日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
18日前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
1か月前
KDDI株式会社
情報処理装置、情報処理方法及びプログラム
2か月前
続きを見る