TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025132146
公報種別
公開特許公報(A)
公開日
2025-09-10
出願番号
2024029514
出願日
2024-02-29
発明の名称
情報収集装置、情報収集方法及びプログラム
出願人
日本電気株式会社
代理人
個人
,
個人
主分類
G06F
16/906 20190101AFI20250903BHJP(計算;計数)
要約
【課題】詳細な調整を行うことなく正確な情報を収集できる情報収集装置、情報収集方法及びプログラムを提供する。
【解決手段】情報収集装置は、任意のウェブページが調査目的に関連しているか否かを論理値で示したラベリングデータに基づいて、分類器モデルの学習を行い、分類器モデルの学習結果に基づいて、入力されたウェブページに調査目的に関連する情報が記載されているか否かを判断し、入力されたウェブページを分類し、分類によって調査目的に関連する情報が記載されていると分類されたウェブページから調査目的に関連する情報を抽出するように生成AIに指示し、生成AIによって抽出された調査目的に関連する情報を保存する。
【選択図】図1
特許請求の範囲
【請求項1】
任意のウェブページが調査目的に関連しているか否かを論理値で示したラベリングデータに基づいて、入力されたウェブページが調査目的に関連する情報が記載されているか否かを判断するための分類器モデルの学習を行う学習部と、
前記分類器モデルの学習結果に基づいて、前記入力されたウェブページに前記調査目的に関連する情報が記載されているか否かを判断し、該判断結果に基づいて、前記入力されたウェブページを分類するウェブページ分類部と、
前記入力されたウェブページのうち、前記ウェブページ分類部によって前記調査目的に関連する情報が記載されていると分類されたウェブページから前記調査目的に関連する情報を抽出するように生成AIに指示する調査実行部と、
前記生成AIによって抽出された調査目的に関連する情報を保存するデータベースと、
を備えることを特徴とする情報収集装置。
続きを表示(約 1,800 文字)
【請求項2】
前記調査実行部は、前記生成AIによって抽出された前記調査目的に関連する情報を、所定の条件に基づいて評価し、該評価結果に基づいて信憑性の高い情報を選択し、
前記データベースは、前記調査実行部によって選択された前記信憑性の高い情報を保存することを特徴とする請求項1に記載の情報収集装置。
【請求項3】
前記調査実行部は、前記所定の条件として、類似するデータの数、矛盾するデータの数、及び参照元の最終更新日のうち少なくとも1つ以上に基づいて、前記調査目的に関連する情報の信憑性を評価することを特徴とする請求項2に記載の情報収集装置。
【請求項4】
前記調査実行部は、前記ラベリングデータを参照し、前記分類器モデルの学習に使用されていない未学習のデータがある場合に、前記学習部に前記分類器モデルの学習を指示することを特徴とする請求項1に記載の情報収集装置。
【請求項5】
前記調査実行部は、前記調査目的に関連する情報が記載されていると分類されたウェブページに対する前記生成AIによる情報の抽出を所定の回数繰り返すことを特徴とする請求項1に記載の情報収集装置。
【請求項6】
前記学習部は、前記ラベリングデータを参照し、前記任意のウェブページからテキストを抽出してベクトルに変換し、変換されたベクトルと前記任意のウェブページとに紐づくラベルを用いて前記分類器モデルの学習を行うことを特徴とする請求項1に記載の情報収集装置。
【請求項7】
前記ウェブページ分類部は、前記入力されたウェブページからテキストを抽出し、抽出したテキストをベクトルに変換し、前記分類器モデルを用いて前記調査目的に関連しているか否かで前記変換されたベクトルを分類することを特徴とする請求項1に記載の情報収集装置。
【請求項8】
ウェブサイト上から収集されたデータであり、前回の調査時からのウェブページの差分の有無を判断するためのクローリングデータを更に備え、
前記調査実行部は、前記クローリングデータを参照し、入力されたウェブページが前回調査を実行した際から差分がある場合に、前記ウェブページ分類部によって前記調査目的に関連する情報が記載されていると分類されたウェブページから前記調査目的に関連する情報を抽出するように前記生成AIに指示することを特徴とする請求項1に記載の情報収集装置。
【請求項9】
任意のウェブページが調査目的に関連しているか否かを論理値で示したラベリングデータに基づいて、入力されたウェブページが調査目的に関連する情報が記載されているか否かを判断するための分類器モデルの学習を行うステップと、
前記分類器モデルの学習結果に基づいて、前記入力されたウェブページに前記調査目的に関連する情報が記載されているか否かに基づいて、前記入力されたウェブページを分類するステップと、
前記入力されたウェブページのうち、前記調査目的に関連する情報が記載されていると分類されたウェブページから前記調査目的に関連する情報を抽出するように生成AIに指示するステップと、
前記生成AIによって抽出された調査目的に関連する情報をデータベースに保存するステップと、
を含むことを特徴とする情報収集方法。
【請求項10】
情報収集装置のコンピュータを、
任意のウェブページが調査目的に関連しているか否かを論理値で示したラベリングデータに基づいて、入力されたウェブページが調査目的に関連する情報が記載されているか否かを判断するための分類器モデルの学習を行う学習機能、
前記分類器モデルの学習結果に基づいて、前記入力されたウェブページに前記調査目的に関連する情報が記載されているか否かに基づいて、前記入力されたウェブページを分類するウェブページ分類機能、
前記入力されたウェブページのうち、前記調査目的に関連する情報が記載されていると分類されたウェブページから前記調査目的に関連する情報を抽出するように生成AIに指示する調査実行機能、
前記生成AIによって抽出された調査目的に関連する情報をデータベースに保存する保存機能、
として機能させることを特徴とするプログラム。
発明の詳細な説明
【技術分野】
【0001】
本開示は、情報収集装置、情報収集方法及びプログラムに関する。
続きを表示(約 1,800 文字)
【背景技術】
【0002】
近年では、ウェブサイトを始めとした様々な手段で膨大の情報が収集できるようになり、情報を取り扱う情報産業が経済や企業の発展に大きく貢献している。そのため、情報の収集・処理技術は需要が大きく、多様な提供元から、膨大な情報を正確に収集し、常に最新化するための技術が求められている。
【0003】
例えば、特許文献1には、チャットボット管理支援システム及びチャットボット管理支援方法として、質問文に対して想定される回答文を照合し、確信度が基準値以上の回答文を特定して返答する技術が提案されている。
【先行技術文献】
【特許文献】
【0004】
特開2021-21990号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
ところでウェブページから情報を収集して出力する技術において、情報提供元であるウェブページの構造が不定で、情報が頻繁に更新されるような対象に対しても、詳細な調整を行うことなく正確な情報を収集できる技術が求められていた。
【0006】
本開示の目的は、上述の課題を解決する情報収集装置、情報収集方法及びプログラムを提供することにある。
【課題を解決するための手段】
【0007】
本開示の一態様に係る情報収集装置は、任意のウェブページが調査目的に関連しているか否かを論理値で示したラベリングデータに基づいて、入力されたウェブページが調査目的に関連する情報が記載されているか否かを判断するための分類器モデルの学習を行う学習部と、前記分類器モデルの学習結果に基づいて、前記入力されたウェブページに前記調査目的に関連する情報が記載されているか否かを判断し、該判断結果に基づいて、前記入力されたウェブページを分類するウェブページ分類部と、前記入力されたウェブページのうち、前記ウェブページ分類部によって前記調査目的に関連する情報が記載されていると分類されたウェブページから前記調査目的に関連する情報を抽出するように生成AIに指示する調査実行部と、前記生成AIによって抽出された調査目的に関連する情報を保存するデータベースと、を備える。
【0008】
本開示の一態様に係る情報収集方法は、任意のウェブページが調査目的に関連しているか否かを論理値で示したラベリングデータに基づいて、入力されたウェブページが調査目的に関連する情報が記載されているか否かを判断するための分類器モデルの学習を行うステップと、前記分類器モデルの学習結果に基づいて、前記入力されたウェブページに前記調査目的に関連する情報が記載されているか否かに基づいて、前記入力されたウェブページを分類するステップと、前記入力されたウェブページのうち、前記調査目的に関連する情報が記載されていると分類されたウェブページから前記調査目的に関連する情報を抽出するように生成AIに指示するステップと、前記生成AIによって抽出された調査目的に関連する情報をデータベースに保存するステップと、を含む。
【0009】
本開示の一態様に係るプログラムは、情報収集装置のコンピュータを、任意のウェブページが調査目的に関連しているか否かを論理値で示したラベリングデータに基づいて、入力されたウェブページが調査目的に関連する情報が記載されているか否かを判断するための分類器モデルの学習を行う学習機能、前記分類器モデルの学習結果に基づいて、前記入力されたウェブページに前記調査目的に関連する情報が記載されているか否かに基づいて、前記入力されたウェブページを分類するウェブページ分類機能、前記入力されたウェブページのうち、前記調査目的に関連する情報が記載されていると分類されたウェブページから前記調査目的に関連する情報を抽出するように生成AIに指示する調査実行機能、前記生成AIによって抽出された調査目的に関連する情報をデータベースに保存する保存機能、として機能させる。
【発明の効果】
【0010】
上記一態様によれば、情報提供元の構造が不定で、情報が頻繁に更新されるような対象に対しても、詳細な調整を行うことなく正確な情報を収集できる。
【図面の簡単な説明】
(【0011】以降は省略されています)
この特許をJ-PlatPat(特許庁公式サイト)で参照する
関連特許
日本電気株式会社
学習装置
5日前
日本電気株式会社
学習装置
12日前
日本電気株式会社
原子発振器
7日前
日本電気株式会社
超伝導量子回路
1日前
日本電気株式会社
信号処理装置及び方法
1か月前
日本電気株式会社
移相器およびアンテナ装置
19日前
日本電気株式会社
移相器およびアンテナ装置
19日前
日本電気株式会社
移相器およびアンテナ装置
19日前
日本電気株式会社
光ファイバ伝送路及び光伝送方法
27日前
日本電気株式会社
TS合成装置および放送システム
8日前
日本電気株式会社
処理装置、方法、及びプログラム
5日前
日本電気株式会社
ケージ、光伝送装置及び挿抜方法
16日前
日本電気株式会社
レドーム、及びレドームの製造方法
22日前
日本電気株式会社
リング共振器、およびその製造方法
6日前
日本電気株式会社
リング共振器、およびその製造方法
7日前
日本電気株式会社
処理装置、処理方法、及びプログラム
15日前
日本電気株式会社
処理装置、処理方法、及びプログラム
19日前
日本電気株式会社
分析装置、分析方法、およびプログラム
22日前
日本電気株式会社
判定装置、判定方法、及び、プログラム
1日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
8日前
日本電気株式会社
画像検索装置、画像検索方法及び記憶媒体
2日前
日本電気株式会社
情報処理装置、及び処理方法、プログラム
26日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
5日前
日本電気株式会社
情報処理装置、情報処理方法、プログラム
5日前
日本電気株式会社
制御計画装置、制御計画方法及びプログラム
27日前
日本電気株式会社
教育支援装置、教育支援方法及びプログラム
26日前
日本電気株式会社
処理システム、処理方法、およびプログラム
9日前
日本電気株式会社
受講管理装置、受講管理方法及びプログラム
26日前
日本電気株式会社
自動可変チルト装置及び光信号利得等化方法
今日
日本電気株式会社
情報収集装置、情報収集方法及びプログラム
今日
日本電気株式会社
支援システム、処理方法、およびプログラム
21日前
日本電気株式会社
ゲート装置、認証制御方法、及びプログラム
1か月前
日本電気株式会社
光増幅装置、光伝送システム及び光増幅方法
19日前
日本電気株式会社
情報処理装置、情報処理方法、及びプログラム
5日前
日本電気株式会社
制御装置、システム、方法、およびプログラム
8日前
日本電気株式会社
サーバ装置、サーバ装置の方法及びプログラム
23日前
続きを見る
他の特許を見る