TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
10個以上の画像は省略されています。
公開番号
2025091092
公報種別
公開特許公報(A)
公開日
2025-06-18
出願番号
2023206089
出願日
2023-12-06
発明の名称
情報処理装置、方法及びプログラム
出願人
株式会社東芝
代理人
弁理士法人鈴榮特許綜合事務所
主分類
G06N
3/09 20230101AFI20250611BHJP(計算;計数)
要約
【課題】変数名と値が対応づいたデータに関し、変数名の変更、追加又は削減が生じても当該データを解析可能にすること。
【解決手段】実施形態に係る情報処理装置は、データ及び対応関係取得部と、ベクトル生成部と、ベクトル結合部とを備えている。前記データ及び対応関係取得部は、変数名と前記変数名に対応づいた値とを含むデータ、及び変数名と値との対応関係を取得する。前記ベクトル生成部は、前記変数名毎に対応する変数名ベクトル、及び前記変数名毎に対応づいた前記値に対応する値ベクトルを生成する。前記ベクトル結合部は、前記対応関係に基づいて、前記変数名ベクトルと前記値ベクトルとを結合する。
【選択図】 図1
特許請求の範囲
【請求項1】
変数名と前記変数名に対応づいた値とを含むデータ、及び変数名と値との対応関係を取得するデータ及び対応関係取得部と、
前記変数名毎に対応する変数名ベクトル、及び前記変数名毎に対応づいた前記値に対応する値ベクトルを生成するベクトル生成部と、
前記対応関係に基づいて、前記変数名ベクトルと前記値ベクトルとを結合するベクトル結合部と、
を備えた情報処理装置。
続きを表示(約 1,100 文字)
【請求項2】
前記値は、カテゴリ値であり、
前記値ベクトルは、前記カテゴリ値に対応するベクトルである、
請求項1に記載の情報処理装置。
【請求項3】
前記取得したデータのうち、前記カテゴリ値と前記カテゴリ値に対応づいた変数名とを含む変数について、前記変数名及び前記カテゴリ値をトークン分割し、得られた各トークンに対応するトークンベクトルを生成するトークンベクトル化部と、
前記各トークンについて、前記トークンベクトルが由来する前記変数と、当該トークンベクトルが由来する前記変数名又は前記カテゴリ値とを特定する変数名・カテゴリ値特定部と、
を更に備え、
前記ベクトル生成部は、前記特定した結果に基づいて、前記変数毎に、前記変数名に由来するトークンベクトルから前記変数名ベクトルを生成し且つ前記カテゴリ値に由来するトークンベクトルから前記値ベクトルを生成する、
請求項2に記載の情報処理装置。
【請求項4】
前記ベクトル生成部は、前記カテゴリ値に由来するトークンベクトルの集合をニューラルネットワークにより処理することで前記値ベクトルを生成する、
請求項3に記載の情報処理装置。
【請求項5】
前記ベクトル生成部は、前記カテゴリ値に由来するトークンベクトルを平均化することで前記値ベクトルを生成する、
請求項3に記載の情報処理装置。
【請求項6】
前記ベクトル生成部は、前記値がカテゴリ値又は文章データであるとき、当該値をテキスト解析することにより文章ベクトルである前記値ベクトルを生成する、
請求項1に記載の情報処理装置。
【請求項7】
前記値は、数値であり、
前記値ベクトルは、前記数値に対応するベクトルである、
請求項1に記載の情報処理装置。
【請求項8】
前記ベクトル生成部は、前記数値をニューラルネットワークに入力することにより、当該ニューラルネットワークの出力である前記値ベクトルを生成する、
請求項7に記載の情報処理装置。
【請求項9】
前記ベクトル生成部は、前記数値を線形変換することで前記値ベクトルを生成する、
請求項7に記載の情報処理装置。
【請求項10】
前記データ及び対応関係取得部は、行方向に沿って1サンプルにおける複数の変数を有し、列方向に沿って前記複数の変数の各々が前記変数名と前記値とを有する表形式データから、前記データ及び前記対応関係を取得する、
請求項1乃至9のいずれか一項に記載の情報処理装置。
(【請求項11】以降は省略されています)
発明の詳細な説明
【技術分野】
【0001】
本発明の実施形態は、情報処理装置、方法及びプログラムに関する。
続きを表示(約 2,100 文字)
【背景技術】
【0002】
IoT(Internet of Things)技術の発達により、情報処理装置は、表形式データに代表される多変量データの如き、様々なデータを取得可能になっている。ここで、多変量データは、異なる性質のデータを集約したデータであり、多くの場面で用いられる。例えば製造現場では、製造時に使用した材料名や装置名などの製造条件、製造した製品の検査データなどの製品の状態に関する製造データを集約した多変量データが用いられる。また、医療現場では、患者の属性情報や各種検査値などの患者に関する医用データを集約した多変量データが用いられる。
【0003】
また、これらの多変量データを解析することで、製品や装置の故障、あるいは疾患の候補といった解析結果を得ることが期待されている。例えば、多変量データの一種である表形式データを解析する場面では、分類又は回帰を行う様々な機械学習技術が表形式データ解析技術として用いられている。ここで、表形式データは、行方向に沿って1つのサンプルに対応する各変数の値を有し、列方向に沿って1つの変数名及びそれに対応づいた各サンプルの値とを格納している。各変数は、変数名とその値とを含んでいる。この種の表形式データ解析技術は、学習時と運用時との間で表形式データの列構成が同一である前提のため、運用時には、学習時の訓練データと同一の列構成のデータのみが解析可能である。
【0004】
しかしながら、表形式データを解析する際に、運用時において、表形式データの列構成が学習時の訓練データの列構成とは異なる場合がある。例えば、表形式データが製造データのとき、製造工程の変更や検査項目の追加又は削減などにより、学習時と運用時との間で、製造データを構成する変数が変化する場合がある。この場合、表形式データ解析技術は、変数名の変更、追加又は削減などにより、列構成が変更された製造データを解析できない。このため、表形式データ解析技術は、列構成が変更された後の訓練データによって再学習を行うか、または、列構成の変更前後の製造データから共通の列のみを抽出して解析を行う必要が生じる。なお、後者の場合、抽出後の残りの列は、解析には用いず、放棄(無視)される。
【0005】
従って、変数名の変更、追加又は削減があったデータを解析可能とすることが望まれている。このように、異なる列構成のデータが解析可能になると、訓練データの水増しや再学習が不要になるなどの効果が期待される。
【先行技術文献】
【特許文献】
【0006】
特表2022-543393号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明が解決しようとする課題は、変数名と値が対応づいたデータに関し、変数名の変更、追加又は削減が生じても当該データを解析可能にする情報処理装置、方法及びプログラムを提供することである。
【課題を解決するための手段】
【0008】
実施形態に係る情報処理装置は、データ及び対応関係取得部と、ベクトル生成部と、ベクトル結合部とを含む。データ及び対応関係取得部では、変数名と変数名に対応づいた値、及び変数名と値の対応関係を取得する。ベクトル生成部は、変数名と値それぞれをベクトルに変換する。ベクトル結合部では、変数名と値から得られた各ベクトルを、変数名と値の対応関係に基づいて結合する。
【図面の簡単な説明】
【0009】
第1の実施形態に係る情報処理装置の構成の一例を示すブロック図。
第1の実施形態における動作を説明するためのフローチャート。
第1の実施形態の動作を説明するための模式図。
第1の実施形態の動作を説明するための模式図。
第1の実施形態の変形例を説明するための模式図。
第2の実施形態に係る情報処理装置の構成の一例を示すブロック図。
第2の実施形態における動作を説明するためのフローチャート。
第2の実施形態の動作を説明するための模式図。
第3の実施形態に係る情報処理装置の構成の一例を示すブロック図。
第3の実施形態における動作を説明するためのフローチャート。
第3の実施形態の動作を説明するための模式図。
第4の実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図。
【発明を実施するための形態】
【0010】
以下、図面を参照して各実施形態を例示的に説明する。以下の説明では、変数名と値が対応づいた多変量データとして、csvファイルなどに保存されている表形式データを例に挙げて述べる。但し、これに限らず、多変量データとしては、jsonやyamlなど、変数名と値が対応づいたファイル形式のデータを用いてもよい。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
株式会社東芝
センサ
1か月前
株式会社東芝
回転電機
2か月前
株式会社東芝
制御装置
20日前
株式会社東芝
回転電機
2か月前
株式会社東芝
回転電機
2か月前
株式会社東芝
立て看板
18日前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
18日前
株式会社東芝
半導体装置
24日前
株式会社東芝
真空バルブ
1か月前
株式会社東芝
半導体装置
1か月前
株式会社東芝
半導体装置
2か月前
株式会社東芝
半導体装置
26日前
株式会社東芝
静止誘導電器
1か月前
株式会社東芝
ディスク装置
17日前
株式会社東芝
配線支援装置
2か月前
株式会社東芝
車両システム
1か月前
株式会社東芝
スイッチギヤ
13日前
株式会社東芝
区分システム
25日前
株式会社東芝
情報表示装置
2か月前
株式会社東芝
静止誘導電器
1か月前
株式会社東芝
アイソレータ
5日前
株式会社東芝
電力変換装置
1か月前
株式会社東芝
スイッチギヤ
1か月前
株式会社東芝
電池モジュール
1か月前
株式会社東芝
電子計算機装置
2か月前
株式会社東芝
紙葉類処理装置
4日前
株式会社東芝
粒子線治療装置
1か月前
株式会社東芝
光注入同期装置
2か月前
株式会社東芝
磁気ディスク装置
26日前
株式会社東芝
物品区分システム
6日前
株式会社東芝
X線厚み測定装置
1か月前
株式会社東芝
バックアップ回路
4日前
株式会社東芝
回転電機の回転子
2か月前
株式会社東芝
空転・滑走学習装置
1か月前
株式会社東芝
有機物分解システム
1か月前
続きを見る
他の特許を見る