TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025132315
公報種別公開特許公報(A)
公開日2025-09-10
出願番号2024029780
出願日2024-02-29
発明の名称処理方法、処理装置及び処理プログラム
出願人ダイキン工業株式会社,国立大学法人 東京大学
代理人個人,個人
主分類G06F 40/216 20200101AFI20250903BHJP(計算;計数)
要約【課題】物質について記載したテキスト情報が含まれる文書を解析する際の解析精度を向上させる。
【解決手段】処理方法は、文書に含まれる物質名を有する物質の構造情報に基づく第1分散表現を出力する第1出力工程と、前記文書に含まれる物質名を有する物質について記載したテキスト情報に基づく第2分散表現を出力する第2出力工程と、前記第1分散表現と、前記第2分散表現とを用いてモデルの学習を行う学習工程とを含む。
【選択図】図3
特許請求の範囲【請求項1】
文書に含まれる物質名を有する物質の構造情報に基づく第1分散表現を出力する第1出力工程と、
前記文書に含まれる物質名を有する物質について記載したテキスト情報に基づく第2分散表現を出力する第2出力工程と、
前記第1分散表現と、前記第2分散表現とを用いてモデルの学習を行う学習工程と
を含む処理方法。
続きを表示(約 1,500 文字)【請求項2】
前記学習工程において、前記モデルの学習を行うことには、学習済みのモデルの再学習を行うことが含まれる、
を含む請求項1に記載の処理方法。
【請求項3】
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記モデルの学習を行うことには、
前記第1出力工程と前記第2出力工程とを実行することで出力された、第1分散表現と第2分散表現とを含む分散表現の集合を用いてモデルの学習を行うこと、が含まれる、
請求項1に記載の処理方法。
【請求項4】
前記テキスト情報が物質名を含む文章である場合、物質名の位置に対応する位置に第1分散表現が配置され、物質名以外の文章の位置に対応する位置に第2分散表現が配置された、前記分散表現の集合が生成される、
請求項3に記載の処理方法。
【請求項5】
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記モデルの再学習を行うことには、
前記テキスト情報の物質名以外の一部にマスク処理を行うことと、
マスク処理後の前記テキスト情報について、前記第1出力工程と前記第2出力工程とを実行することで出力された、第1分散表現と第2分散表現とを含む分散表現の集合を入力データとし、前記テキスト情報の物質名以外の一部を正解データとする教師有り学習を行うことと、が含まれる、
請求項3に記載の処理方法。
【請求項6】
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記学習済みのモデルの再学習を行うことには、
前記テキスト情報の物質名に、共通のトークンを用いてマスク処理を行うことと、
マスク処理後の前記テキスト情報について、前記第1出力工程と前記第2出力工程とを実行することで出力された、第1分散表現と第2分散表現とを含む分散表現の集合を入力データとし、前記テキスト情報の物質名を正解データとする教師有り学習を行うことと、が含まれる、
請求項2に記載の処理方法。
【請求項7】
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記モデルの学習を行うことには、
第1分散表現を出力する学習済みの第1モデル、または、第2分散表現を出力する学習済みの第2モデル、または、前記学習済みの第1モデル及び前記学習済みの第2モデルの出力が入力される前記学習済みのモデル、のいずれかの再学習を行うこと、が含まれる、
請求項1に記載の処理方法。
【請求項8】
前記学習工程において、前記第1分散表現を出力する学習済みの第1モデルは、文脈が類似する文章にそれぞれ含まれる、互いに異なる物質名を有する物質の構造情報に基づく第1分散表現が、互いに近傍に配置されるように学習が行われる、
請求項7に記載の処理方法。
【請求項9】
物質の構造情報に基づく第1分散表現を、前記学習工程において学習が行われた学習済みのモデルに入力することで、前記物質の用途または機能を示すトークンを出力する第3出力工程
を含む請求項1に記載の処理方法。
【請求項10】
物質の用途または機能が記載されたテキスト情報に基づく第2分散表現を、前記学習工程において学習が行われた学習済みのモデルに入力することで、前記物質の物質名を示すトークンを出力する第3出力工程
を含む請求項1に記載の処理方法。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、処理方法、処理装置及び処理プログラムに関する。
続きを表示(約 1,100 文字)【背景技術】
【0002】
化学分野等における論文、雑誌、特許文献等の文書には、物質の分子構造を示す構造情報と、当該物質について記載したテキスト情報とが含まれる。このような文書を、機械学習モデルを用いて解析する場合、従来は構造情報とテキスト情報とに分けて解析が行われていた。また、テキスト情報に対しては、物質名も物質名以外の他の文字列も同様の解析が行われていた。
【先行技術文献】
【特許文献】
【0003】
韓国公開特許第2021-0044003号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記解析方法では、所望する解析結果が得られない場合がある。
【0005】
本開示は、物質について記載したテキスト情報が含まれる文書を解析する際の解析精度を向上させることを目的とする。
【課題を解決するための手段】
【0006】
本開示の第1の態様は、処理方法であって、
文書に含まれる物質名を有する物質の構造情報に基づく第1分散表現を出力する第1出力工程と、
前記文書に含まれる物質名を有する物質について記載したテキスト情報に基づく第2分散表現を出力する第2出力工程と、
前記第1分散表現と、前記第2分散表現とを用いてモデルの学習を行う学習工程と
を含む。
【0007】
本開示の第1の態様によれば、物質について記載したテキスト情報が含まれる文書を解析する際の解析精度を向上させることができる。
【0008】
本開示の第2の態様は、第1の態様に記載の処理方法であって
前記学習工程において、前記モデルの学習を行うことには、学習済みのモデルの学習を行うことが含まれる。
【0009】
本開示の第3の態様は、第1または第2の態様に記載の処理方法であって、
前記テキスト情報は、物質名を含む文章であり、
前記学習工程において、前記モデルの学習を行うことには、
前記第1出力工程と前記第2出力工程とを実行することで出力された、第1分散表現と第2分散表現とを含む分散表現の集合を用いてモデルの学習を行うこと、が含まれる。
【0010】
本開示の第4の態様は、第3の態様に記載の処理方法であって、
前記テキスト情報が物質名を含む文章である場合、物質名の位置に対応する位置に第1分散表現が配置され、物質名以外の文章の位置に対応する位置に第2分散表現が配置された、前記分散表現の集合が生成される。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

個人
裁判のAI化
1か月前
個人
情報処理システム
2か月前
個人
フラワーコートA
1か月前
個人
工程設計支援装置
29日前
個人
記入設定プラグイン
2か月前
個人
検査システム
2か月前
個人
介護情報提供システム
1か月前
個人
冷凍食品輸出支援構造
9日前
個人
為替ポイント伊達夢貯
9日前
個人
携帯情報端末装置
1か月前
個人
設計支援システム
1か月前
個人
設計支援システム
1か月前
個人
表変換編集支援システム
2日前
個人
結婚相手紹介支援システム
26日前
個人
不動産売買システム
2か月前
株式会社サタケ
籾摺・調製設備
2か月前
キヤノン電子株式会社
携帯装置
2か月前
個人
知財出願支援AIシステム
9日前
個人
パスワード管理支援システム
2日前
個人
AIによる情報の売買の仲介
11日前
株式会社カクシン
支援装置
1か月前
個人
行動時間管理システム
4日前
個人
備蓄品の管理方法
2か月前
個人
パスポートレス入出国システム
15日前
個人
アンケート支援システム
1か月前
日本精機株式会社
施工管理システム
11日前
株式会社アジラ
進入判定装置
15日前
個人
AIキャラクター制御システム
2日前
キヤノン株式会社
情報処理装置
2か月前
サクサ株式会社
中継装置
2日前
個人
冷凍加工連携型農場運用システム
9日前
個人
人格進化型対話応答制御システム
2日前
個人
社会還元・施設向け供給支援構造
2日前
個人
食事受注会計処理システム
16日前
大阪瓦斯株式会社
住宅設備機器
23日前
個人
音声対話型帳票生成支援システム
2日前
続きを見る