TOP特許意匠商標
特許ウォッチ Twitter
10個以上の画像は省略されています。
公開番号2025134647
公報種別公開特許公報(A)
公開日2025-09-17
出願番号2025027586
出願日2025-02-25
発明の名称トランスフォーマー加速装置およびその動作方法
出願人三星電子株式会社,Samsung Electronics Co.,Ltd.,ネイバー コーポレーション,NAVER Corporation
代理人弁理士法人ITOH
主分類G06N 3/063 20230101AFI20250909BHJP(計算;計数)
要約【課題】本開示は、複数の入力トークンに基づいて出力トークンを生成するトランスフォーマーを実行するトランスフォーマー加速装置に関する。
【解決手段】本開示の実施例に係る第1複数のデコーダーレイヤーおよび第2複数のデコーダーレイヤーを含むトランスフォーマーを実行するトランスフォーマー加速装置は、第1複数のデコーダーレイヤーに対応する第1複数のウエイトマトリックス、および第2複数のデコーダーレイヤーに対応する第1複数のキーバリューベクトルペアを保存する第1メモリバンクアレイ、および第2複数のデコーダーレイヤーに対応する第2複数のウエイトマトリックス、および第1複数のデコーダーレイヤーに対応する第2複数のキーバリューベクトルペアを保存する第2メモリバンクアレイを含むことができる。
【選択図】図13

特許請求の範囲【請求項1】
第1複数のデコーダーレイヤーおよび第2複数のデコーダーレイヤーを含むトランスフォーマーを実行するトランスフォーマー加速装置において、
前記第1複数のデコーダーレイヤーに対応する第1複数のウエイトマトリックス、および前記第2複数のデコーダーレイヤーに対応する第1複数のキーバリューベクトルペアを保存する第1メモリバンクアレイ、および
前記第2複数のデコーダーレイヤーに対応する第2複数のウエイトマトリックス、および前記第1複数のデコーダーレイヤーに対応する第2複数のキーバリューベクトルペアを保存する第2メモリバンクアレイを含むトランスフォーマー加速装置。
続きを表示(約 1,600 文字)【請求項2】
前記第1複数のウエイトマトリックスに基づいて前記第1複数のキーバリューベクトルペアを演算し、前記第2複数のウエイトマトリックスに基づいて前記第2複数のキーバリューベクトルペアを演算する第1プロセシング回路をさらに含む請求項1に記載のトランスフォーマー加速装置。
【請求項3】
前記第1複数のキーバリューベクトルペアに基づいて前記第2複数のデコーダーレイヤーに対するアテンション演算を行い、前記第2複数のキーバリューベクトルペアに基づいて前記第1複数のデコーダーレイヤーに対するアテンション演算を行う第2プロセシング回路をさらに含む請求項2に記載のトランスフォーマー加速装置。
【請求項4】
前記第1複数のデコーダーレイヤーの個数および前記第2複数のデコーダーレイヤーの個数は、互いに対応する請求項1に記載のトランスフォーマー加速装置。
【請求項5】
前記第1複数のデコーダーレイヤーおよび前記第2複数のデコーダーレイヤーの順序は、互いに交互である請求項3に記載のトランスフォーマー加速装置。
【請求項6】
前記第1複数のウエイトマトリックスおよび前記第1複数のキーバリューベクトルペアの容量の合計は、前記第2複数のウエイトマトリックスおよび前記第2複数のキーバリューベクトルペアの容量の合計に対応する請求項1に記載のトランスフォーマー加速装置。
【請求項7】
前記第1複数のキーバリューベクトルペアは、
外部装置から提供された第1トークンストリームに対応する第1複数のキーベクトル、および
前記第1トークンストリームに対応する第1複数のバリューベクトルを含み、
前記第2複数のキーバリューベクトルペアは、
前記第1トークンストリームに対応する第2複数のキーベクトル、および
前記第1トークンストリームに対応する第2複数のバリューベクトルを含む請求項1に記載のトランスフォーマー加速装置。
【請求項8】
前記第1複数のキーバリューベクトルペアは、
前記外部装置から提供された第2トークンストリームに対応する第3複数のキーベクトル、および
前記第2トークンストリームに対応する第3複数のバリューベクトルをさらに含み、
前記第2複数のキーバリューベクトルペアは、
前記第2トークンストリームに対応する第4複数のキーベクトル、および
前記第2トークンストリームに対応する第4複数のバリューベクトルをさらに含む請求項7に記載のトランスフォーマー加速装置。
【請求項9】
前記第1複数のキーベクトル、前記第1複数のバリューベクトル、前記第2複数のキーベクトル、および前記第2複数のバリューベクトルそれぞれの容量は、前記第1メモリバンクアレイおよび前記第2メモリバンクアレイに含まれたメモリバンクの一つのメモリセルローの容量より小さい請求項7に記載のトランスフォーマー加速装置。
【請求項10】
第1入力トークンに対応する第1アクティベーションベクトルに基づいて動作するトランスフォーマー加速装置において、
第1複数のウエイトマトリックスを保存する第1メモリバンクアレイ、
前記第1入力トークンに対する第1複数の先行トークンにそれぞれ対応する第1複数の先行キーバリューベクトルペアを保存する第2メモリバンクアレイ、
前記第1アクティベーションベクトルおよび前記第1複数のウエイトマトリックスに基づいて第1キーバリューベクトルペアを生成する第1プロセシングユニット、および
前記第1キーバリューベクトルペアおよび前記第1複数の先行キーバリューベクトルペアに基づいて第1アテンション演算を行う第2プロセシングユニットを含むトランスフォーマー加速装置。
(【請求項11】以降は省略されています)

発明の詳細な説明【技術分野】
【0001】
本開示は、複数の入力トークンに基づいて出力トークンを生成するトランスフォーマーを実行するトランスフォーマー加速装置に関する。より詳細には、本開示は、オートリグレッション(auto-regression)方式で出力トークンを生成するトランスフォーマーを実行するトランスフォーマー加速装置およびその動作方法に関する。
続きを表示(約 1,900 文字)【背景技術】
【0002】
トランスフォーマー加速装置は、複数の入力トークンに基づいて出力トークンを生成する。例えば、トランスフォーマー加速装置は、複数の入力トークンに基づいてトランスフォーマーを実行し、複数の入力トークンに後続するのに適した第1出力トークンを生成することができる。
【0003】
トランスフォーマーは、オートリグレッション方式で動作することができる。例えば、トランスフォーマーは、複数の入力トークンと共に第1出力トークンをさらに使用して、複数の入力トークンおよび第1出力トークンに後続するのに適した第2出力トークンを生成することができる。すなわち、トランスフォーマーは、複数のイテレーション(iteration)にわたって順次動作することができ、各イテレーションを通じて生成された結果を次のイテレーションの入力として使用することができる。
【0004】
トランスフォーマーは、複数のイテレーションにわたって様々な類型のデータを再使用することができる。例えば、トランスフォーマーは以前のイテレーションで使用されたデータを次のイテレーションで再活用することができる。しかし、トランスフォーマーが再使用されるデータを保存して読み出す方式が最適化されない場合、再使用されるデータの保存および読み出しによってトランスフォーマー加速装置の動作にボトルネックが発生し得る。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本開示は、前述された技術的課題を解決するためのものである。より詳細には、本開示の目的は、最適化された方式でトランスフォーマーが再使用するデータを保存および読み出すように実現されたトランスフォーマー加速装置、およびその動作方法を提供することにある。
【課題を解決するための手段】
【0006】
本開示の実施例に係る第1複数のデコーダーレイヤーおよび第2複数のデコーダーレイヤーを含むトランスフォーマーを実行するトランスフォーマー加速装置は、前記第1複数のデコーダーレイヤーに対応する第1複数のウエイトマトリックス、および前記第2複数のデコーダーレイヤーに対応する第1複数のキーバリューベクトルペアを保存する第1メモリバンクアレイ、および前記第2複数のデコーダーレイヤーに対応する第2複数のウエイトマトリックス、および前記第1複数のデコーダーレイヤーに対応する第2複数のキーバリューベクトルペアを保存する第2メモリバンクアレイを含むことができる。
【0007】
本開示の実施例に係る第1入力トークンに対応する第1アクティベーションベクトルに基づいて動作するトランスフォーマー加速装置は、第1複数のウエイトマトリックスを保存する第1メモリバンクアレイ、前記第1入力トークンに対する第1複数の先行トークンにそれぞれ対応する第1複数の先行キーバリューベクトルペアを保存する第2メモリバンクアレイ、前記第1アクティベーションベクトルおよび前記第1複数のウエイトマトリックスに基づいて第1キーバリューベクトルペアを生成する第1プロセシングユニット、および前記第1キーバリューベクトルペアおよび前記第1複数の先行キーバリューベクトルペアに基づいて第1アテンション演算を行う第2プロセシングユニットを含むことができる。
【0008】
本開示の実施例に係る複数のメモリバンクアレイを含むトランスフォーマー加速装置の動作方法は、第1入力トークンに基づいて第1アクティベーションベクトルを生成するステップ、前記複数のメモリバンクアレイのうち一つの第1メモリバンクアレイから第1複数のウエイトマトリックスを読み出すステップ、前記第1複数のウエイトマトリックスおよび前記第1アクティベーションベクトルに基づいて第1キーバリューベクトルペアを生成するステップ、前記複数のメモリバンクのうち一つであり、前記第1メモリバンクアレイとは異なる第2メモリバンクアレイに前記第1キーバリューベクトルペアを保存するステップ、前記第1キーバリューベクトルペアに基づいて第2アクティベーションベクトルを生成するステップ、および前記第2アクティベーションベクトルに基づいて前記第1入力トークンに対応する第1出力トークンを生成するステップを含むことができる。
【図面の簡単な説明】
【0009】
本開示の実施例に係るトランスフォーマー加速装置を示すブロック図である。
【0010】
図1のトランスフォーマー加速装置をより詳細に示すブロック図である。
(【0011】以降は省略されています)

この特許をJ-PlatPat(特許庁公式サイト)で参照する

関連特許

三星電子株式会社
半導体素子
2日前
三星電子株式会社
半導体装置
2日前
三星電子株式会社
固体撮像素子
13日前
三星電子株式会社
半導体パッケージ装置及びこの製造方法
6日前
三星電子株式会社
回転磁気アレイ装置及び磁気冷凍システム
2日前
三星電子株式会社
回転磁気アレイ装置及び磁気冷凍システム
2日前
三星電子株式会社
シンプロビジョニングを通じたSSD仮想化
2日前
三星電子株式会社
ハイブリッドピクセル及びハイブリッドセンサ
12日前
個人
フラワーコートA
1か月前
個人
工程設計支援装置
1か月前
個人
為替ポイント伊達夢貯
27日前
個人
冷凍食品輸出支援構造
27日前
個人
表変換編集支援システム
20日前
個人
携帯情報端末装置
1か月前
個人
結婚相手紹介支援システム
1か月前
個人
知財出願支援AIシステム
27日前
個人
パスワード管理支援システム
20日前
個人
行動時間管理システム
22日前
個人
AIによる情報の売買の仲介
29日前
個人
パスポートレス入出国システム
1か月前
個人
海外支援型農作物活用システム
12日前
日本精機株式会社
施工管理システム
29日前
株式会社アジラ
進入判定装置
1か月前
個人
システム及びプログラム
13日前
個人
AIキャラクター制御システム
20日前
サクサ株式会社
中継装置
20日前
大同特殊鋼株式会社
疵判定方法
6日前
個人
未来型家系図構築システム
12日前
個人
音声対話型帳票生成支援システム
20日前
大阪瓦斯株式会社
住宅設備機器
1か月前
個人
SaaS型勤務調整支援システム
20日前
個人
社会還元・施設向け供給支援構造
20日前
個人
冷凍加工連携型農場運用システム
27日前
個人
食事受注会計処理システム
1か月前
個人
人格進化型対話応答制御システム
20日前
個人
リテールレボリューションAIタグ
1か月前
続きを見る