TOP
|
特許
|
意匠
|
商標
特許ウォッチ
Twitter
他の特許を見る
公開番号
2025114657
公報種別
公開特許公報(A)
公開日
2025-08-05
出願番号
2025075406,2023035587
出願日
2025-04-30,2019-12-18
発明の名称
光ネットワークを用いた再構成可能な計算ポッド
出願人
グーグル エルエルシー
,
Google LLC
代理人
弁理士法人深見特許事務所
主分類
H04L
41/0806 20220101AFI20250729BHJP(電気通信技術)
要約
【課題】光ネットワークを用いて計算ノードのビルディングブロックのクラスタを生成する方法を提供する。
【解決手段】方法は、計算ワークロードを実行するために要求される計算ノードを指定する要求データを受信する。要求データは、計算ノードのn次元目標構成を指定する。方法はまた、各々がm次元構成の計算ノードを含む1組のビルディングブロックを含むスーパポッドから、組み合わせられると、要求データによって指定された目標構成に一致するビルディングブロックの部分セットを選択する。1組のビルディングブロックは、1つ以上の光回路スイッチを含む光ネットワークに接続される。方法はさらに、ビルディングブロックの部分セットを含む計算ノードのワークロードクラスタを生成する。ワークロードクラスタの生成は、ワークロードクラスタの各次元のための1つ以上の光回路スイッチのそれぞれのルーティングデータを構成することを含む。
【選択図】図10
特許請求の範囲
【請求項1】
1つ以上のデータ処理装置によって実行される方法であって、前記方法は、
計算ワークロードを実行するために要求される計算ノードを指定する要求データを受信することを含み、前記要求データは、前記計算ノードのn(nは、2以上である)次元目標構成を指定し、
各々がm(mは、2以上である)次元構成の計算ノードを含む1組のビルディングブロックを含むスーパポッドから、組み合わせられると、前記要求データによって指定された前記n次元目標構成に一致する前記ビルディングブロックの部分セットを選択することを含み、前記1組のビルディングブロックは、前記n次元の各次元のための1つ以上の光回路スイッチを含む光ネットワークに接続され、
前記ビルディングブロックの部分セットを含む計算ノードのワークロードクラスタを生成することを含み、
前記生成することは、
前記ワークロードクラスタの各次元について、当該次元のための前記1つ以上の光回路スイッチのそれぞれのルーティングデータを構成することを含み、前記ワークロードクラスタの各次元にそれぞれ対応する前記ルーティングデータは、前記ワークロードクラスタの前記次元に沿って、前記計算ワークロードのデータをどのように前記計算ノードの間にルーティングすることを指定し、
前記ワークロードクラスタの前記計算ノードに、前記計算ワークロードを実行させることを含む、方法。
続きを表示(約 1,700 文字)
【請求項2】
前記要求データは、異なる種類の計算ノードを指定し、
前記ビルディングブロックの部分セットを選択することは、前記要求データによって指定される各種類の計算ノードについて、前記指定された種類の1つ以上の計算ノードを含むビルディングブロックを選択することを含む、請求項1に記載の方法。
【請求項3】
前記スーパポッドの各次元のそれぞれの前記ルーティングデータは、前記1つ以上の光回路スイッチのうちの1つについて光回路スイッチルーティングテーブルを含む、請求項1に記載の方法。
【請求項4】
前記光ネットワークは、前記n次元の各次元について、当該次元に沿った計算ノードの間にデータをルーティングする当該光ネットワークの1つ以上の光回路スイッチを含む、請求項1に記載の方法。
【請求項5】
各ビルディングブロックは、当該ビルディングブロックの各次元に沿った複数のセグメントの計算ノードを含み、
前記光ネットワークは、各次元の各セグメントについて、前記ワークロードクラスタ内の各ビルディングブロックに対応する計算ノードセグメントの間にデータをルーティングする当該光ネットワークの光回路スイッチを含む、請求項4に記載の方法。
【請求項6】
各ビルディングブロックは、3次元トーラス状計算ノードまたはメッシュ状計算ノードのうちの1つを含む、請求項1に記載の方法。
【請求項7】
前記スーパポッドは、複数のワークロードクラスタを含み、
各ワークロードクラスタは、前記ビルディングブロックの異なる部分セットを含み、他のワークロードクラスタとは異なるワークロードを実行する、請求項1に記載の方法。
【請求項8】
前記ワークロードクラスタの特定のビルディングブロックが故障したことを示すデータを受信することと、
利用可能なビルディングブロックを用いて前記特定のビルディングブロックを置換することとをさらに含む、請求項1に記載の方法。
【請求項9】
利用可能なビルディングブロックを用いて前記特定のビルディングブロックを置換することは、
前記ワークロードクラスタの前記特定のビルディングブロックと1つ以上の他のビルディングブロックとの間のデータルーティングを停止するように、前記光ネットワークの1つ以上の光回路スイッチのデータルーティングを更新することと、
前記ワークロードクラスタの前記利用可能なビルディングブロックと前記1つ以上の他のビルディングブロックとの間にデータをルーティングするように、前記光ネットワークの前記1つ以上の光回路スイッチのデータルーティングを更新することとを含む、請求項8に記載の方法。
【請求項10】
組み合わせられると、前記要求データによって指定される前記n次元目標構成に一致する前記ビルディングブロックの部分セットを選択することは、
前記要求データによって指定された前記n次元構成が、前記スーパポッド内の利用可能且つ健全な第2の量のビルディングブロックを超える第1の量のビルディングブロックを必要とすることを判断することと、
前記要求データによって指定された前記n次元構成が、前記スーパポッド内の利用可能且つ健全な前記第2の量のビルディングブロックを超える前記第1の量のビルディングブロックを必要とするという判断に応じて、
前記計算ワークロードより低い優先度を有し且つ前記スーパポッドの他のビルディングブロックによって実行されている1つ以上の第2の計算ワークロードを特定すること、および、
前記1つ以上の第2の計算ワークロードの1つ以上のビルディングブロックを、前記計算ワークロードのための前記ワークロードクラスタに割り当て直すこととを含み、
前記ビルディングブロックの部分セットを含む前記計算ノードの前記ワークロードクラスタを生成することは、前記1つ以上の第2の計算ワークロードの前記1つ以上のビルディングブロックを前記ビルディングブロックの部分セットに含めることを有する、請求項1に記載の方法。
(【請求項11】以降は省略されています)
発明の詳細な説明
【背景技術】
【0001】
背景
いくつかの計算ワークロード、例えば機械学習トレーニングは、ワークロードを効率的に処理するために多くの処理ノードを必要とする。処理ノードは、相互接続ネットワークを介して互いに通信することができる。例えば、機械学習トレーニングの場合、処理ノードは、互いに通信することによって、最適な深層学習モデルに収束することができる。相互接続ネットワークは、処理ユニットが収束を達成する速度および効率にとって重要である。
続きを表示(約 2,800 文字)
【0002】
機械学習および他のワークロードのサイズおよび複雑性が変化するため、複数の処理ノードを含むスーパコンピュータの固定した構成は、スーパコンピュータの利用可能性、拡張性および性能を制限してしまう場合がある。例えば、複数の処理ノードからなる特定の構成を接続する固定の相互接続ネットワークを有するスーパコンピュータのいくつかの処理ノードが故障した場合、スーパコンピュータは、故障した処理ノードを置換することができないため、利用可能性および性能が低下する。また、いくつかの特定の構成の性能は、故障したノードに関係なく他の構成の性能よりも高くなる場合がある。
【発明の概要】
【課題を解決するための手段】
【0003】
概要
本明細書は、光ネットワークを用いて、ワークロードクラスタを生成する計算ノードのスーパポートを再構成できる技術を説明する。
【0004】
概して、本明細書に記載された主題の1つの発明的態様は、計算ワークロードを実行するために要求される計算ノードを指定する要求データを受信することを含む方法に具現化することができる。要求データは、計算ノードのn(nは、2以上である)次元目標構成を指定する。各々がm(mは、2以上である)次元構成の計算ノードを含む1組のビルディングブロックを含むスーパポッドから、組み合わせられると、要求データによって指定されたn次元目標構成に一致するビルディングブロックの部分セットを選択する。上記の1組のビルディングブロックは、n次元の各次元のための1つ以上の光回路スイッチを含む光ネットワークに接続される。ビルディングブロックの部分セットを含む計算ノードのワークロードクラスタを生成する。ワークロードクラスタは、特定の計算ワークロードの計算または実行に専用の計算ノードのクラスタである。生成することは、ワークロードクラスタの各次元について、当該次元のための1つ以上の光回路スイッチのそれぞれのルーティングデータを構成することを含む。ワークロードクラスタの各次元にそれぞれ対応するルーティングデータは、ワークロードクラスタの各次元に沿って、計算ワークロードのデータをどのように計算ノードの間にルーティングすることを指定する。ワークロードクラスタ内の計算ノードは、計算ワークロードを実行する。
【0005】
これらおよび他の実装は、必要に応じて、以下の特徴のうち、1つ以上を含むことができる。いくつかの態様において、要求データは、異なる種類の計算ノードを指定する。ビルディングブロックの部分セットを選択することは、要求データによって指定される各種類の計算ノードについて、指定された種類の1つ以上の計算ノードを含むビルディングブロックを選択することを含むことができる。
【0006】
いくつかの態様において、スーパポッドの各次元のそれぞれのルーティングデータは、1つ以上の光回路スイッチのうちの1つについて光回路スイッチルーティングテーブルを
含む。いくつかの態様において、光ネットワークは、n次元の各次元について、当該次元に沿った計算ノードの間にデータをルーティングする当該光ネットワークの1つ以上の光回路スイッチを含む。各ビルディングブロックは、当該ビルディングブロックの各次元に沿った複数のセグメントの計算ノードを含むことができる。光ネットワークは、各次元の各セグメントについて、ワークロードクラスタ内の各ビルディングブロックに対応する計算ノードセグメントの間にデータをルーティングする当該光ネットワークの光回路スイッチを含むことができる。
【0007】
いくつかの態様において、各ビルディングブロックは、3次元トーラス状計算ノードまたはメッシュ状計算ノードのうちの1つを含む。いくつかの態様において、スーパポッドは、複数のワークロードクラスタを含み、各ワークロードクラスタは、ビルディングブロックの異なる部分セットを含み、他のワークロードクラスタとは異なるワークロードを実行することができる。
【0008】
いくつかの態様は、ワークロードクラスタの特定のビルディングブロックが故障したことを示すデータを受信することと、利用可能なビルディングブロックを用いて特定のビルディングブロックを置換することとを含む。利用可能なビルディングブロックを用いて特定のビルディングブロックを置換することは、ワークロードクラスタの特定のビルディングブロックと1つ以上の他のビルディングブロックとの間のデータルーティングを停止するように、光ネットワークの1つ以上の光回路スイッチのデータルーティングを更新することと、ワークロードクラスタの利用可能なビルディングブロックと1つ以上の他のビルディングブロックとの間にデータをルーティングするように、光ネットワークの1つ以上の光回路スイッチのデータルーティングを更新することとを含むことができる。
【0009】
いくつかの態様において、組み合わせられると、要求データによって指定されたn次元目標構成に一致するビルディングブロックの部分セットを選択することは、要求データによって指定されたn次元構成が、スーパポッド内の利用可能且つ健全な第2の量のビルディングブロックを超える第1の量のビルディングブロックを必要とすることを判断することと、要求データによって指定されたn次元構成が、スーパポッド内の利用可能且つ健全な第2の量のビルディングブロックを超える第1の量のビルディングブロックを必要とするという判断に応じて、計算ワークロードより低い優先度を有し且つスーパポッドの他のビルディングブロックによって実行されている1つ以上の第2の計算ワークロードを特定こと、および1つ以上の第2の計算ワークロードの1つ以上のビルディングブロックを、計算ワークロードのワークロードクラスタに割り当て直すこととを含む。ビルディングブロックの部分セットを含む計算ノードのワークロードクラスタを生成することは、1つ以上の第2の計算ワークロードの1つ以上のビルディングブロックをビルディングブロックの部分セットに含めることを有することができる。
【0010】
いくつかの態様において、ビルディングブロックの部分セットを含む計算ノードのワークロードクラスタを生成することは、ワークロードクラスタの各次元について、1つ以上の第2の計算ワークロードの1つ以上のビルディングブロックの各ビルディングブロックが、1つ以上の第2の計算ワークロードのビルディングブロックではなく、ワークロードクラスタの他のビルディングブロックと通信するように、当該次元のための1つ以上の光回路スイッチの各々のルーティングデータを再構成することを含む。
(【0011】以降は省略されています)
この特許をJ-PlatPatで参照する
関連特許
グーグル エルエルシー
アシスタントコマンドの文脈的抑制
4日前
グーグル エルエルシー
光ネットワークを用いた再構成可能な計算ポッド
12日前
個人
音響装置
3か月前
個人
携帯端末保持具
3か月前
個人
店内配信予約システム
1か月前
日本無線株式会社
音声通信方式
3か月前
日本精機株式会社
投影システム
3か月前
サクサ株式会社
中継装置
1か月前
キヤノン株式会社
電子機器
1か月前
キヤノン株式会社
通信装置
2か月前
日本精機株式会社
車両用表示装置
2か月前
キヤノン株式会社
撮像装置
1か月前
個人
補聴器のイヤピース耳穴挿入具
2か月前
日本精機株式会社
画像投映システム
1か月前
キヤノン電子株式会社
モバイル装置
1か月前
電気興業株式会社
無線中継器
1か月前
キヤノン電子株式会社
画像読取装置
3か月前
ヤマハ株式会社
信号処理装置
1か月前
株式会社リコー
画像形成装置
9日前
キヤノン電子株式会社
画像読取装置
3か月前
リオン株式会社
電気機械変換器
2か月前
日本放送協会
映像伝送システム
3か月前
キヤノン株式会社
通信システム
2か月前
キヤノン株式会社
画像処理装置
2か月前
キヤノン株式会社
画像表示装置
2か月前
株式会社シグマ
撮像素子及び撮像装置
3か月前
キヤノン株式会社
画像処理装置
3か月前
キヤノン株式会社
撮影システム
2か月前
株式会社ニコン
撮像装置
19日前
株式会社ヴィーネックス
カメラ
2か月前
ブラザー工業株式会社
読取装置
4日前
キヤノン電子株式会社
シート材搬送装置
5日前
DXO株式会社
情報処理システム
16日前
エルメック株式会社
信号伝送回路
2か月前
株式会社クーネル
音響装置
2か月前
キヤノン電子株式会社
画像読取システム
2か月前
続きを見る
他の特許を見る