HPCインフラストラクチャにSupermicro 選ぶ5つの理由
1.製品範囲
Supermicro 、エッジからデータセンター向けに最適化された幅広いサーバを設計、製造しています。幅広い構成が利用可能なサーバーを選択する前に、特定のアプリケーション要件を理解する必要があります。考慮すべき機能は以下のとおりです:
- CPU数 -Supermicro 、1,2,4,8CPUを1つのシステムに搭載したシステムを提供しています。アプリケーションのスケーラビリティ(コア数を増やすとアプリケーションはスケールするのか、最大いくつまでスケールするのか)、および/または同時に実行する異なるアプリケーションの数は、重要な考慮事項です。Supermicro 、1つのシャーシに1~8 CPUのサーバーを搭載し、環境の制約に応じてさまざまなオプションを提供しています。
- メモリ要件 - SMPアーキテクチャでは、各CPUがそのソケットから一定量のメモリをアドレス指定できるため、2、4、8CPUのいずれであっても、一般に、より多くのメモリが利用可能です。ただし、物理的な制約により、CPUあたりのDIMM数は製品ファミリごとに異なる場合があります。
- ダイレクトアタッチドストレージ -Supermicro 各サーバは、さまざまな形式、容量、数量のダイレクトアタッチドストレージに対応します。システムの多くは、NVMe/SAS/SATAストレージデバイスを搭載できます。さらに、最新のEDSFF E1.SおよびE3.Sデバイスにも対応しています。
- ネットワーキング - システム間で実行されるアプリケーション(おそらくMPIを使用)では、低レイテンシで高速なネットワーキングが、結果をより速く得るために重要です。Supermicro 、1Gから400Gまでの幅広いネットワークオプションを提供しています。ネットワークは、特定のサーバでDPUを使用することもできます。

Supermicro SuperBlade®

Supermicro Hyper
2.ラックスケールの統合
HPC環境では、高性能サーバーを満載した数十のラックが必要であり、それらを一緒にテストする必要があります。サーバ、ストレージ、ネットワーク、そしておそらく液冷を含むラックを統合するには、専門知識と、最適なソリューションを決定するためのお客様との協力関係が必要です。Supermicro 、さまざまな要件に対応するラック規模のソリューションを構築するための専門知識と経験があります。システムがネットワーク接続されたラック(L11)や複数のラックのクラスタ(L12)をテストするには、製造能力とエンドユーザーのアプリケーションや環境に関する知識が必要です。クラスタ規模で液冷全体をテストするには、専用の設備が稼動し、利用可能である必要があります。最先端のハードウェアで単一ラックから複数ラックまでを作成・構築するのは簡単な作業ではなく、ベンダーはサーバー、ストレージ、ネットワーキング、冷却、統合に関する専門知識を持っている必要があります。

Supermicro Rack Scale Integrationの詳細はこちら
3.主要ベンダーの最新CPU
CPUは常に改良されており、新しいマイクロプロセッサの世代が増えるごとに、ワットあたりの性能は向上しています。Intel、AMD、NVIDIAはいずれも、さまざまな製品ファミリーのCPUを製造しています。最高性能のCPUは、3~5GHzのデータ処理が可能で、最大128コアを搭載しています。デュアルソケットサーバーに組み合わせると、1つのアプリケーションまたは複数のアプリケーションを同時に実行するために数百のコアを使用できます。Supermicro 主要なCPUメーカーと提携し、HPC向けの最新技術を搭載した幅広いサーバを提供しています。最大8TBのメモリに対応するシングルソケットサーバであれ、最大32TBのメモリに対応するマルチプロセッサシステムであれ、Supermicro あらゆるHPCアプリケーションに対応するシステムを取り揃えています。
インテルプロセッサ搭載Supermicro サーバーの詳細
AMD プロセッサ搭載Supermicro サーバーの詳細
4.主要ベンダーの最新GPU
GPUは、多くのHPCアプリケーションにとって不可欠なものとなっています。多くのアプリケーションは、GPUに見られる並列性を利用して、アルゴリズムの特定の部分で動作するように変更されています。何千ものコアを搭載したGPUでは、HPCアルゴリズムの一部をCPUからGPUに移すことができ、その結果、驚異的なスピードアップが実現します。CPUと同様に、HPCアプリケーションにはさまざまなGPUを使用できます。さまざまなフォームファクターと、CPUへのさまざまな通信経路が利用可能です。多くのGPUはPCIeバス上にあり、PCIeとCPUを介して互いに通信する必要がありますが、他のGPUは独自のボード上にあり、アプリケーション速度を向上させるために互いに通信します(ただし、最初の情報転送はPCIeバスを介して行われます)。

8個のNVIDIA HGX H100 GPUを搭載したユニバーサルGPU
NVIDIA製GPUを搭載したSupermicro GPUサーバーの詳細はこちら
インテルGPU搭載Supermicro GPUサーバーの詳細
5.ストレージとネットワークシステム
HPCシステムには、データをCPUに転送し、中間結果と最終回答を書き戻すための高速ストレージが必要です。サーバーは、コンピュートまたはストレージのいずれかに設計され、最適化されます。コンピュート用に最適化されたサーバーの多くは、旧世代よりも大幅に多くのストレージを搭載していますが、多くのコンピュート・サーバーに接続できるように設計され、読み取りと書き込みを同時に実行できる優れたサーバーも必要です。堅牢なHPC環境には、高速で低レイテンシーのハードウェアから、ウォームストレージ、コールドストレージ、アーカイブ用のハードディスクドライブまで、さまざまなストレージ技術が必要です。
HPC環境のネットワーキングには、高性能のイーサネットやインフィニバンドのアダプターやスイッチが必要になります。複数のサーバーが同じ問題に共同で取り組む場合、サーバーはデータや結果を頻繁に交換する必要があるため、高速ネットワークが必要になります。アプリケーションに必要なネットワークに加えて、サーバーを管理し、必要に応じてアップデートを実行するための独立した管理ネットワークが必要です。

24台のE3.S NVMeデバイスを搭載したSupermicro ストレージサーバ
6.概要
Supermicro 、HPCワークロードに最適化された幅広いサーバーおよびストレージシステムを設計・製造しています。Supermicro 製造するHPCサーバーは、Intel、AMD、NVIDIAの最新CPUと、NVIDIA、Intel、AMD最新世代GPUをベースにしています。ラックスケールと完全にテストされたクラスターソリューションを提供する専門知識を持つSupermicro 、HPC環境において世界的に認知されたメーカーでありサプライヤーです。