本文へスキップ

第4世代IntelXeon スケーラブル・プロセッサを搭載したSupermicro サーバーに移行する理由

Supermicro 最新サーバーには、第4世代IntelXeon Scalableプロセッサーが搭載されています。これらの新しいCPUは、前の2世代のIntel CPUよりも大幅にパフォーマンスを向上させています。多くのベンチマークを実行できるので、いくつか見てみましょう。

基本性能は、異なる世代のインテルXeon CPUを比較しています。

 第2世代(Cascade Lake)(92xxシリーズを除く)第3世代(アイスレイク)第4世代(サファイア・ラピッズ)2番手から4番手へ
最大コア数284060114%
最大コアでの最大GHz2.72.31.9 
最大コア*GHz=28*2.7 = 75.6 =60*1.9 = 11451%
メモリ速度2400 MHz3200 MHz4800 MHz100%
ソケットあたりの最大メモリ3TB8TB(DRAMのみ)8TB(DRAMのみ)166%
高帯域幅メモリXX最大64GB該当なし
UPIリンク*パフォーマンス2 @ 9.6 GT/s = 19.2 GT/s3 @ 11.2 GT/s = 33.6 GT/s4@16GT/s = 64GT/s233 %

ベンチマークの範囲

一般的に受け入れられている特定のベンチマークは存在するかもしれませんが、現代の企業が実行する可能性のある多くのワークロードは、単純に一般的なベンチマークレポートに押し込めることはできません。ベンチマークは、ローレベルからフルアプリケーションまで、以下の階層に分類することができます。

最低 - CPUの能力に基づく絶対的な最大性能。この数値は1つのCPUの理論上の性能であり、一般的にはクロックレートにコア数、クロックあたりの命令数を乗じることで算出できます。

数学カーネル・レベル - CPUアーキテクチャに高度に調整された小さなアプリケーション。最大性能は通常、理論性能の約85%です。最も一般的な数学ベンチマークは、線形方程式を解くLINPACKです。

小規模アプリケーション - システムの性能をテストするために一般的に使用されるエンタープライズクラスのサーバーで最も人気があるのは、SPEC(Standard Performance Evaluation Corporation)です。SPECは、30年以上にわたって様々なテスト・スイートを提供・収集しています。)

完全なアプリケーション - アプリケーション全体が実行され、完了までの時間が記録されます。
 

第4世代IntelXeon スケーラブル・プロセッサーを搭載したSupermicro サーバーは、SPECのさまざまな結果で優れた性能を発揮しました。具体的には

SPECcpu2017スイートは、以下の方法でシステムの性能を測定します:

浮動小数点: (アプリケーションは浮動小数点に重点を置いています)

  1. スピード - スイートの各アプリケーションを1部ずつ実行します。そして、基準マシンの完了までの時間を割って「スコア」を計算します。
  2. レート - テストスイートの多数のコピー(通常はスレッド数に等しい)をシステムにロードし、その結果を参照マシンの時間で割ります。

整数: (アプリケーションは整数計算のみを使用します)

  1. スピード - スイートの各アプリケーションを1部ずつ実行します。そして、基準マシンの完了までの時間を割って「スコア」を計算します。
  2. レート - テスト・スイートの多数のコピー(通常はスレッド数に等しい)をシステムにロードし、その結果を参照マシンで割ります。

ピーク - 各アプリケーションのソースコードは、特定のフラグを付けて再コンパイルすることができます。

Base - すべてのアプリケーションのコンパイルに同じコンパイラ・フラグが使用されます。

SPECの結果

Supermicro 8ソケットSPEC CPUベンチマーク:

SPECcpu2017 整数
システムインテルワークロード意義スコア
SuperServer SYS-681E-TR8490HSPECcpu2017_int_speed_baseベスト8ソケットシステム13.8
SuperServer SYS-681E-TR8490HSPECcpu2017_int_speed_peakベスト8ソケットシステム14.0
SuperServer SYS-681E-TR8490HSPECcpu2017_int_rate_baseトップ3 ベスト8ソケットシステム3510
SuperServer SYS-681E-TR8490HSPECcpu2017_int_rate_peakトップ2 ベスト8ソケットシステム3560
SPECcpu2017 浮動小数点
システムインテルワークロード意義スコア
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_rate_baseトップ2 ベスト8ソケットシステム3540
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_rate_peakトップ2 ベスト8ソケットシステム3560
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_speed_baseベスト8ソケットシステム343
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_speed_peakベスト8ソケットシステム334

Supermicro 4ソケットSPEC CPUベンチマーク:

SPECcpu2017 整数
システムインテルワークロード意義スコア
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_rate_baseトップ4 ベスト4ソケットシステム1930
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_rate_peakトップ4 ベスト4ソケットシステム1970
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_speed_baseトップ3 ベスト4ソケットシステム16
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_speed_peakトップ3 ベスト4ソケットシステム16.2
SPECcpu2017 浮動小数点
システムインテルワークロード意義スコア
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_rate_baseトップ2 ベスト4ソケットシステム1900
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_rate_peakトップ2 ベスト4ソケットシステム2010
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_speed_baseトップ2 ベスト4ソケットシステム387
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_speed_peakトップ2 ベスト4ソケットシステム387

SPECストレージ

SPECstorage Solution 2020ベンチマークは、アプリケーションベースの作業負荷と相互作用するストレージ構成全体の性能を測定します。最新版には、人工知能(AI)およびゲノミクス向けの新しいワークロード、カスタム・ワークロード機能の拡張、スケーリングの大幅な向上、ベンチマーク結果を表示するための統計的可視化メカニズムが含まれています。
(https://www.spec.org/storage2020/press/release.html)

システムインテルワークロード意義スコア
SYS-221H-TN24RHyper8468V
8450H
SPECstorage Solution 2020AIイメージでのSpecStorage_2020のベスト結果0.57
SYS-221H-TN24RHyper8468V
8450H
SPECstorage Solution 2020SWBUILD/JobsでのSpecStorage_2020のベスト結果:720.47
SYS-221H-TN24RHyper Storage Sever8468V
8450H
SPECstorage Solution 2020#1位 SpecStorage_2020 IDCベンダー上位5社によるゲノミクスのリーダーシップ。0.19
SYS-221H-TN24RHyper Storage Sever8468V
8450H
SPECstorage Solution 2020#1位 SpecStorage_2020 VDA/ジョブに関するリーダーシップ:IDCベンダー上位5社で720件。5.56
SYS-220U-TNRと22 NVMeストレージ・ノード8380
8360Y
SPECstorage Solution 2020#1位 SpecStorage_2020 EDA/ジョブに関するリーダーシップ:IDCベンダー上位5社で240。0.28
SuperServer SYS-741GE-TNRT8490HSPEChpc2021_タイニーMPIモデルでのシングルノードベースの最良の結果8.20
SuperServer SYS-741GE-TNRT8490HSPEChpc2021_タイニー#OPMモデルにおける単一ノードベースのリーダーシップは、IDCによるトップ5ベンダーの中でNo.19.24
SuperServer SYS-741GE-TNRT8490HSPECpower_ssj2008#IDCによるトップ5ベンダーのリーダーシップ4Uサーバ第1位13546

インテルアクセラレーターエンジンを使用したフルアプリケーションベンチマーク

Supermicro 、第4世代IntelXeon スケーラブル・プロセッサを、異なるIntelアクセラレータ・エンジンをオンにした状態で比較するベンチマークをいくつか実行しました。以下のグラフは、実際のベンチマークを示し、IntelXeon 8380とIntelXeon 8490Hのパフォーマンスとワットあたりのパフォーマンスを比較しています。特定のベンチマークに使用されたインテル・アクセラレータ・エンジンも記載されています。ベンチマークを実行したサーバーの詳細は、このドキュメントの最後に記載されています。

大幅なパフォーマンスとパフォーマンス/ワットの向上 - インテル® アクセラレーター・エンジンのメリット

SupermicroX13CloudDC サーバーがResNet 50 v1.5 Inferenceベンチマークのテストに使用され、IntelXeon 8480+がIntelXeon 8380 CPUと比較されました。下のグラフでは、データセットによって2.38倍から3.24倍の性能向上が見られました。このベンチマークには、インテルのAMXアクセラレーション機能が使用されています。

AIにおけるSupermicroパフォーマンス向上 -CloudDC SuperServer 上のResNet 50 v1.5推論 - Intel® Advanced Matrix Extensions (Intel® AMX)。最大3.24倍の性能向上。

SupermicroX13 GrandTwin®システムは、Intel® AMX機能を使用して、第3世代IntelXeon Goldプロセッサーと第4世代IntelXeon Goldプロセッサーと比較されました。その結果、ResNet 50 v1.5の推論テストを実行した場合、2.38から3.24のスピードアップが見られました。

AIにおけるSupermicroパフォーマンス向上 - GrandTwinSuperServer 上のResNet 50 v1.5推論 - Intel® Advanced Matrix Extensions (Intel® AMX)。最大2.85倍の性能向上。

第3世代IntelXeon Scalableプロセッサー(80コア使用)を搭載したSupermicro X12世代システムから第4世代IntelXeon Scalableプロセッサー(48コア使用)に移行すると、データベースおよび分析アプリケーションで大幅な改善が見られます。X12Ultra プラットフォームをX13Hyper プラットフォームと比較すると、40%少ないコア数でClickHouseデータベースを使用した場合、25%の性能向上が確認されました。

アナリティクスにおけるSupermicroパフォーマンス向上 - ClickHouseの世代間向上 40%少ないコア数で25%高いパフォーマンス

概要

第4世代IntelXeon Scalableプロセッサは、Supermicro 8ソケットおよび4ソケットシステムでアプリケーションを実行する際に、大幅なパフォーマンスの向上を示しています。Supermicro SYS-681E-TR 8ソケットシステムは、これまで記録された1つのシステムで最速のパフォーマンスを示しています:

  • SPECcpu2017_int_rate_base
  • SPECcpu2017_int_rate_peak
  • SPECcpu2017_fp_rate_base
  • SPECcpu2017_fp_rate_peak

8ソケットおよび4ソケットのSupermicro サーバーのSMPアーキテクチャは、多くのコアとメモリを必要とする大規模なエンタープライズアプリケーションに最適です。

インテルは、世代ごとに一貫してパフォーマンスとセキュリティを向上させています。以下は、Intelの提供による、Intelがいかにパフォーマンスを向上させているかを示す比較です。Supermicro サーバーは、エッジからデータセンター内のマルチプロセッサー・システムまで、製品ライン全体で最新の第4世代IntelXeon Scalableプロセッサーを搭載しています。

プロセッサー世代別インテル・アクセラレーター・エンジン(比較表)
リソースと構成