第4世代IntelXeon スケーラブル・プロセッサを搭載したSupermicro サーバーに移行する理由
基本性能は、異なる世代のインテルXeon CPUを比較しています。
第2世代(Cascade Lake)(92xxシリーズを除く) | 第3世代(アイスレイク) | 第4世代(サファイア・ラピッズ) | 2番手から4番手へ | |
---|---|---|---|---|
最大コア数 | 28 | 40 | 60 | 114% |
最大コアでの最大GHz | 2.7 | 2.3 | 1.9 | |
最大コア*GHz | =28*2.7 = 75.6 | =60*1.9 = 114 | 51% | |
メモリ速度 | 2400 MHz | 3200 MHz | 4800 MHz | 100% |
ソケットあたりの最大メモリ | 3TB | 8TB(DRAMのみ) | 8TB(DRAMのみ) | 166% |
高帯域幅メモリ | X | X | 最大64GB | 該当なし |
UPIリンク*パフォーマンス | 2 @ 9.6 GT/s = 19.2 GT/s | 3 @ 11.2 GT/s = 33.6 GT/s | 4@16GT/s = 64GT/s | 233 % |
ベンチマークの範囲
一般的に受け入れられている特定のベンチマークは存在するかもしれませんが、現代の企業が実行する可能性のある多くのワークロードは、単純に一般的なベンチマークレポートに押し込めることはできません。ベンチマークは、ローレベルからフルアプリケーションまで、以下の階層に分類することができます。
最低 - CPUの能力に基づく絶対的な最大性能。この数値は1つのCPUの理論上の性能であり、一般的にはクロックレートにコア数、クロックあたりの命令数を乗じることで算出できます。
数学カーネル・レベル - CPUアーキテクチャに高度に調整された小さなアプリケーション。最大性能は通常、理論性能の約85%です。最も一般的な数学ベンチマークは、線形方程式を解くLINPACKです。
小規模アプリケーション - システムの性能をテストするために一般的に使用されるエンタープライズクラスのサーバーで最も人気があるのは、SPEC(Standard Performance Evaluation Corporation)です。SPECは、30年以上にわたって様々なテスト・スイートを提供・収集しています。)
完全なアプリケーション - アプリケーション全体が実行され、完了までの時間が記録されます。
第4世代IntelXeon スケーラブル・プロセッサーを搭載したSupermicro サーバーは、SPECのさまざまな結果で優れた性能を発揮しました。具体的には
SPECcpu2017スイートは、以下の方法でシステムの性能を測定します:
浮動小数点: (アプリケーションは浮動小数点に重点を置いています)
- スピード - スイートの各アプリケーションを1部ずつ実行します。そして、基準マシンの完了までの時間を割って「スコア」を計算します。
- レート - テストスイートの多数のコピー(通常はスレッド数に等しい)をシステムにロードし、その結果を参照マシンの時間で割ります。
整数: (アプリケーションは整数計算のみを使用します)
- スピード - スイートの各アプリケーションを1部ずつ実行します。そして、基準マシンの完了までの時間を割って「スコア」を計算します。
- レート - テスト・スイートの多数のコピー(通常はスレッド数に等しい)をシステムにロードし、その結果を参照マシンで割ります。
ピーク - 各アプリケーションのソースコードは、特定のフラグを付けて再コンパイルすることができます。
Base - すべてのアプリケーションのコンパイルに同じコンパイラ・フラグが使用されます。
SPECの結果
Supermicro 8ソケットSPEC CPUベンチマーク:
システム | インテル | ワークロード | 意義 | スコア |
---|---|---|---|---|
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_base | ベスト8ソケットシステム | 13.8 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_peak | ベスト8ソケットシステム | 14.0 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_base | トップ3 ベスト8ソケットシステム | 3510 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_peak | トップ2 ベスト8ソケットシステム | 3560 |
システム | インテル | ワークロード | 意義 | スコア |
---|---|---|---|---|
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_base | トップ2 ベスト8ソケットシステム | 3540 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_peak | トップ2 ベスト8ソケットシステム | 3560 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_base | ベスト8ソケットシステム | 343 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_peak | ベスト8ソケットシステム | 334 |
Supermicro 4ソケットSPEC CPUベンチマーク:
システム | インテル | ワークロード | 意義 | スコア |
---|---|---|---|---|
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_base | トップ4 ベスト4ソケットシステム | 1930 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_peak | トップ4 ベスト4ソケットシステム | 1970 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_base | トップ3 ベスト4ソケットシステム | 16 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_peak | トップ3 ベスト4ソケットシステム | 16.2 |
システム | インテル | ワークロード | 意義 | スコア |
---|---|---|---|---|
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_base | トップ2 ベスト4ソケットシステム | 1900 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_peak | トップ2 ベスト4ソケットシステム | 2010 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_base | トップ2 ベスト4ソケットシステム | 387 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_peak | トップ2 ベスト4ソケットシステム | 387 |
SPECストレージ
SPECstorage Solution 2020ベンチマークは、アプリケーションベースの作業負荷と相互作用するストレージ構成全体の性能を測定します。最新版には、人工知能(AI)およびゲノミクス向けの新しいワークロード、カスタム・ワークロード機能の拡張、スケーリングの大幅な向上、ベンチマーク結果を表示するための統計的可視化メカニズムが含まれています。
(https://www.spec.org/storage2020/press/release.html)
システム | インテル | ワークロード | 意義 | スコア |
---|---|---|---|---|
SYS-221H-TN24RHyper | 8468V 8450H | SPECstorage Solution 2020 | AIイメージでのSpecStorage_2020のベスト結果 | 0.57 |
SYS-221H-TN24RHyper | 8468V 8450H | SPECstorage Solution 2020 | SWBUILD/JobsでのSpecStorage_2020のベスト結果:72 | 0.47 |
SYS-221H-TN24RHyper Storage Sever | 8468V 8450H | SPECstorage Solution 2020 | #1位 SpecStorage_2020 IDCベンダー上位5社によるゲノミクスのリーダーシップ。 | 0.19 |
SYS-221H-TN24RHyper Storage Sever | 8468V 8450H | SPECstorage Solution 2020 | #1位 SpecStorage_2020 VDA/ジョブに関するリーダーシップ:IDCベンダー上位5社で720件。 | 5.56 |
SYS-220U-TNRと22 NVMeストレージ・ノード | 8380 8360Y | SPECstorage Solution 2020 | #1位 SpecStorage_2020 EDA/ジョブに関するリーダーシップ:IDCベンダー上位5社で240。 | 0.28 |
SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_タイニー | MPIモデルでのシングルノードベースの最良の結果 | 8.20 |
SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_タイニー | #OPMモデルにおける単一ノードベースのリーダーシップは、IDCによるトップ5ベンダーの中でNo.1 | 9.24 |
SuperServer SYS-741GE-TNRT | 8490H | SPECpower_ssj2008 | #IDCによるトップ5ベンダーのリーダーシップ4Uサーバ第1位 | 13546 |
インテルアクセラレーターエンジンを使用したフルアプリケーションベンチマーク
Supermicro 、第4世代IntelXeon スケーラブル・プロセッサを、異なるIntelアクセラレータ・エンジンをオンにした状態で比較するベンチマークをいくつか実行しました。以下のグラフは、実際のベンチマークを示し、IntelXeon 8380とIntelXeon 8490Hのパフォーマンスとワットあたりのパフォーマンスを比較しています。特定のベンチマークに使用されたインテル・アクセラレータ・エンジンも記載されています。ベンチマークを実行したサーバーの詳細は、このドキュメントの最後に記載されています。

SupermicroX13CloudDC サーバーがResNet 50 v1.5 Inferenceベンチマークのテストに使用され、IntelXeon 8480+がIntelXeon 8380 CPUと比較されました。下のグラフでは、データセットによって2.38倍から3.24倍の性能向上が見られました。このベンチマークには、インテルのAMXアクセラレーション機能が使用されています。

SupermicroX13 GrandTwin®システムは、Intel® AMX機能を使用して、第3世代IntelXeon Goldプロセッサーと第4世代IntelXeon Goldプロセッサーと比較されました。その結果、ResNet 50 v1.5の推論テストを実行した場合、2.38から3.24のスピードアップが見られました。

第3世代IntelXeon Scalableプロセッサー(80コア使用)を搭載したSupermicro X12世代システムから第4世代IntelXeon Scalableプロセッサー(48コア使用)に移行すると、データベースおよび分析アプリケーションで大幅な改善が見られます。X12Ultra プラットフォームをX13Hyper プラットフォームと比較すると、40%少ないコア数でClickHouseデータベースを使用した場合、25%の性能向上が確認されました。

概要
第4世代IntelXeon Scalableプロセッサは、Supermicro 8ソケットおよび4ソケットシステムでアプリケーションを実行する際に、大幅なパフォーマンスの向上を示しています。Supermicro SYS-681E-TR 8ソケットシステムは、これまで記録された1つのシステムで最速のパフォーマンスを示しています:
- SPECcpu2017_int_rate_base
- SPECcpu2017_int_rate_peak
- SPECcpu2017_fp_rate_base
- SPECcpu2017_fp_rate_peak
8ソケットおよび4ソケットのSupermicro サーバーのSMPアーキテクチャは、多くのコアとメモリを必要とする大規模なエンタープライズアプリケーションに最適です。
インテルは、世代ごとに一貫してパフォーマンスとセキュリティを向上させています。以下は、Intelの提供による、Intelがいかにパフォーマンスを向上させているかを示す比較です。Supermicro サーバーは、エッジからデータセンター内のマルチプロセッサー・システムまで、製品ライン全体で最新の第4世代IntelXeon Scalableプロセッサーを搭載しています。

