Zum Hauptinhalt springen

Warum ein Wechsel zu Supermicro Servern mit Intel Xeon Scalable Prozessoren der 4.

Die neuesten Server von Supermicro enthalten die 4. Generation der Intel Xeon Scalable Prozessoren. Diese neuen CPUs bieten eine deutliche Leistungssteigerung gegenüber den vorherigen zwei Generationen von Intel-CPUs. Es können viele Benchmarks durchgeführt werden, also schauen wir uns ein paar an.

Die Basisfunktionen vergleichen die verschiedenen Generationen von Intel Xeon CPUs.

 2. Generation (Cascade Lake) (92xx-Serie ausgeschlossen)3. Generation (Ice Lake)4. Generation (Sapphire Rapids)Erhöhung von 2 auf 4
Maximale Kerne284060114%
Maximale GHz bei maximalen Kernen2.72.31.9 
Max. Kern*GHz=28*2.7 = 75.6 =60*1.9 = 11451%
Speicher Geschwindigkeit2400 MHz3200 MHz4800 MHz100%
Maximaler Speicher pro Sockel3TB8TB (nur DRAM)8TB (nur DRAM)166%
Hoher BandbreitenspeicherXXBis zu 64 GBK.A.
UPI Links*Leistung2 @ 9,6 GT/s = 19,2 GT/s3 @ 11,2 GT/s = 33,6 GT/s4@16 GT/s = 64 GT/s233 %

Bereich der Benchmarks

Auch wenn es spezifische Benchmarks gibt, die allgemein anerkannt sind, lassen sich viele Arbeitslasten, die ein modernes Unternehmen ausführen kann, nicht einfach in einen allgemeinen Benchmark-Bericht zwingen. Benchmarks können in der folgenden Hierarchie kategorisiert werden, von einfachen bis hin zu vollständigen Anwendungen.

Niedrigste - absolute Höchstleistung auf der Grundlage der Fähigkeiten der CPU. Diese Zahl ist die theoretische Leistung einer einzelnen CPU und kann im Allgemeinen durch Multiplikation der Taktrate mit der Anzahl der Kerne und den Anweisungen pro Takt berechnet werden.

Math-Kernel-Ebenen - eine kleine Anwendung, die stark auf die CPU-Architektur abgestimmt ist. Die maximale Leistung beträgt in der Regel etwa 85 % der theoretischen Leistung. Der gängigste Mathematik-Benchmark ist LINPACK, der lineare Gleichungen löst.

Kleine Anwendungen - Die beliebteste für Server der Unternehmensklasse, die üblicherweise zum Testen der Systemleistung verwendet werden, ist SPEC (Standard Performance Evaluation Corporation). SPEC ist seit über 30 Jahren Anbieter und Sammler verschiedener Testsuiten.)

Vollständige Anwendungen - Vollständige Anwendungen werden ausgeführt, und die Zeit bis zur Fertigstellung wird aufgezeichnet.
 

Supermicro Server mit Intel Xeon Scalable Prozessoren der 4. Generation schneiden bei verschiedenen SPEC-Ergebnissen hervorragend ab. Im Einzelnen,

Die SPECcpu2017-Suite misst die Leistung eines Systems auf folgende Weise:

Fließkomma: (Anwendungen sind stark auf Fließkomma ausgerichtet)

  1. Geschwindigkeit - Von jeder Anwendung der Suite wird eine einzige Kopie ausgeführt. Die "Punktzahl" wird dann berechnet, indem die Zeit bis zur Fertigstellung eines Referenzrechners geteilt wird.
  2. Rate - Das System wird mit vielen Kopien der Testsuite geladen (in der Regel gleich der Anzahl der Threads), und das Ergebnis wird dann durch die Zeit einer Referenzmaschine geteilt.

Integer: (Anwendungen verwenden nur Ganzzahlberechnungen)

  1. Geschwindigkeit - Von jeder Anwendung der Suite wird eine einzige Kopie ausgeführt. Die "Punktzahl" wird dann berechnet, indem die Zeit bis zur Fertigstellung eines Referenzrechners geteilt wird.
  2. Rate - Das System wird mit vielen Kopien der Testsuite geladen (in der Regel entsprechend der Anzahl der Threads), und das Ergebnis wird dann durch eine Referenzmaschine geteilt.

Peak - Der Quellcode jeder Anwendung kann mit bestimmten Flags neu kompiliert werden.

Base - Die gleichen Compiler-Flags werden für die Kompilierung aller Anwendungen verwendet.

SPEC-Ergebnisse

Supermicro 8-Sockel SPEC CPU Benchmarks:

SPECcpu2017 Ganzzahlig
SystemIntel XeonArbeitsbelastungBedeutungErgebnis
SuperServer SYS-681E-TR8490HSPECcpu2017_int_speed_baseBestes 8-Steckdosen-System13.8
SuperServer SYS-681E-TR8490HSPECcpu2017_int_speed_peakBestes 8-Steckdosen-System14.0
SuperServer SYS-681E-TR8490HSPECcpu2017_int_rate_baseTop 3 Bestes 8-Steckdosen-System3510
SuperServer SYS-681E-TR8490HSPECcpu2017_int_rate_peakTop 2 Bestes 8-Steckdosen-System3560
SPECcpu2017 Fließkomma
SystemIntel XeonArbeitsbelastungBedeutungErgebnis
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_rate_baseTop 2 Bestes 8-Steckdosen-System3540
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_rate_peakTop 2 Bestes 8-Steckdosen-System3560
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_speed_baseBestes 8-Steckdosen-System343
SuperServer SYS-681E-TR8490HSPECcpu2017_fp_speed_peakBestes 8-Steckdosen-System334

Supermicro 4-Sockel SPEC CPU Benchmarks:

SPECcpu2017 Ganzzahlig
SystemIntel XeonArbeitsbelastungBedeutungErgebnis
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_rate_baseTop 4 Bestes 4-Steckdosen-System1930
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_rate_peakTop 4 Bestes 4-Steckdosen-System1970
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_speed_baseTop 3 Bestes 4-Steckdosen-System16
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_int_speed_peakTop 3 Bestes 4-Steckdosen-System16.2
SPECcpu2017 Fließkomma
SystemIntel XeonArbeitsbelastungBedeutungErgebnis
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_rate_baseTop 2 Bestes 4-Steckdosen-System1900
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_rate_peakTop 2 Bestes 4-Steckdosen-System2010
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_speed_baseTop 2 Bestes 4-Steckdosen-System387
SuperServer SYS-241H-TNRTTP8490HSPECcpu2017_fp_speed_peakTop 2 Bestes 4-Steckdosen-System387

SPECStorage

Der SPECstorage Solution 2020 Benchmark misst die Leistung einer gesamten Speicherkonfiguration im Zusammenspiel mit anwendungsbasierten Workloads. Die neueste Version enthält neue Workloads für künstliche IntelligenzKI) und Genomik, erweiterte benutzerdefinierte Workload-Funktionen, eine massiv verbesserte Skalierung und einen statistischen Visualisierungsmechanismus für die Anzeige von Benchmark-Ergebnissen.
(https://www.spec.org/storage2020/press/release.html)

SystemIntel XeonArbeitsbelastungBedeutungErgebnis
SYS-221H-TN24R Hyper8468V
8450H
SPECstorage-Lösung 2020Bestes SpecStorage_2020 Ergebnis auf KI Image0.57
SYS-221H-TN24R Hyper8468V
8450H
SPECstorage-Lösung 2020Bestes SpecStorage_2020 Ergebnis auf SWBUILD/Jobs: 720.47
SYS-221H-TN24R Hyper Storage Server8468V
8450H
SPECstorage-Lösung 2020#Nr. 1 SpecStorage_2020 Führung im Bereich Genomics nach Top 5 IDC-Anbietern.0.19
SYS-221H-TN24R Hyper Storage Server8468V
8450H
SPECstorage-Lösung 2020#1 SpecStorage_2020 Führerschaft bei VDA/Jobs: 720 pro Top 5 IDC-Anbietern.5.56
SYS-220U-TNR mit 22 NVMe-Speicher-Knoten8380
8360Y
SPECstorage-Lösung 2020#1 SpecStorage_2020 Führung bei EDA/Arbeitsplätzen: 240 nach Top 5 IDC-Anbietern.0.28
SuperServer SYS-741GE-TNRT8490HSPEChpc2021_kleinBestes Einzelknoten-Basisergebnis im MPI-Modell8.20
SuperServer SYS-741GE-TNRT8490HSPEChpc2021_klein#Nr. 1 bei den Einzelknoten-Ergebnissen auf Basis des OPM-Modells unter den Top-5-Anbietern laut IDC9.24
SuperServer SYS-741GE-TNRT8490HSPECpower_ssj2008#Führender 4U-Server unter den Top-5-Anbietern laut IDC13546

Vollständige Anwendungsbenchmarks mit Intel Accelerator Engines

Supermicro hat mehrere Benchmarks durchgeführt, die die Intel Xeon Scalable Prozessoren der 4. Generation mit verschiedenen aktivierten Intel Accelerator Engines vergleichen. Die untenstehende Tabelle zeigt reale Benchmarks und vergleicht einen Intel Xeon 8380 mit einem Intel Xeon 8490H sowohl hinsichtlich der Leistung als auch der Leistung pro Watt. Die Intel Accelerator Engine, die für den jeweiligen Benchmark verwendet wurde, ist ebenfalls aufgeführt. Die Besonderheiten der Server, auf denen die Benchmarks durchgeführt wurden, sind am Ende dieses Dokuments beschrieben.

Signifikante Leistungs- und Leistungs/Watt-Gewinne - Vorteile der Intel® Accelerator Engines

Der X13 CloudDC Server von Supermicrowurde für den ResNet 50 v1.5 Inference Benchmark verwendet, und der Intel Xeon 8480+ wurde mit der Intel Xeon 8380 CPU verglichen. In der nachstehenden Tabelle liegt der Leistungsgewinn je nach Datensatz zwischen dem 2,38- und 3,24-fachen. Für diesen Benchmark wurden die AMX-Beschleunigungsfunktionen von Intel verwendet.

SupermicroLeistungssteigerungen bei KI - ResNet 50 v1.5 Inferenz auf CloudDC SuperServer - Intel® Advanced Matrix Extensions (Intel® AMX). Bis zu 3,24x höhere Leistung.

Das X13 GrandTwin® System von Supermicrowurde mit Intel Xeon Gold Prozessoren der 3. Generation mit den Intel Xeon Gold Prozessoren der 4. Generation unter Verwendung der Intel® AMX Funktionen verglichen. Die Ergebnisse zeigen, dass beim ResNet 50 v1.5 Inferenztest ein Geschwindigkeitszuwachs zwischen 2,38 und 3,24 erreicht wurde.

SupermicroLeistungssteigerungen bei KI - ResNet 50 v1.5 Inferenz auf GrandTwin SuperServer - Intel® Advanced Matrix Extensions (Intel® AMX). Bis zu 2,85x bessere Leistung.

Es gibt eine signifikante Verbesserung für Datenbank- und Analyseanwendungen, wenn man von einem System der Supermicro X12 Generation mit dem Intel Xeon Scalable Prozessor der 3. Generation (mit 80 Kernen) auf den Intel Xeon Scalable Prozessor der 4. Generation (mit 48 Kernen) wechselt. Bei Verwendung einer X12 Ultra im Vergleich zu einer X13 Hyper wird ein Leistungsgewinn von 25 % bei der Verwendung der ClickHouse-Datenbank mit 40 % weniger Kernen beobachtet.

SupermicroLeistungssteigerungen in der Analytik - ClickHouse Verbesserung Gen über Gen. 25% höhere Leistung mit 40% weniger Kernen

Zusammenfassung

Die Intel Xeon Scalable Prozessoren der 4. Generation zeigen deutliche Leistungssteigerungen bei der Ausführung von Anwendungen auf den Supermicro 8- und 4-Sockel-Systemen. Das Supermicro SYS-681E-TR System mit acht Sockeln zeigt die schnellste Leistung auf einem einzelnen System, die jemals für aufgezeichnet wurde:

  • SPECcpu2017_int_rate_base
  • SPECcpu2017_int_rate_peak
  • SPECcpu2017_fp_rate_base
  • SPECcpu2017_fp_rate_peak

Die SMP-Architektur der Supermicro Server mit acht und vier Sockeln ist ideal für große Unternehmensanwendungen, die viele Kerne und Speicher benötigen.

Intel verbessert die Leistung und Sicherheit von Generation zu Generation. Im Folgenden finden Sie einen Vergleich, der mit freundlicher Genehmigung von Intel durchgeführt wurde und zeigt, wie Intel seine Leistung verbessert. Supermicro Server enthalten die neuesten Intel Xeon Scalable Prozessoren der 4. Generation in der gesamten Produktlinie, vom Edge-System bis hin zu Multiprozessorsystemen im Rechenzentrum.

Intel Accelerator Engines nach Prozessorgeneration (Vergleichstabelle)
Ressourcen und Konfigurationen