Warum ein Wechsel zu Supermicro Servern mit Intel Xeon Scalable Prozessoren der 4.
Die Basisfunktionen vergleichen die verschiedenen Generationen von Intel Xeon CPUs.
2. Generation (Cascade Lake) (92xx-Serie ausgeschlossen) | 3. Generation (Ice Lake) | 4. Generation (Sapphire Rapids) | Erhöhung von 2 auf 4 | |
---|---|---|---|---|
Maximale Kerne | 28 | 40 | 60 | 114% |
Maximale GHz bei maximalen Kernen | 2.7 | 2.3 | 1.9 | |
Max. Kern*GHz | =28*2.7 = 75.6 | =60*1.9 = 114 | 51% | |
Speicher Geschwindigkeit | 2400 MHz | 3200 MHz | 4800 MHz | 100% |
Maximaler Speicher pro Sockel | 3TB | 8TB (nur DRAM) | 8TB (nur DRAM) | 166% |
Hoher Bandbreitenspeicher | X | X | Bis zu 64 GB | K.A. |
UPI Links*Leistung | 2 @ 9,6 GT/s = 19,2 GT/s | 3 @ 11,2 GT/s = 33,6 GT/s | 4@16 GT/s = 64 GT/s | 233 % |
Bereich der Benchmarks
Auch wenn es spezifische Benchmarks gibt, die allgemein anerkannt sind, lassen sich viele Arbeitslasten, die ein modernes Unternehmen ausführen kann, nicht einfach in einen allgemeinen Benchmark-Bericht zwingen. Benchmarks können in der folgenden Hierarchie kategorisiert werden, von einfachen bis hin zu vollständigen Anwendungen.
Niedrigste - absolute Höchstleistung auf der Grundlage der Fähigkeiten der CPU. Diese Zahl ist die theoretische Leistung einer einzelnen CPU und kann im Allgemeinen durch Multiplikation der Taktrate mit der Anzahl der Kerne und den Anweisungen pro Takt berechnet werden.
Math-Kernel-Ebenen - eine kleine Anwendung, die stark auf die CPU-Architektur abgestimmt ist. Die maximale Leistung beträgt in der Regel etwa 85 % der theoretischen Leistung. Der gängigste Mathematik-Benchmark ist LINPACK, der lineare Gleichungen löst.
Kleine Anwendungen - Die beliebteste für Server der Unternehmensklasse, die üblicherweise zum Testen der Systemleistung verwendet werden, ist SPEC (Standard Performance Evaluation Corporation). SPEC ist seit über 30 Jahren Anbieter und Sammler verschiedener Testsuiten.)
Vollständige Anwendungen - Vollständige Anwendungen werden ausgeführt, und die Zeit bis zur Fertigstellung wird aufgezeichnet.
Supermicro Server mit Intel Xeon Scalable Prozessoren der 4. Generation schneiden bei verschiedenen SPEC-Ergebnissen hervorragend ab. Im Einzelnen,
Die SPECcpu2017-Suite misst die Leistung eines Systems auf folgende Weise:
Fließkomma: (Anwendungen sind stark auf Fließkomma ausgerichtet)
- Geschwindigkeit - Von jeder Anwendung der Suite wird eine einzige Kopie ausgeführt. Die "Punktzahl" wird dann berechnet, indem die Zeit bis zur Fertigstellung eines Referenzrechners geteilt wird.
- Rate - Das System wird mit vielen Kopien der Testsuite geladen (in der Regel gleich der Anzahl der Threads), und das Ergebnis wird dann durch die Zeit einer Referenzmaschine geteilt.
Integer: (Anwendungen verwenden nur Ganzzahlberechnungen)
- Geschwindigkeit - Von jeder Anwendung der Suite wird eine einzige Kopie ausgeführt. Die "Punktzahl" wird dann berechnet, indem die Zeit bis zur Fertigstellung eines Referenzrechners geteilt wird.
- Rate - Das System wird mit vielen Kopien der Testsuite geladen (in der Regel entsprechend der Anzahl der Threads), und das Ergebnis wird dann durch eine Referenzmaschine geteilt.
Peak - Der Quellcode jeder Anwendung kann mit bestimmten Flags neu kompiliert werden.
Base - Die gleichen Compiler-Flags werden für die Kompilierung aller Anwendungen verwendet.
SPEC-Ergebnisse
Supermicro 8-Sockel SPEC CPU Benchmarks:
System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
---|---|---|---|---|
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_base | Bestes 8-Steckdosen-System | 13.8 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_speed_peak | Bestes 8-Steckdosen-System | 14.0 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_base | Top 3 Bestes 8-Steckdosen-System | 3510 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_int_rate_peak | Top 2 Bestes 8-Steckdosen-System | 3560 |
System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
---|---|---|---|---|
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_base | Top 2 Bestes 8-Steckdosen-System | 3540 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_rate_peak | Top 2 Bestes 8-Steckdosen-System | 3560 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_base | Bestes 8-Steckdosen-System | 343 |
SuperServer SYS-681E-TR | 8490H | SPECcpu2017_fp_speed_peak | Bestes 8-Steckdosen-System | 334 |
Supermicro 4-Sockel SPEC CPU Benchmarks:
System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
---|---|---|---|---|
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_base | Top 4 Bestes 4-Steckdosen-System | 1930 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_rate_peak | Top 4 Bestes 4-Steckdosen-System | 1970 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_base | Top 3 Bestes 4-Steckdosen-System | 16 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_int_speed_peak | Top 3 Bestes 4-Steckdosen-System | 16.2 |
System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
---|---|---|---|---|
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_base | Top 2 Bestes 4-Steckdosen-System | 1900 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_rate_peak | Top 2 Bestes 4-Steckdosen-System | 2010 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_base | Top 2 Bestes 4-Steckdosen-System | 387 |
SuperServer SYS-241H-TNRTTP | 8490H | SPECcpu2017_fp_speed_peak | Top 2 Bestes 4-Steckdosen-System | 387 |
SPECStorage
Der SPECstorage Solution 2020 Benchmark misst die Leistung einer gesamten Speicherkonfiguration im Zusammenspiel mit anwendungsbasierten Workloads. Die neueste Version enthält neue Workloads für künstliche IntelligenzKI) und Genomik, erweiterte benutzerdefinierte Workload-Funktionen, eine massiv verbesserte Skalierung und einen statistischen Visualisierungsmechanismus für die Anzeige von Benchmark-Ergebnissen.
(https://www.spec.org/storage2020/press/release.html)
System | Intel Xeon | Arbeitsbelastung | Bedeutung | Ergebnis |
---|---|---|---|---|
SYS-221H-TN24R Hyper | 8468V 8450H | SPECstorage-Lösung 2020 | Bestes SpecStorage_2020 Ergebnis auf KI Image | 0.57 |
SYS-221H-TN24R Hyper | 8468V 8450H | SPECstorage-Lösung 2020 | Bestes SpecStorage_2020 Ergebnis auf SWBUILD/Jobs: 72 | 0.47 |
SYS-221H-TN24R Hyper Storage Server | 8468V 8450H | SPECstorage-Lösung 2020 | #Nr. 1 SpecStorage_2020 Führung im Bereich Genomics nach Top 5 IDC-Anbietern. | 0.19 |
SYS-221H-TN24R Hyper Storage Server | 8468V 8450H | SPECstorage-Lösung 2020 | #1 SpecStorage_2020 Führerschaft bei VDA/Jobs: 720 pro Top 5 IDC-Anbietern. | 5.56 |
SYS-220U-TNR mit 22 NVMe-Speicher-Knoten | 8380 8360Y | SPECstorage-Lösung 2020 | #1 SpecStorage_2020 Führung bei EDA/Arbeitsplätzen: 240 nach Top 5 IDC-Anbietern. | 0.28 |
SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_klein | Bestes Einzelknoten-Basisergebnis im MPI-Modell | 8.20 |
SuperServer SYS-741GE-TNRT | 8490H | SPEChpc2021_klein | #Nr. 1 bei den Einzelknoten-Ergebnissen auf Basis des OPM-Modells unter den Top-5-Anbietern laut IDC | 9.24 |
SuperServer SYS-741GE-TNRT | 8490H | SPECpower_ssj2008 | #Führender 4U-Server unter den Top-5-Anbietern laut IDC | 13546 |
Vollständige Anwendungsbenchmarks mit Intel Accelerator Engines
Supermicro hat mehrere Benchmarks durchgeführt, die die Intel Xeon Scalable Prozessoren der 4. Generation mit verschiedenen aktivierten Intel Accelerator Engines vergleichen. Die untenstehende Tabelle zeigt reale Benchmarks und vergleicht einen Intel Xeon 8380 mit einem Intel Xeon 8490H sowohl hinsichtlich der Leistung als auch der Leistung pro Watt. Die Intel Accelerator Engine, die für den jeweiligen Benchmark verwendet wurde, ist ebenfalls aufgeführt. Die Besonderheiten der Server, auf denen die Benchmarks durchgeführt wurden, sind am Ende dieses Dokuments beschrieben.

Der X13 CloudDC Server von Supermicrowurde für den ResNet 50 v1.5 Inference Benchmark verwendet, und der Intel Xeon 8480+ wurde mit der Intel Xeon 8380 CPU verglichen. In der nachstehenden Tabelle liegt der Leistungsgewinn je nach Datensatz zwischen dem 2,38- und 3,24-fachen. Für diesen Benchmark wurden die AMX-Beschleunigungsfunktionen von Intel verwendet.

Das X13 GrandTwin® System von Supermicrowurde mit Intel Xeon Gold Prozessoren der 3. Generation mit den Intel Xeon Gold Prozessoren der 4. Generation unter Verwendung der Intel® AMX Funktionen verglichen. Die Ergebnisse zeigen, dass beim ResNet 50 v1.5 Inferenztest ein Geschwindigkeitszuwachs zwischen 2,38 und 3,24 erreicht wurde.

Es gibt eine signifikante Verbesserung für Datenbank- und Analyseanwendungen, wenn man von einem System der Supermicro X12 Generation mit dem Intel Xeon Scalable Prozessor der 3. Generation (mit 80 Kernen) auf den Intel Xeon Scalable Prozessor der 4. Generation (mit 48 Kernen) wechselt. Bei Verwendung einer X12 Ultra im Vergleich zu einer X13 Hyper wird ein Leistungsgewinn von 25 % bei der Verwendung der ClickHouse-Datenbank mit 40 % weniger Kernen beobachtet.

Zusammenfassung
Die Intel Xeon Scalable Prozessoren der 4. Generation zeigen deutliche Leistungssteigerungen bei der Ausführung von Anwendungen auf den Supermicro 8- und 4-Sockel-Systemen. Das Supermicro SYS-681E-TR System mit acht Sockeln zeigt die schnellste Leistung auf einem einzelnen System, die jemals für aufgezeichnet wurde:
- SPECcpu2017_int_rate_base
- SPECcpu2017_int_rate_peak
- SPECcpu2017_fp_rate_base
- SPECcpu2017_fp_rate_peak
Die SMP-Architektur der Supermicro Server mit acht und vier Sockeln ist ideal für große Unternehmensanwendungen, die viele Kerne und Speicher benötigen.
Intel verbessert die Leistung und Sicherheit von Generation zu Generation. Im Folgenden finden Sie einen Vergleich, der mit freundlicher Genehmigung von Intel durchgeführt wurde und zeigt, wie Intel seine Leistung verbessert. Supermicro Server enthalten die neuesten Intel Xeon Scalable Prozessoren der 4. Generation in der gesamten Produktlinie, vom Edge-System bis hin zu Multiprozessorsystemen im Rechenzentrum.

