Accelerated Building Blocks with Intel GPUs
![Intel® logo](/sites/default/files/accelerators/intel/intel-logo-dark-bg.png)
Para entrenamiento e inferencia de IA a escala de nube
La demanda de computación de alto rendimiento para entrenamiento de IA/Aprendizaje Profundo (DL) se ha duplicado en tamaño cada 3,5 meses desde 2013 (según OpenAI) y se está acelerando con el creciente tamaño de los conjuntos de datos y el número de aplicaciones y servicios basados en grandes modelos de lenguaje (LLM), visión computacional, sistemas de recomendación y más.
Con el aumento de la demanda de un mayor rendimiento, rendimiento y capacidad de formación e inferencia, el sector necesita sistemas creados específicamente que ofrezcan una mayor eficiencia, menor coste, facilidad de implementación, flexibilidad para permitir la personalización y escalabilidad de los sistemas de IA. La IA se ha convertido en una tecnología esencial para diversas áreas como copilotos, asistentes virtuales, automatización de la fabricación, operaciones de vehículos autónomos e imágenes médicas, por nombrar algunas. Supermicro se ha asociado con Intel para proporcionar un sistema a escala de nube y un diseño de bastidor con los aceleradores Intel Gaudi AI.
![Sistema de formación de IA Supermicro 8U Gaudi2 SYS-820GH-TNR2](/sites/default/files/content_resources/static_resources/accelerators/intel/gaudi2-system-SYS-820GH-TNR2-front.png)
New Supermicro X14 Gaudi® 3 AI Training and Inference Platform
Bringing choice to the enterprise AI market, the new Supermicro X14 AI training platform is built on the third generation Intel® Gaudi 3 accelerators, designed to further increase the efficiency of large-scale AI model training and AI inferencing. Available in both air-cooled and liquid-cooled configurations, Supermicro's X14 Gaudi 3 solution easily scales to meet a wide range of AI workload requirements.
- GPU: 8 Gaudi 3 HL-325L (air-cooled) or HL-335 (liquid-cooled) accelerators on OAM 2.0 baseboard
- CPU: Dual Intel® Xeon® 6 processors
- Memory: 24 DIMMs - up to 6TB memory in 1DPC
- Drives: Up to 8 hot-swap PCIe 5.0 NVMe
- Power Supplies: 8 3000W high efficiency fully redundant (4+4) Titanium Level
- Networking: 6 front OSFP 800GbE ports for scale-out
- Expansion Slots: 2 PCIe 5.0 x16 (FHHL) + 2 PCIe 5.0 x8 (FHHL)s
- Workloads: AI Training and Inference
Servidor de formación de IA Supermicro Gaudi®2
Basándose en el éxito del sistema de formación de IA Supermicro Gaudi original, el servidor de IA Gaudi 2 prioriza dos consideraciones clave: integrar aceleradores de IA con módulos de red de alta velocidad incorporados para impulsar la eficiencia operativa para la formación de modelos de IA de última generación y aportar al sector de la IA la opción que necesita.
- GPU: 8 tarjetas mezzanine Gaudi2 HL-225H
- CPU: Dos procesadores Intel® Xeon® Scalable de 3ª generación
- Memoria: 32 módulos DIMM - hasta 8 TB de memoria SDRAM ECC registrada DDR4-3200 MHz
- Unidades: hasta 24 unidades intercambiables en caliente (SATA/NVMe/SAS)
- Alimentación: 6 fuentes de alimentación totalmente redundantes de 3000 W y alta eficiencia (54 V+12 V)
- Redes: 24 enlaces SerDes PAM4 de 100 GbE (48 x 56 Gb) mediante 6 QSFP-DD
- Ranuras de expansión: 2 conmutadores PCIe 4.0
- Cargas de trabajo: Formación e inferencia de IA
Máxima densidad de cómputo para capacitación, inferencias y visualización de inteligencia artificial
Diseñada para cargas de trabajo de visualización y HPC de escalado ascendente y descendente, la nueva serie Intel Data Center GPU Max es la GPU de mayor densidad de Intel y puede integrarse en una gama de sistemas Supermicro para obtener el máximo rendimiento informático acelerado.
- Factor de forma PCIe que admite un TDP de hasta 300 W, con futuras iteraciones compatibles con el módulo acelerador abierto (OAM) para obtener aún más potencia y rendimiento.
- 408 MB de caché L2 y 64 MB de caché L1 para aumentar el rendimiento.
- La única GPU HPC/AI del sector con aceleración nativa del trazado de rayos.
- Interconexión directa de hasta 4 GPU a través de puentes Xe Link
- Optimizada para funcionar con los procesadores escalables Intel® Xeon® de 4ª generación, incluidas las CPU Intel Xeon Max
![Aspectos destacados de las especificaciones de la GPU Intel® para centros de datos](/sites/default/files/accelerators/intel/SYS-420GP_Intel-Max-card.png)
![PVC](/sites/default/files/accelerators/intel/IntelPVC_01.png)
![PVC](/sites/default/files/accelerators/intel/IntelPVC_02.png)
![PVC](/sites/default/files/accelerators/intel/IntelPVC_03.png)
![PVC](/sites/default/files/accelerators/intel/IntelPVC_04.png)
Optimizado para HPC
Máxima capacidad y flexibilidad de GPU para aplicaciones intensivas de HPC e IA con hasta 10 GPU en un chasis 4U
- GPU: Hasta 10 GPU Intel® serie Max para centros de datos (en PCIe 5.0 x16)
- CPU: Dos procesadores escalables Intel® Xeon® de 4ª generación
- Memoria: 32 módulos DIMM; hasta 8 TB de memoria DDR5, compatible con la memoria persistente Intel® Optane
- Unidades: 8x 2,5" SAS/SATA híbridas + 8x 2,5"
- U.2 NVMe directas a CPU + 8x 2.5" U.2 NVMe
- directo a almacenamiento (opcional)
![SYS-821GV-TNR](/sites/default/files/accelerators/intel/featured_SYS-821GE-TNHR.png)
Optimizado para entrenamiento de IA a gran escala, IA generativa y HPC
- GPU 8 GPU Intel® Data Center Max 1550 (600 W) OAM (nombre en clave Ponte Vecchio)
- Rendimiento: 6,7 petaFLOPS FP16/BF16
- Memoria de la GPU: 1 TB HBM2
- Ancho de banda de la memoria de la GPU: 3.276,8 GB/s
- Interconexión GPU-GPU: 742 GB/s de ancho de banda XeLink Scale Up
- Ecosistema abierto con oneAPI
- CPU: Dos procesadores escalables Intel® Xeon® de 4ª generación
- Memoria: 32 ranuras DIMM; hasta 8 TB DDR5
- Unidades: Hasta 24 unidades NVMe/SATA de 2,5" intercambiables en caliente
- Compatible con refrigeración por aire y refrigeración líquida de GPU/CPU
![Tres sistemas Supermicro compatibles con las GPU Intel® Data Center](/sites/default/files/accelerators/intel/datacenter-gpu-3sys.png)
Para procesamiento y distribución de contenidos multimedia, transcodificación, juegos en la nube e inferencia visual de inteligencia artificial
A medida que la demanda de streaming de medios y juegos y de inferencias visuales sigue aumentando rápidamente, las organizaciones necesitan soluciones eficientes y escalables que puedan ofrecer servicios a miles o millones de usuarios simultáneos sin afectar a la calidad ni a la latencia. Las soluciones de computación acelerada de Supermicro incorporan la nueva GPU Intel Data Center optimizada para cargas de trabajo multimedia y en la nube.
Las GPU de Intel soportan una pila de software abierta y basada en estándares optimizada para densidad y calidad con capacidades de servidor críticas para alta fiabilidad, disponibilidad y escalabilidad en procesamiento de medios, entrega de medios, inferencia visual de IA, juegos en la nube y virtualización.
![Aspectos destacados de las especificaciones de la GPU Intel® para centros de datos](/sites/default/files/accelerators/intel/datacenter-gpu-spec-highlights_v2.png)
- Transcodificación de video: Más de 30 transmisiones a 1080p
- Juegos en la nube: más de 40 transmisiones de juegos
- Infraestructura de escritorio virtual: 62 funciones virtualizadas
- Inferencia: 150 TOPS DE IA
- Hasta 4 motores multimedia Xe
- Hasta 32 núcleos Xe y unidades de trazado de rayos
- Primera codificación y descodificación AV1 HW del sector
- Aceleración de IA XMX integrada
Ver la charla técnica
![Miniatura de la charla técnica sobre la GPU universal](https://img.youtube.com/vi/KRqI_x89r4o/maxresdefault.jpg)
Thomas Jorgensen, director sénior de habilitación tecnológica de Supermicro, se sienta a hablar sobre las ventajas exclusivas de los sistemas Supermicro basados en la serie Intel Data Center GPU Flex.
Resumen de la solución
![Resumen de la solución Cloud Gaming](/sites/default/files/accelerators/intel/cloud-gaming-solution-brief.png)
Supermicro e Intel colaboraron para ofrecer un rendimiento excepcional para una plataforma de juegos en la nube a gran escala que establece más de 560 transmisiones transcodificadas 1080p @60Hz por sistema.
Demostración de streaming 4K
![Miniatura de la demostración de transmisión 4K](/sites/default/files/accelerators/intel/thumbnail-4k-streaming-video.jpg)
Este vídeo muestra la solución de transmisión de vídeo 4K en tiempo real de Supermicro utilizando la serie Intel Data Center GPU Flex, con hasta 8 transmisiones simultáneas desde una única GPU.
Transcodificación optimizada
Diseño de alto rendimiento para un máximo rendimiento de procesamiento multimedia, con hasta 10 GPU en un chasis 4U
- GPU: Hasta 10 GPU Intel® serie Flex para centros de datos (en PCI-E 4.0 x16)
- CPU: Dos procesadores escalables Intel® Xeon® de 3ª generación
- Memoria: 32 módulos DIMM; hasta 8 TB, o 12 TB con memoria Intel® Optane® persistente
- Unidades: 24 bahías para unidades intercambiables en caliente de 2,5" (8x NVMe/8x SATA/8x SATA/SAS)
Entrega de medios optimizada
Sistema multinodo con alta densidad de computación optimizado para la transmisión de contenidos multimedia y juegos en la nube.
- GPU: Hasta 2 GPU Intel® serie Flex para centros de datos por nodo (en PCI-E 4.0 x16)
- CPU: Dos procesadores escalables Intel® Xeon® de 3ª generación por nodo
- Memoria: 20 módulos DIMM; hasta 4 TB, o 6 TB por nodo con memoria Intel® Optane® persistente
- Unidades: 6 bahías para unidades NVMe/SATA de 2,5" intercambiables en caliente por nodo
Optimizado para juegos en la nube
Sistema multinodo diseñado para configuraciones de GPU de alta densidad en un factor de forma 2U
- GPU: Hasta 3 GPU Intel® serie Flex para centros de datos por nodo (en PCI-E 4.0 x16)
- CPU: Un procesador escalable Intel® Xeon® de 3ª generación por nodo
- Memoria: 8 módulos DIMM; hasta 2 TB por nodo
- Unidades: 2 bahías para unidades U.2 NVMe de 2,5" intercambiables en caliente por nodo
Inferencia visual optimizada
Plataforma escalable con hasta 6 GPU diseñada para el procesamiento de IA de imágenes en la nube
- GPU: Hasta 6 GPU Intel® serie Flex para centros de datos por nodo (en PCI-E 4.0 x16/x8)
- CPU: Dos procesadores escalables Intel® Xeon® de 3ª generación
- Memoria: 16 módulos DIMM; hasta 4 TB, o 6 TB con memoria Intel® Optane® persistente
- Unidades: 12 bahías para unidades híbridas NVMe/SAS/SATA de 2,5"/3,5" intercambiables en caliente
Inferencia visual optimizada
Plataforma Edge compacta con hasta 2 GPU
- GPU: Hasta 2 GPU Intel® serie Flex para centros de datos
- CPU: Procesador escalable Intel® Xeon® de 3ª generación de hasta 32 núcleos
- Memoria: 8 módulos DIMM
- Unidades: 4 bahías para unidades SATA internas de 2,5
![SYS-110P-FRDN2T](/sites/default/files/accelerators/intel/featured_SYS-110P-FRDN2T.png)
Inferencia visual optimizada para Edge
Plataforma Edge compacta de 1U con hasta 2 GPU
- GPU: Hasta 2 GPU Intel® serie Flex para centros de datos
- CPU: Procesador escalable Intel® Xeon® de 3ª generación de hasta 32 núcleos
- Memoria: 8 módulos DIMM
- Unidades: 2 bahías para unidades de 2,5" y 1 M.2 NVMe o 1 M.2 SATA3
Accelerating AI Compute With Supermicro Servers In The INTEL® Developer Cloud
Supermicro Advanced AI Servers featuring Intel® Xeon® Processors and Intel® Gaudi® 2 AI Accelerators Bring High-Performance, High-efficiency AI Cloud Compute, Training, and Inferencing to Developers and Enterprises
Superior Media Processing and Delivery Solution Based On Supermicro Servers W/ Intel® Data Center GPU Flex Series
Supermicro Systems with Intel® Data Center GPU Flex Series
![](/sites/default/files/video_thumbnails/KRqI_x89r4o.jpg)
Supermicro TECHTalk: New Media Processing Solutions Based on Intel Data Center GPU Flex Series
Watch as our product experts discuss the new Supermicro solutions based on the just announced Intel Data Center GPU Flex Series. Learn how these solutions can help benefit you and your company.
Delivering Scalable Cloud-Gaming
Supermicro Systems with Intel® Data Center GPU Flex Series
Supermicro offers all the system components for cloud service providers to build green, cost-effective, and profitable cloud gaming infrastructure.
Innovative Solutions for Cloud Gaming, Media, Transcoding, & AI Inferencing
Sep 08 2022, 10:00am PDT
Supermicro and Intel product and solution experts will discuss, in an informal session, the benefits of the solutions in the areas of Cloud Gaming, Media Delivery, Transcoding, and AI Inferencing using the recently announced Intel Flex Series GPUs. The webinar will explain the advantages of the Supermicro solutions, the ideal servers and the benefits of using the Intel Flex Series GPUs.
Supermicro and Habana® High-Performance, High-Efficiency AI Training System
Enabling up to 40% better price/performance for Deep Learning training than traditional AI solutions