Soluciones de servidores de infraestructura de IA para empresas

Acelere todas las cargas de trabajo

Desbloquee todo el potencial de la IA con las soluciones de infraestructura de vanguardia de Supermicro preparadas para IA. Desde el entrenamiento a gran escala hasta la inferencia inteligente en el borde, nuestros diseños de referencia llave en mano agilizan y aceleran la implementación de la IA. Potencie sus cargas de trabajo con un rendimiento y una escalabilidad óptimos al tiempo que optimiza los costes y minimiza el impacto medioambiental. Descubra un mundo de posibilidades con la diversa selección de soluciones optimizadas para cargas de trabajo de IA de Supermicro y acelere cada aspecto de su negocio.

Entrenamiento de IA a gran escala

HPC/AI

Inferencia y formación en IA empresarial

Visualización y diseño

Entrega de contenidos y virtualización

AI Edge

Entrenamiento e inferencia de IA a gran escala

Grandes modelos lingüísticos, entrenamiento generativo de IA, conducción autónoma, robótica

El entrenamiento de IA a gran escala exige tecnologías de vanguardia para maximizar la potencia de cálculo paralelo de las GPU, con el fin de gestionar miles de millones, si no billones, de parámetros de modelos de IA que deben entrenarse con conjuntos de datos masivos. Aprovechando las soluciones NVIDIA HGX™ B300/B200, GB300/GB200 NVL72 y las interconexiones GPU-GPU NVLink® y NVSwitch® más rápidas, con un ancho de banda de hasta 1,8 TB/s, así como la red 1:1 más rápida para cada GPU para la agrupación de nodos, estos sistemas están optimizados para entrenar grandes modelos de lenguaje desde cero y ponerlos a disposición de millones de usuarios simultáneos. Completando la pila con NVMe totalmente flash para un rápido flujo de datos de IA, Supermicro racks totalmente integrados con opciones de refrigeración líquida para garantizar una rápida implementación y una experiencia de entrenamiento de IA fluida.

NVIDIA® HGX™ B300 con 8 GPU — NVIDIA HGX B300 con 8 GPU

NVIDIA® HGX™ B200 con 8 GPU — HGX B200 con 8 GPU

Superchip NVIDIA® GB300 Grace™ Blackwell — GB300 Grace™ Blackwell Superchip

Superchip NVIDIA® GB200 Grace™ Blackwell — GB200 Superchip de Grace Blackwell

NVIDIA® HGX™ H200 con 8 GPU — HGX H200 con 8 GPU

Tamaños de carga de trabajo

Extra grande
Grande
Mediana
Almacenamiento

Capacidad de carga de trabajo extragrande: sistemas y racks NVIDIA HGX B300/B200 refrigerados por líquido — Sistemas y racks NVIDIA HGX B300/B200 refrigerados por líquido
Obtenga más información

Tamaño de carga de trabajo extragrande: NVIDIA GB300 NVL72 con refrigeración Supermicro — NVIDIA GB300 NVL72 con refrigeración Supermicro
Obtenga más información

Tamaño de carga de trabajo extragrande: NVIDIA GB200 NVL72 con refrigeración líquida de Supermicro — NVIDIA GB200 NVL72 con refrigeración líquida de Supermicro
Obtenga más información

Cargas de trabajo de gran volumen: sistemas y racks NVIDIA HGX B300/B200 refrigerados por aire — Sistemas y racks NVIDIA HGX B300/B200 refrigerados por aire
Obtenga más información

Carga de trabajo media: sistema de 8U con NVIDIA® HGX™ H200 de 8 GPU — Sistema 8U con NVIDIA HGX H200 de 8 GPU
Obtenga más información

Flash NVMe a escala de petabytes
Obtenga más información

Disco duro a escala de petabytes — Almacenamiento en disco duro a escala de petabytes
Obtenga más información

Recursos

Configuración de bastidor de servidor para formación de IA a gran escala

HPC/AI

Simulación de ingeniería, investigación científica, secuenciación genómica, descubrimiento de fármacos

Cada vez son más las cargas de trabajo de HPC que aumentan los algoritmos de aprendizaje automático y la computación paralela acelerada por GPU para acelerar los descubrimientos de científicos, investigadores e ingenieros. Muchos de los clusters de supercomputación más rápidos del mundo ya aprovechan las ventajas de las GPU y el poder de la IA.

Las cargas de trabajo HPC suelen requerir simulaciones y análisis intensivos en datos con conjuntos de datos masivos y requisitos de precisión. Las GPU, como las H100/H200 de NVIDIA, ofrecen un rendimiento de doble precisión sin precedentes, entregando 60 teraflops por GPU, y las plataformas HPC altamente flexibles de Supermicro permiten un elevado número de GPU y CPU en una variedad de factores de forma densos con integración a escala de rack y refrigeración líquida.

Superchip NVIDIA® GH200 Grace Hopper™ — Superchip GH200 Grace Hopper™

GPU NVIDIA® RTX PRO™ 6000 Blackwell Server Edition — RTX PRO™ 6000 Blackwell SE

Tamaños de carga de trabajo

Grande
Mediana

Sistema de gran capacidad para cargas de trabajo: 8U/10 con NVIDIA HGX B200 de 8 GPU — Sistema 8U/10 con NVIDIA HGX B200 de 8 GPU
Obtenga más información

Volumen de trabajo elevado: NVIDIA GB200 NVL4 — NVIDIA GB200 NVL4
Obtenga más información

Gran volumen de trabajo: SuperBlade® de 6U/8U — SuperBlade® de 6U/8U
Obtenga más información

Tamaño medio de carga de trabajo: 4U/5U 8-10 GPU PCIe — 3U/4U/5U, 8-10 GPU, PCIe
Obtenga más información

Tamaño medio de la carga de trabajo: Sistema de tolva Grace 1U — Sistema de tolva Grace 1U
Obtenga más información

Recursos

Configuración de racks de servidores para IA/HPC

Inferencia y formación en IA empresarial

Inferencia generativa de IA, servicios/aplicaciones basados en IA, chatbots, sistemas de recomendación, automatización empresarial

El auge de la IA generativa ha sido reconocido como la próxima frontera para diversos sectores, desde la tecnología hasta la banca y los medios de comunicación. Ha comenzado la carrera por adoptar la IA como fuente para generar innovación, impulsar significativamente la productividad, agilizar las operaciones, tomar decisiones basadas en datos y mejorar la experiencia del cliente.

Tanto si se trata de aplicaciones y modelos de negocio asistidos por IA, como de chatbots inteligentes similares a los humanos para la atención al cliente, o de IA para copilotar la generación de código y la creación de contenidos, las empresas pueden aprovechar marcos abiertos, bibliotecas, modelos de IA preentrenados y perfeccionarlos para casos de uso únicos con su propio conjunto de datos. A medida que la empresa adopta la infraestructura de IA, la variedad de sistemas optimizados para GPU de Supermicro proporciona una arquitectura modular abierta, flexibilidad de proveedor y rutas de despliegue y actualización sencillas para tecnologías en rápida evolución.

GPU NVIDIA® RTX PRO™ 4500 Blackwell Server Edition — RTX PRO 4500 Blackwell SE

Tamaños de carga de trabajo

Extra grande
Grande
Mediana

Tamaño de carga de trabajo extragrande: 4U/5U 8-10 GPU PCIe — 3U/4U/5U, 8-10 GPU, PCIe
Obtenga más información

Tamaño medio de carga de trabajo: 6U SuperBlade — 6U SuperBlade
Obtenga más información

Tamaño medio de la carga de trabajo: Sistema MGX 2U — Sistema MGX 2U
Obtenga más información

Tamaño medio de la carga de trabajo: Sistema Grace MGX de 2U — Sistema Grace MGX 2U
Obtenga más información

Recursos

Configuración de racks de servidores para inferencia y entrenamiento de IA empresarial

Visualización y diseño

Colaboración en tiempo real, diseño 3D, desarrollo de juegos

La mayor fidelidad de los gráficos 3D y las aplicaciones habilitadas para IA por las GPU modernas está acelerando la digitalización industrial, transformando los procesos de desarrollo y diseño de productos, la fabricación y la creación de contenidos con simulaciones 3D fieles a la realidad para alcanzar nuevas cotas de calidad, iteraciones infinitas sin costes de oportunidad y plazos de comercialización más rápidos.

Construya infraestructura de producción virtual a escala para acelerar la digitalización industrial a través de las soluciones totalmente integradas de Supermicro, incluyendo los sistemas 4U/5U de 8-10 GPU, una arquitectura de referencia NVIDIA OVX™ optimizada para NVIDIA Omniverse Enterprise con conectores Universal Scene Description (USD), y servidores rack y estaciones de trabajo multi-GPU certificados por NVIDIA.

Tamaños de carga de trabajo

Grande
Mediana

Gran tamaño de carga de trabajo: 4U/5U 8 GPU — 4U/5U 8 GPU
Obtenga más información

Tamaño medio de la carga de trabajo: 2U Hyper — Hyper 2U
Obtenga más información

Tamaño medio de la carga de trabajo: Estación de trabajo AI — Estaciones de trabajo AI
Obtenga más información

Tamaño medio de la carga de trabajo: Estación de trabajo gráfica — Estaciones de trabajo gráficas
Obtenga más información

Recursos

Configuración de bastidores de servidores para visualización y omniverso

Entrega de contenidos y virtualización

Redes de distribución de contenidos (CDN), transcodificación, compresión, juegos en la nube y streaming

Las cargas de trabajo de distribución de vídeo siguen constituyendo una parte significativa del tráfico actual de Internet. A medida que los proveedores de servicios de streaming ofrecen cada vez más contenidos en 4K e incluso 8K, o juegos en la nube con una mayor frecuencia de actualización, la aceleración de la GPU con motores multimedia es imprescindible para multiplicar el rendimiento de los canales de streaming y reducir la cantidad de datos necesarios con una mayor fidelidad visual, gracias a las últimas tecnologías como la codificación y descodificación AV1.

Los sistemas multinodo y multi-GPU de Supermicro, como el sistema BigTwin® 2U de 4 nodos, cumplen los estrictos requisitos de la entrega de video moderna, con cada nodo compatible con la GPU NVIDIA L4 y la capacidad de ofrecer abundante almacenamiento PCIe Gen5 y velocidad de redes para impulsar el exigente pipeline de datos de las redes de entrega de contenido.

Tamaños de carga de trabajo

Grande
Mediana
Pequeño

Gran tamaño de carga de trabajo: BigTwin® 2U de 4 nodos — BigTwin® 2U de 4 nodos
Obtenga más información

Tamaño medio de carga de trabajo: CloudDC 2U UP — 2U UP CloudDC
Obtenga más información

Tamaño reducido de la carga de trabajo: Hyper 2U DP — 2U DP Hyper
Obtenga más información

Recursos

Configuración del bastidor del servidor para la entrega y virtualización de contenidos

Inteligencia Artificial

Transcodificación de vídeo Edge, inferencia Edge, formación Edge

En todos los sectores, las empresas cuyos empleados y clientes trabajan en ubicaciones periféricas (ciudades, fábricas, tiendas, hospitales, etc.) están invirtiendo cada vez más en la implementación de la IA en el perímetro. Al procesar los datos y utilizar algoritmos de IA y ML en el perímetro, las empresas superan las limitaciones de ancho de banda y latencia, lo que permite el análisis en tiempo real para la toma de decisiones oportuna, la atención predictiva y los servicios personalizados, así como la optimización de las operaciones empresariales.

Los servidores Supermicro Edge AI, creados específicamente y optimizados para el entorno, con varios factores de forma compactos, ofrecen el rendimiento necesario para una baja latencia, arquitectura abierta con componentes preintegrados, compatibilidad con diversas pilas de hardware y software, y conjuntos de características de privacidad y seguridad necesarios para despliegues edge complejos listos para usar.

Tamaños de carga de trabajo

Extra grande
Grande
Mediana
Pequeño

Tamaño de la carga de trabajo extragrande: Hyper — Hyper
Obtenga más información

Gran tamaño de la carga de trabajo: Sistema de borde de caja compacto — Compacto
Obtenga más información

Carga de trabajo de tamaño medio: Servidor Edge Multi-GPU de poca profundidad — Servidor Edge Multi-GPU de corta profundidad
Obtenga más información

Pequeño tamaño de la carga de trabajo: Embedded — Sin ventilador
Obtenga más información

Recursos

Configuración de rack de servidores para Edge AI

Soluciones destacadas

Discurso del Director General de COMPUTEX 2024

Servidores Rack

Procesador dual 1U

Procesador dual 2U

Procesador único

Multiprocesador

Familias de productos

Servidores GPU

Líneas GPU 8U/10U

Líneas GPU 4U/5U

Líneas GPU 2U

Líneas GPU 1U

Servidores Twin

FlexTwin™

BigTwin

GrandTwin

TwinPro

FatTwin

Blade

SuperBlade

MicroBlade

MicroCloud

Almacenamiento

Todos los sistemas de almacenamiento

NVMe todo flash

Almacenamiento de carga superior

JBOF

Almacenamiento Petascale Grace

Almacenamiento optimizado para empresas

Cajas de almacenamiento JBOD

Placas base

Servidores

Mesas de trabajo

Placas integradas / IoT

Sobremesa / Placas de juego

Matriz de la placa base

SKU globales

Chasis

Chasis 1U

Chasis 2U

Chasis 3U

Chasis 4U / Torre

Media / Minitorre

Chasis integrado / IoT

Bastidores móviles / Kits de accionamiento

Cajas de almacenamiento JBOD

SKU globales

SuperRack

Servicio de integración en bastidor

Accesorios

Matriz de cables

Matriz de tarjetas Riser

Matriz AOC de almacenamiento

Matriz de alimentación

Matriz del disipador térmico

Matriz de ventiladores del sistema

Bastidores móviles / Kits de accionamiento

Biseles delanteros del chasis

Almacenamiento, E/S, Seguridad

Sistemas de IA periférica e IoT

Sistemas de bordes compactos

Servidores Edge compactos

Servidores Edge para montaje en rack

Componentes integrados

Placas base integradas

Chasis integrado

Interruptores

Adaptadores

SuperWorkstations

Plataforma de desarrollo de IA refrigerada por líquido

Un solo procesador

Doble procesador

Escritorio

Soluciones de juego Supero™

Infraestructura de IA

Soluciones en bloques para centros de datos® (DCBBS)

Fábrica de IA

Inteligencia Artificial

Almacenamiento AI

Soluciones de IA para la industria

Soluciones NVIDIA