Nvidia ha presentado la GPU Blackwell B200, que afirman es el “chip más poderoso del mundo” para la inteligencia artificial. Diseñada para democratizar la IA de billones de parámetros, esta GPU ofrece hasta 20 petaflops de potencia FP4 gracias a sus 208 mil millones de transistores. La combinación de dos GPUs B200 con un solo CPU Grace en el “superchip” GB200 puede ofrecer 30 veces el rendimiento para cargas de trabajo de inferencia LLM, además de ser más eficiente energéticamente, reduciendo costos y consumo hasta en 25 veces en comparación con el H100 de Nvidia.
Entre las mejoras clave de la Blackwell B200 se encuentra un motor de transformadores de segunda generación que duplica el cómputo, el ancho de banda y el tamaño del modelo al utilizar cuatro bits para cada neurona en lugar de ocho. Además, un switch NVLink de próxima generación permite que 576 GPUs se comuniquen entre sí con 1.8 terabytes por segundo de ancho de banda bidireccional.
Nvidia está empaquetando estas GPUs en diseños más grandes para supercomputadoras, como el NVL72 GB200, que conecta 36 CPUs y 72 GPUs en un solo rack refrigerado por líquido para un total de 720 petaflops de rendimiento de entrenamiento de IA. Amazon, Google, Microsoft y Oracle ya están planeando ofrecer estos racks en sus servicios en la nube.
Características clave de la GPU Blackwell B200:
- Ofrece hasta 20 petaflops de potencia FP4.
- Combina dos GPUs B200 con un CPU Grace en el “superchip” GB200 para un rendimiento mejorado.
- Es más eficiente energéticamente, reduciendo costos y consumo hasta en 25 veces en comparación con el H100 de Nvidia.
- Utiliza un motor de transformadores de segunda generación que duplica el cómputo, el ancho de banda y el tamaño del modelo al utilizar cuatro bits para cada neurona en lugar de ocho.
- El switch NVLink de próxima generación permite la comunicación entre 576 GPUs con 1.8 terabytes por segundo de ancho de banda bidireccional.