Nvidia Rubin CPX entrega 8 exaFLOPS para Super IAs é a mais recente aposta da fabricante para alavancar a inferência de modelos gigantes de inteligência artificial. Anunciado nesta quarta-feira (10/09/2025) durante a AI Infra Summit, o acelerador chega com 128 GB de memória GDDR7 e mira aplicações de alto valor, como criação de vídeos, softwares generativos e codificação.
Desenvolvido para suceder a família Blackwell, o chip Rubin CPX recebeu otimizações específicas para processar sequências longas com maior eficiência energética. Segundo a Nvidia, um investimento de US$ 100 milhões em equipamentos com a nova tecnologia pode gerar até US$ 5 bilhões em receita para empresas que adotarem a solução.
Nvidia Rubin CPX entrega 8 exaFLOPS para Super IAs
O núcleo do avanço está na integração do Rubin CPX aos racks de servidores Vera Rubin NVL144 CPX. Cada unidade combina 144 GPUs Rubin CPX, 144 GPUs Rubin tradicionais e 36 CPUs Vera, totalizando impressionantes oito exaFLOPS de potência teórica, 100 TB de memória VRAM e largura de banda de 1,7 petabytes por segundo, quase oito vezes mais que a atual plataforma Blackwell Ultra.
Especificações técnicas
• 30 petaFLOPS de computação NVFP4 por GPU;
• 128 GB de VRAM GDDR7 por unidade, gerando alta largura de banda a custo inferior às memórias HBM;
• Disponibilidade inicial para grandes corporações no fim de 2026, com opções de rack sem o módulo CPX limitadas a 3,5 exaFLOPS.
Modelo de negócios e produção
A Nvidia não revelou o processo de fabricação, mas indicou parceria com a TSMC para construir o chip em litografia avançada. Ao destacar o potencial retorno sobre o investimento, a empresa posiciona a plataforma como alternativa “barata” para a futura geração de Super IAs, apesar de seu preço multimilionário.
Mais detalhes técnicos podem ser conferidos no comunicado oficial da fabricante, disponível no site da Nvidia, reconhecido pela alta autoridade em hardware e inteligência artificial.
Para especialistas do setor, a chegada do Rubin CPX estabelece um novo patamar de desempenho em data centers, ao mesmo tempo em que prepara o terreno para cargas de trabalho cada vez mais complexas, como geração de vídeo em tempo real e aplicativos de linguagem de escala massiva.
Quer entender como essas inovações impactam o mercado brasileiro e a adoção de IA nas empresas? Acesse nossa editoria de Inteligência Artificial e acompanhe as últimas análises. Continue conosco!
Crédito da imagem: Nvidia