Vera Rubin: plataforma modular para data centers de IA de grande porte
Hoje, durante a conferência GTC 2026, a Nvidia apresentou sua nova plataforma de computação voltada para inteligência artificial: Vera Rubin. Ela reúne o processador de servidor Vera e a plataforma de GPU Rubin NVL72.
O processador Vera vem com 88 núcleos personalizados NVIDIA Olympus e suporte à tecnologia de multithreading espacial, que permite a cada núcleo executar duas tarefas ao mesmo tempo. O CPU usa memória LPDDR5X com largura de banda de até 1,2 TB/s. Segundo a Nvidia, o Vera CPU é cinco vezes mais rápido e duas vezes mais eficiente em termos energéticos do que processadores de servidor tradicionais. Quando trabalha em conjunto com a GPU Rubin pela via NVLink-C2C, a largura de banda chega a 1,8 TB/s.
A Nvidia também mostrou um rack de servidor baseado no Vera com 256 CPUs resfriados a líquido. De acordo com a empresa, um único rack desse tipo suporta mais de 22 500 ambientes de CPU simultâneos com desempenho total. Nos servidores com CPU Vera, tanto em configurações de um soquete quanto de dois soquetes, serão usados adaptadores de rede ConnectX SuperNICs e DPU BlueField-4.
A plataforma de GPU Rubin NVL72 combina 72 GPUs Rubin e 36 CPUs Vera. A Nvidia afirma que essa configuração consegue treinar modelos com arquitetura de mistura de especialistas usando quatro vezes menos GPUs em comparação com a arquitetura Blackwell, além de oferecer até 10 vezes mais throughput de inferência por watt.
Grandes provedores de nuvem e empresas de tecnologia, entre eles AWS, Google Cloud, Microsoft Azure, Oracle Cloud, Alibaba, Dell, HP, Lenovo e outros, já confirmaram suporte à plataforma. Segundo a Nvidia, o Vera já entrou em produção em escala total, e as entregas por meio de parceiros começarão na segunda metade de 2026.
Comentários
Ainda não há comentários. Seja o primeiro!
Deixar um comentário