Quão mais rápido é o Google TPU 8t em relação ao seu predecessor?

O Google afirma que o TPU 8t entrega 2,8 vezes o desempenho de treinamento do TPU Ironwood de sétima geração, anunciado em novembro de 2025, pelo mesmo custo. Ambos os novos chips contêm 384 MB de SRAM — o triplo dos 128 MB do Ironwood — o que reduz a latência de acesso à memória externa.

A OpenAI está usando TPUs do Google em vez de GPUs da Nvidia?

A partir de abril de 2026, a OpenAI está comprando capacidade de TPU do Google paralelamente ao uso contínuo de hardware da Nvidia. Historicamente, a OpenAI treinou seus modelos quase exclusivamente em GPUs da Nvidia. O anúncio do Cloud Next é o primeiro sinal público confirmado de que a OpenAI está diversificando seus fornecedores de computação.

Quando os TPU 8t e 8i do Google estarão disponíveis comercialmente?

O Google Cloud disse "mais tarde em 2026" em sua conferência Cloud Next em 22 de abril de 2026, mas não especificou o trimestre. Os chips ainda não estão disponíveis ao público em geral em 26 de abril de 2026.

Como os TPUs do Google se comparam às GPUs da Nvidia para cargas de trabalho de IA?

Os TPUs são construídos especificamente para operações matriciais usadas em aprendizado profundo, enquanto as GPUs da Nvidia são aceleradoras de uso mais geral, respaldadas pelo ecossistema de software CUDA. O Google afirma que o TPU 8 supera o hardware comparável da Nvidia em benchmarks de treinamento e inferência, mas a maioria dos laboratórios de IA ainda usa a Nvidia devido à compatibilidade de software e às ferramentas consolidadas.

Os Chips Google TPU 8 Miram Diretamente a Nvi…

O Google apresentou dois chips de IA no Cloud Next 2026 em 22 de abril, entregando 2,8× o desempenho de treinamento da geração anterior — e a OpenAI agora está comprando capacidade de TPU do Google.

Um único chip com 384 megabytes de SRAM integrada — o triplo da memória de seu predecessor — é a mais recente aposta do Google para destronar a Nvidia como processador padrão da indústria global de IA.

O Google apresentou duas novas unidades de processamento tensorial em sua conferência Cloud Next em Las Vegas, em 22 de abril de 2026: o TPU 8t, projetado para o treinamento de grandes modelos de IA, e o TPU 8i, otimizado para tarefas de inferência. Juntos, representam o desafio competitivo mais direcionado da empresa às linhas H100 e B200 da Nvidia. O anúncio trouxe um sinal comercial incomum: a OpenAI, que treinou seus modelos quase exclusivamente em hardware da Nvidia desde sua fundação, agora está comprando capacidade de TPU do Google Cloud.

Google Cloud · TPU 8 · artificial intelligence chips

As afirmações de desempenho são substanciais. O Google diz que o TPU 8t entrega 2,8 vezes a taxa de transferência de treinamento do chip Ironwood de sétima geração, anunciado em novembro de 2025, pelo mesmo preço por unidade. O TPU 8i melhora o desempenho de inferência em 80% em relação ao Ironwood. Ambos os chips contêm 384 MB de SRAM, contra 128 MB do Ironwood — uma triplicação da memória no chip que reduz o tempo que os modelos passam aguardando o acesso à memória externa, um dos principais gargalos de latência em inferência em grande escala. A disponibilidade comercial está prevista para "mais tarde em 2026", disse o Google Cloud na conferência, sem especificar um trimestre.

Continue reading to see the full article

Os Chips Google TPU 8 Miram Diretamente a Nvidia

Pontos Principais

Perguntas Frequentes

Os Chips Google TPU 8 Miram Diretamente a Nvidia

Pontos Principais

Perguntas Frequentes

Mais em Tech & AI