Como evoluiu o pensamento de Jensen Huang sobre GPU e IA
a evolução do pensamento sobre GPU e IA · 1993–2026
Abrir o atlas interativo →A evolução do pensamento
1993→97
Fundação e sobrevivência
A NVIDIA é fundada num Denny's (1993). O primeiro chip falha — voltam ~249 mil das 250 mil placas; a SEGA salva-os, e a aposta na RIVA 128 (lançada sem protótipo) mantém-nos vivos. Daí o lema 'thirty days from going out of business'.
„A nossa empresa está a 30 dias de fechar o negócio.”
1999
GPU — o motor da imaginação
GeForce 256 — a NVIDIA cunha o termo 'GPU'. Os jogos são a killer app deliberada: o problema de computação mais difícil mais um volume enorme que financia I&D e semeia a plataforma.
„A GPU começou como o motor para simular a imaginação humana. Agora, a GPU da NVIDIA executa algoritmos de aprendizagem profunda, simulando a inteligência humana.”
2006
CUDA — a grande aposta
O CUDA transforma a GPU num processador paralelo universal. A aposta 'consumiu todo o lucro bruto', a capitalização caiu para ~$1,5 mil milhões — uma década em 'zero-billion-dollar markets'.
„A CUDA aumentou o nosso custo dessa GPU, que é um produto de consumo, de forma tão tremenda que consumiu por completo todo o lucro bruto da empresa.”
2012
O big bang da IA
A AlexNet vence o ImageNet em DUAS GeForce GTX 580 de consumo. Huang: 'the big bang of modern AI'. A NVIDIA aposta a empresa no deep learning — as placas de jogos acendem a revolução da IA.
„Esse foi o momento que foi o big bang da IA moderna.”
2023
Fábrica de IA / 'iPhone moment'
ChatGPT = o 'iPhone moment of AI'. O data center deixa de ser um custo — torna-se uma fábrica que transforma energia em tokens. 'General-purpose computing has run out of steam'.
„Estamos no momento iPhone da IA.”
2026
A economia da inferência
O encerramento: a IA de raciocínio/agêntica precisa de '100× more compute'; o token é uma mercadoria e a computação é receita. A próxima vaga — a IA física: 'everything that moves will be robotic'.
„Os tokens são a nova mercadoria.”
Conceitos-chave
Gráficos
GPU — o motor da imaginação
A GPU como acelerador gráfico 3D para jogos — o ponto de partida; as placas gráficas financiam a I&D e semeiam a plataforma.
«A 30 dias de fechar o negócio»
A paranoia existencial como cultura — da fragilidade fundadora (1993), passando pela quase-morte da RIVA 128 (1997), até «dor e sofrimento»/«corre, não andes». Caráter forjado na adversidade.
Cunhar o termo «GPU»
GeForce 256 (1999): T&L por hardware, «a primeira GPU do mundo» (uma afirmação de marketing). IPO, contrato com a Xbox.
Renderização neuronal (ray tracing + DLSS)
RTX/Turing: ray tracing em tempo real («o santo graal») + núcleos RT/Tensor; DLSS = IA na imagem; a tese «gráficos = IA».
Computação paralela
Computação acelerada (CUDA)
A CUDA transforma a GPU num processador paralelo universal; a computação acelerada substitui a de uso geral.
A CUDA como fosso
Um fosso pelo ecossistema: base instalada (GeForce) + bibliotecas + compatibilidade retroativa. «A casa que a GeForce construiu».
Mercados de zero mil milhões de dólares
Apontar a mercados que ainda não existem (criar mercado, não tomar quota) — onde não há clientes, não há concorrência.
«A Lei de Moore está morta»
O fim do escalamento dos CPU → a computação acelerada como resposta («Lei de Huang»). Uma polémica contra a Intel; justifica a procura de GPU.
Deep learning
Aprendizagem profunda — o motor da inteligência
A AlexNet, o «big bang da IA», em 2× GTX 580; a GPU revela-se o computador para treinar redes. A reviravolta da empresa em 2012.
DGX — «supercomputador de IA»
«Supercomputador de IA numa caixa»; o primeiro DGX-1 foi entregue em pessoa à OpenAI (2016) — a faísca da IA moderna.
Tensor Cores / Transformer Engine
Silício dedicado ao DL (Volta 2017) → Transformer Engine (Hopper 2022) → FP8/FP4 (Blackwell).
Fábrica de IA
Fábrica de IA
O centro de dados = uma fábrica que converte dados + energia em tokens/inteligência; a IA generativa como nova indústria.
«Momento iPhone da IA»
O ChatGPT = o momento da adoção massiva da IA (GTC março de 2023, NÃO Computex); a IA generativa alcança centenas de milhões de pessoas.
Economia dos tokens
O token = a nova mercadoria («tokenomics»); «a computação são receitas»; tokens por watt como KPI da fábrica de IA.
Blackwell / roteiro anual
B200/GB200 NVL72 (dois dies, 208 mil milhões de transístores) como produto «fábrica de IA»; cadência anual: Blackwell→Rubin→Feynman.
IA soberana
Cada país com a sua própria infraestrutura/IA; os dados = um recurso nacional. (Alinhado com a procura de GPU — um conflito de interesses.)
IA física / robótica
«Momento ChatGPT da robótica»; Cosmos/Isaac GR00T/Newton; «tudo o que se move será robótico».
Economia da inferência (raciocínio)
Escalamento em tempo de teste/raciocínio: «inferência 100×»; a IA agêntica como maior consumidora de computação; «procura parabólica».
Citações selecionadas
„A nossa empresa está a 30 dias de fechar o negócio.”
„A GPU começou como o motor para simular a imaginação humana. Agora, a GPU da NVIDIA executa algoritmos de aprendizagem profunda, simulando a inteligência humana.”
„A CUDA aumentou o nosso custo dessa GPU, que é um produto de consumo, de forma tão tremenda que consumiu por completo todo o lucro bruto da empresa.”
„Esse foi o momento que foi o big bang da IA moderna.”
„Estamos no momento iPhone da IA.”
„Os tokens são a nova mercadoria.”
„Não o faria.”
„Construir a Nvidia acabou por ser um milhão de vezes mais difícil do que eu esperava — do que qualquer um de nós esperava.”
„Se nos déssemos conta da dor e do sofrimento, e de quão vulneráveis nos vamos sentir, dos desafios, do embaraço e da vergonha — ninguém em seu perfeito juízo o faria.”
„O meu primeiro emprego antes de CEO foi lavar pratos. E fi-lo muito bem.”
„Sei que vai ficar perfeito, porque, se não ficar, fechamos o negócio.”
„A certa altura, tive de voar até ao Japão e explicar ao CEO da Sega que a tecnologia que nos contrataram para construir não iria funcionar. Pedi para ser libertado de um contrato que não conseguíamos cumprir. E depois pedi que nos pagassem na mesma. Sem esse dinheiro, a NVIDIA evaporar-se-ia.”
Eventos-chave
- 05.04.1993 Fundação da NVIDIA (Denny's, San Jose)
- 08.11.2006 CUDA — uma aposta na computação paralela
- 05.04.2016 GTC 2016 — Pascal P100, DGX-1, «IA»
- 04.01.2017 CES 2017 — Xavier, AI Co-Pilot, «a IA é o futuro»
- 13.08.2018 SIGGRAPH 2018 — Turing/RTX, ray tracing em tempo real
- 14.05.2020 GTC 2020 — Ampere A100 («keynote da cozinha»)
- 22.03.2022 GTC 2022 — Hopper H100, Transformer Engine, «fábricas de IA»
- 24.05.2023 Resultados do T1 do exercício de 2024 — choque de orientação, a tese do «centro de dados de 1 bilião $»
- 23.08.2023 Resultados — explosão da procura pelo H100
- 15.03.2024 Stanford SIEPR/GSB — «dor e sofrimento», baixas expectativas
- 22.05.2024 Resultados — IA soberana, «fábricas de geração de IA»
- 20.11.2024 Resultados do T3 do exercício de 2025 — «a procura por Blackwell é assombrosa»
- 18.03.2025 GTC 2025 — roteiro Vera Rubin, raciocínio, IA física
- 09.07.2025 Marcos de avaliação 1 bilião $ → 5 biliões $
- 15.04.2026 Dwarkesh/Stratechery — o fosso da CUDA, «o centro de dados inteiro»