Come si è evoluto il pensiero di Jensen Huang su GPU e AI
l'evoluzione del pensiero su GPU e AI · 1993–2026
Apri l'atlante interattivo →L'evoluzione del pensiero
1993→97
Fondazione e sopravvivenza
NVIDIA viene fondata da un Denny's (1993). Il primo chip è un flop — circa 249k delle 250k schede tornano indietro; SEGA li salva, e la scommessa sulla RIVA 128 (spedita senza prototipo) li mantiene in vita. Da qui il motto 'a trenta giorni dal fallimento'.
„La nostra azienda è a trenta giorni dal fallimento.”
1999
GPU — il motore dell'immaginazione
GeForce 256 — NVIDIA conia il termine 'GPU'. I giochi sono la killer app deliberata: il problema di calcolo più difficile più un volume enorme che finanzia la R&S e semina la piattaforma.
„La GPU nacque come motore per simulare l'immaginazione umana. Oggi la GPU di NVIDIA esegue algoritmi di deep learning, simulando l'intelligenza umana.”
2006
CUDA — la grande scommessa
CUDA trasforma la GPU in un processore parallelo universale. La scommessa 'ha consumato tutto il profitto lordo', la capitalizzazione è scesa a circa $1,5 mld — un decennio nei 'mercati da zero miliardi di dollari'.
„CUDA fece lievitare a tal punto il costo di quella GPU, che è un prodotto di consumo, da divorare completamente tutti gli utili lordi dell'azienda.”
2012
Il big bang dell'AI
AlexNet vince ImageNet su DUE GeForce GTX 580 di consumo. Huang: 'il big bang dell'AI moderna'. NVIDIA scommette l'azienda sul deep learning — le schede da gaming accendono la rivoluzione dell'AI.
„Quello fu il momento che fu il big bang dell'AI moderna.”
2023
Fabbrica di AI / 'momento iPhone'
ChatGPT = il 'momento iPhone dell'AI'. Il data center smette di essere un costo — diventa una fabbrica che trasforma l'energia in token. 'Il calcolo general-purpose ha esaurito la spinta'.
„Siamo al momento iPhone dell'AI.”
2026
L'economia dell'inferenza
La chiusura: l'AI di ragionamento/agentica richiede '100× più calcolo'; il token è una commodity e il calcolo è ricavo. La prossima ondata — l'AI fisica: 'tutto ciò che si muove sarà robotico'.
„I token sono la nuova materia prima.”
Concetti chiave
Grafica
La GPU — il motore dell'immaginazione
La GPU come acceleratore di grafica 3D per i videogiochi — il punto di partenza; le schede grafiche finanziano la R&S e seminano la piattaforma.
«A 30 giorni dal fallimento»
La paranoia esistenziale come cultura — dalla fragilità del fondatore (1993), passando per la quasi-morte di RIVA 128 (1997), fino a «dolore e sofferenza»/«corri, non camminare». Un carattere forgiato dalle avversità.
Il conio del termine «GPU»
GeForce 256 (1999): T&L hardware, «la prima GPU al mondo» (un'affermazione di marketing). IPO, contratto Xbox.
Rendering neurale (ray tracing + DLSS)
RTX/Turing: ray tracing in tempo reale («sacro graal») + core RT/Tensor; DLSS = AI nella grafica; la tesi «grafica = AI».
Calcolo parallelo
Calcolo accelerato (CUDA)
CUDA trasforma la GPU in un processore parallelo universale; il calcolo accelerato sostituisce quello general-purpose.
CUDA come fossato difensivo
Un fossato costruito sull'ecosistema: parco installato (GeForce) + librerie + retrocompatibilità. «La casa che GeForce ha costruito».
Mercati da zero miliardi di dollari
Puntare a mercati che ancora non esistono (creare il mercato, non conquistarne una quota) — dove non ci sono clienti, non c'è concorrenza.
«La legge di Moore è morta»
La fine dello scaling delle CPU → il calcolo accelerato come risposta («legge di Huang»). Una polemica contro Intel; giustifica la domanda di GPU.
Deep learning
Deep learning — il motore dell'intelligenza
AlexNet, il «big bang dell'AI», su 2 GTX 580; la GPU si rivela il computer per addestrare le reti. La svolta dell'azienda nel 2012.
DGX — «supercomputer per l'AI»
«Un supercomputer per l'AI in una scatola»; il primo DGX-1 fu consegnato di persona a OpenAI (2016) — la scintilla dell'AI moderna.
Tensor Core / Transformer Engine
Silicio dedicato al DL (Volta 2017) → Transformer Engine (Hopper 2022) → FP8/FP4 (Blackwell).
Fabbrica di AI
Fabbrica di AI
Il data center = una fabbrica che trasforma dati + energia in token/intelligenza; l'AI generativa come nuova industria.
«Il momento iPhone dell'AI»
ChatGPT = il momento dell'adozione di massa dell'AI (GTC marzo 2023, NON Computex); l'AI generativa raggiunge centinaia di milioni di persone.
L'economia dei token
Il token = la nuova materia prima («tokenomics»); «il calcolo è ricavo»; token per watt come KPI della fabbrica di AI.
Blackwell / roadmap annuale
B200/GB200 NVL72 (dual-die, 208 miliardi di transistor) come prodotto «fabbrica di AI»; cadenza annuale: Blackwell→Rubin→Feynman.
AI sovrana
Ogni Paese con la propria infrastruttura/AI; i dati = una risorsa nazionale. (Allineata con la domanda di GPU — un conflitto di interessi.)
AI fisica / robotica
«Il momento ChatGPT per la robotica»; Cosmos/Isaac GR00T/Newton; «tutto ciò che si muove sarà robotico».
L'economia dell'inferenza (ragionamento)
Scaling al test-time/del ragionamento: «inferenza 100×»; l'AI agentica come il più grande consumatore di calcolo; «domanda parabolica».
Citazioni selezionate
„La nostra azienda è a trenta giorni dal fallimento.”
„La GPU nacque come motore per simulare l'immaginazione umana. Oggi la GPU di NVIDIA esegue algoritmi di deep learning, simulando l'intelligenza umana.”
„CUDA fece lievitare a tal punto il costo di quella GPU, che è un prodotto di consumo, da divorare completamente tutti gli utili lordi dell'azienda.”
„Quello fu il momento che fu il big bang dell'AI moderna.”
„Siamo al momento iPhone dell'AI.”
„I token sono la nuova materia prima.”
„Non lo rifarei.”
„Costruire Nvidia si è rivelato un milione di volte più difficile di quanto mi aspettassi — di quanto chiunque di noi si aspettasse.”
„Se avessimo immaginato il dolore e la sofferenza, e quanto vulnerabili ci saremmo sentiti, le difficoltà, l'imbarazzo e la vergogna — nessuno sano di mente lo farebbe.”
„Il mio primo lavoro prima di diventare CEO è stato il lavapiatti. E lo facevo molto bene.”
„So che sarà perfetto, perché se non lo sarà, saremo fuori dal mercato.”
„A un certo punto dovetti volare in Giappone e spiegare all'amministratore delegato di Sega che la tecnologia che ci avevano commissionato di costruire non avrebbe funzionato. Chiesi di essere liberato da un contratto che non potevamo portare a termine. E poi chiesi che ci pagassero comunque. Senza quei soldi, NVIDIA sarebbe svanita.”
Eventi chiave
- 05.04.1993 Fondazione di NVIDIA (Denny's, San Jose)
- 08.11.2006 CUDA — una scommessa sul calcolo parallelo
- 05.04.2016 GTC 2016 — Pascal P100, DGX-1, «AI»
- 04.01.2017 CES 2017 — Xavier, AI Co-Pilot, «l'AI è il futuro»
- 13.08.2018 SIGGRAPH 2018 — Turing/RTX, ray tracing in tempo reale
- 14.05.2020 GTC 2020 — Ampere A100 («keynote dalla cucina»)
- 22.03.2022 GTC 2022 — Hopper H100, Transformer Engine, «fabbriche di AI»
- 24.05.2023 Risultati FY24 Q1 — shock della guidance, la tesi del «data center da 1.000 mld $»
- 23.08.2023 Risultati — esplosione della domanda per l'H100
- 15.03.2024 Stanford SIEPR/GSB — «dolore e sofferenza», basse aspettative
- 22.05.2024 Risultati — AI sovrana, «fabbriche di generazione dell'AI»
- 20.11.2024 Risultati FY25 Q3 — «la domanda per Blackwell è sbalorditiva»
- 18.03.2025 GTC 2025 — roadmap Vera Rubin, ragionamento, AI fisica
- 09.07.2025 Pietre miliari di valutazione da 1.000 mld $ → 5.000 mld $
- 15.04.2026 Dwarkesh/Stratechery — il fossato CUDA, «l'intero data center»