Comment la pensée de Jensen Huang sur le GPU et l'IA a évolué
l'évolution de la pensée sur le GPU et l'IA · 1993–2026
Ouvrir l'atlas interactif →L'évolution de la pensée
1993→97
Fondation et survie
NVIDIA est fondée dans un Denny's (1993). La première puce est un échec — environ 249 000 des 250 000 cartes reviennent ; SEGA les renfloue, et le pari sur la RIVA 128 (livrée sans prototype) les maintient en vie. D'où la devise « à trente jours de la faillite ».
„Notre entreprise est à trente jours de la faillite.”
1999
Le GPU — le moteur de l'imagination
GeForce 256 — NVIDIA invente le terme « GPU ». Les jeux sont la killer app délibérée : le problème de calcul le plus difficile, plus un volume énorme qui finance la R&D et amorce la plateforme.
„Le GPU a débuté comme moteur de simulation de l'imagination humaine. Aujourd'hui, le GPU de NVIDIA fait tourner des algorithmes d'apprentissage profond, simulant l'intelligence humaine.”
2006
CUDA — le grand pari
CUDA transforme le GPU en processeur parallèle universel. Le pari « a consommé tout le bénéfice brut », la capitalisation est tombée à ~$1,5 Md — une décennie dans des « marchés à zéro milliard de dollars ».
„CUDA a tellement augmenté le coût de ce GPU, qui est un produit grand public, qu'elle a entièrement englouti tous les dollars de bénéfice brut de l'entreprise.”
2012
Le big bang de l'IA
AlexNet remporte ImageNet sur DEUX GeForce GTX 580 grand public. Huang : « le big bang de l'IA moderne ». NVIDIA mise l'entreprise sur le deep learning — les cartes de jeu allument la révolution de l'IA.
„Ce fut le moment qui a été le big bang de l'IA moderne.”
2023
Usine d'IA / « moment iPhone »
ChatGPT = le « moment iPhone de l'IA ». Le centre de données cesse d'être un coût — il devient une usine qui transforme l'énergie en tokens. « L'informatique généraliste est à bout de souffle ».
„Nous sommes au moment iPhone de l'IA.”
2026
L'économie de l'inférence
L'aboutissement : l'IA de raisonnement/agentique exige « 100× plus de calcul » ; le token est une marchandise et le calcul est du revenu. La prochaine vague — l'IA physique : « tout ce qui bouge sera robotisé ».
„Les tokens sont la nouvelle matière première.”
Concepts clés
Graphismes
Le GPU — le moteur de l'imagination
Le GPU comme accélérateur graphique 3D pour les jeux — le point de départ ; les cartes graphiques financent la R&D et amorcent la plateforme.
« À 30 jours de la faillite »
La paranoïa existentielle érigée en culture — de la fragilité des débuts (1993) à la quasi-mort du RIVA 128 (1997), jusqu'à « la douleur et la souffrance »/« cours, ne marche pas ». Un caractère forgé par l'adversité.
L'invention du terme « GPU »
GeForce 256 (1999) : T&L matériel, « le premier GPU au monde » (une affirmation marketing). IPO, contrat Xbox.
Rendu neuronal (ray tracing + DLSS)
RTX/Turing : ray tracing en temps réel (« le Graal ») + cœurs RT/Tensor ; le DLSS = l'IA dans le graphisme ; la thèse « graphisme = IA ».
Calcul parallèle
Le calcul accéléré (CUDA)
CUDA transforme le GPU en processeur parallèle universel ; le calcul accéléré remplace le calcul généraliste.
CUDA comme fossé défensif
Un fossé défensif par l'écosystème : base installée (GeForce) + bibliothèques + rétrocompatibilité. « La maison que GeForce a bâtie ».
Les marchés à zéro milliard de dollars
Viser des marchés qui n'existent pas encore (créer le marché, non en prendre des parts) — là où il n'y a pas de clients, il n'y a pas de concurrence.
« La loi de Moore est morte »
La fin de la montée en puissance des CPU → le calcul accéléré comme réponse (« la loi de Huang »). Une polémique contre Intel ; justifie la demande de GPU.
Deep learning
Apprentissage profond — le moteur de l'intelligence
AlexNet, le « big bang de l'IA », sur 2× GTX 580 ; le GPU s'avère être l'ordinateur idéal pour entraîner les réseaux. Le pivot de l'entreprise en 2012.
DGX — le « superordinateur d'IA »
« Un superordinateur d'IA clé en main » ; le premier DGX-1 a été remis en personne à OpenAI (2016) — l'étincelle de l'IA moderne.
Tensor Cores / Transformer Engine
Du silicium dédié au DL (Volta 2017) → Transformer Engine (Hopper 2022) → FP8/FP4 (Blackwell).
Usine d'IA
Usine d'IA
Le centre de données = une usine qui transforme données + énergie en tokens/intelligence ; l'IA générative comme nouvelle industrie.
« Le moment iPhone de l'IA »
ChatGPT = le moment de l'adoption massive de l'IA (GTC mars 2023, PAS Computex) ; l'IA générative touche des centaines de millions de personnes.
L'économie du token
Le token = la nouvelle matière première (« tokenomics ») ; « le calcul, c'est du chiffre d'affaires » ; les tokens par watt comme KPI de l'usine d'IA.
Blackwell / feuille de route annuelle
B200/GB200 NVL72 (double puce, 208 milliards de transistors) comme produit « usine d'IA » ; cadence annuelle : Blackwell→Rubin→Feynman.
IA souveraine
Chaque pays sa propre infrastructure/IA ; les données = une ressource nationale. (Aligné sur la demande de GPU — un conflit d'intérêts.)
IA physique / robotique
« Le moment ChatGPT de la robotique » ; Cosmos/Isaac GR00T/Newton ; « tout ce qui bouge sera robotisé ».
L'économie de l'inférence (raisonnement)
Mise à l'échelle au moment du test/du raisonnement : « inférence 100× » ; l'IA agentique comme premier consommateur de calcul ; « demande parabolique ».
Citations choisies
„Notre entreprise est à trente jours de la faillite.”
„Le GPU a débuté comme moteur de simulation de l'imagination humaine. Aujourd'hui, le GPU de NVIDIA fait tourner des algorithmes d'apprentissage profond, simulant l'intelligence humaine.”
„CUDA a tellement augmenté le coût de ce GPU, qui est un produit grand public, qu'elle a entièrement englouti tous les dollars de bénéfice brut de l'entreprise.”
„Ce fut le moment qui a été le big bang de l'IA moderne.”
„Nous sommes au moment iPhone de l'IA.”
„Les tokens sont la nouvelle matière première.”
„Je ne le ferais pas.”
„Bâtir Nvidia s'est révélé un million de fois plus dur que je ne l'imaginais — que nul d'entre nous ne l'imaginait.”
„Si nous avions mesuré la douleur et la souffrance, et à quel point on se sentirait vulnérable, les épreuves, l'embarras et la honte — personne de sensé ne s'y serait lancé.”
„Mon premier emploi avant celui de PDG, c'était plongeur. Et je le faisais très bien.”
„Je sais que ce sera parfait, car sinon, nous mettrons la clé sous la porte.”
„À un moment, j'ai dû m'envoler pour le Japon et expliquer au PDG de Sega que la technologie qu'ils nous avaient commandée ne fonctionnerait pas. J'ai demandé à être libéré d'un contrat que nous ne pouvions honorer. Puis j'ai demandé qu'ils nous paient malgré tout. Sans cet argent, NVIDIA se serait volatilisée.”
Événements clés
- 05.04.1993 Fondation de NVIDIA (Denny's, San Jose)
- 08.11.2006 CUDA — un pari sur le calcul parallèle
- 05.04.2016 GTC 2016 — Pascal P100, DGX-1, « IA »
- 04.01.2017 CES 2017 — Xavier, AI Co-Pilot, « l'IA est l'avenir »
- 13.08.2018 SIGGRAPH 2018 — Turing/RTX, ray tracing en temps réel
- 14.05.2020 GTC 2020 — Ampere A100 (« la keynote de la cuisine »)
- 22.03.2022 GTC 2022 — Hopper H100, Transformer Engine, « usines d'IA »
- 24.05.2023 Résultats T1 FY24 — choc des prévisions, la thèse du « centre de données à 1 000 mds $ »
- 23.08.2023 Résultats — explosion de la demande pour le H100
- 15.03.2024 Stanford SIEPR/GSB — « douleur et souffrance », attentes basses
- 22.05.2024 Résultats — IA souveraine, « usines de génération d'IA »
- 20.11.2024 Résultats T3 FY25 — « la demande de Blackwell est ahurissante »
- 18.03.2025 GTC 2025 — feuille de route Vera Rubin, raisonnement, IA physique
- 09.07.2025 Jalons de valorisation 1 000 mds $ → 5 000 mds $
- 15.04.2026 Dwarkesh/Stratechery — le fossé CUDA, « tout le centre de données »