Jak Jensen Huang zmieniał myślenie o GPU i AI
ewolucja myślenia o GPU i AI · 1993–2026
Otwórz interaktywny atlas →Ewolucja myślenia
1993→97
Założenie i przetrwanie
NVIDIA powstaje w Denny's (1993). Pierwszy chip to klapa — ~249 z 250 tys. kart wraca; SEGA ratuje firmę, a zakład na RIVA 128 (bez prototypu) ją utrzymuje. Stąd motto „30 dni od bankructwa”.
„Naszej firmie zostało trzydzieści dni do bankructwa.”
1999
GPU — silnik wyobraźni
GeForce 256 — NVIDIA ukuwa termin „GPU”. Gry to celowy „killer app”: najtrudniejszy problem obliczeniowy + ogromny wolumen, który finansuje R&D i rozsiewa platformę.
„GPU zaczynało jako silnik do symulowania ludzkiej wyobraźni. Teraz GPU od NVIDIA uruchamia algorytmy głębokiego uczenia, symulując ludzką inteligencję.”
2006
CUDA — wielki zakład
CUDA zamienia GPU w uniwersalny procesor równoległy. Zakład „skonsumował całą marżę”, kapitalizacja spadła do ~$1,5 mld — dekada w „rynkach zero-miliardowych”.
„CUDA tak ogromnie zwiększyła nasz koszt tego GPU, który jest produktem konsumenckim, że całkowicie pochłonęła cały zysk brutto firmy.”
2012
Big bang AI
AlexNet wygrywa ImageNet na DWÓCH konsumenckich GeForce GTX 580. Huang: „big bang of modern AI”. NVIDIA stawia firmę na deep learning — karty dla graczy odpalają rewolucję AI.
„To był moment, który był wielkim wybuchem nowoczesnej sztucznej inteligencji.”
2023
Fabryka AI / „iPhone moment”
ChatGPT = „iPhone moment of AI”. Data center przestaje być kosztem — staje się fabryką zamieniającą energię w tokeny. „General purpose computing wyczerpało parę”.
„Jesteśmy w momencie iPhone'a dla AI.”
2026
Ekonomia inferencji
Domknięcie: reasoning/agentic AI wymaga „100× więcej compute”; token to towar, a compute to przychód. Następna fala — physical AI: „wszystko, co się porusza, będzie robotyczne”.
„Tokeny to nowy towar.”
Kluczowe koncepty
Grafika
GPU — silnik wyobraźni
GPU jako akcelerator grafiki 3D dla gier — punkt startu; karty graficzne finansują R&D i rozsiewają platformę.
„30 dni od bankructwa”
Paranoja egzystencjalna jako kultura — od founderskiej kruchości (1993) przez near-death RIVA 128 (1997) po 'pain and suffering'/'run, don't walk'. Charakter kuty przeciwnością.
Ukucie terminu „GPU”
GeForce 256 (1999): hardware T&L, 'pierwszy GPU na świecie' (twierdzenie marketingowe). IPO, kontrakt Xbox.
Neural rendering (ray tracing + DLSS)
RTX/Turing: real-time ray tracing ('holy grail') + RT/Tensor cores; DLSS = AI w grafice; teza 'grafika = AI'.
Obliczenia równoległe
Obliczenia akcelerowane (CUDA)
CUDA przekształca GPU w uniwersalny procesor równoległy; accelerated computing zastępuje general-purpose.
CUDA jako fosa
Fosa przez ekosystem: baza instalacyjna (GeForce) + biblioteki + kompatybilność wsteczna. 'House that GeForce built'.
Rynki zero-miliardowe
Celowanie w rynki nieistniejące (market making, nie share taking) — gdzie nie ma klientów, nie ma konkurencji.
„Moore's Law is dead”
Koniec skalowania CPU → accelerated computing jako odpowiedź ('Huang's Law'). Polemika z Intelem; uzasadnia popyt na GPU.
Deep learning
Deep learning — silnik inteligencji
AlexNet 'big bang of AI' na 2× GTX 580; GPU okazuje się komputerem do trenowania sieci. Pivot firmy w 2012.
DGX — „AI supercomputer”
'AI supercomputer in a box'; pierwszy DGX-1 dostarczony osobiście OpenAI (2016) — zapłon nowoczesnej AI.
Tensor Cores / Transformer Engine
Dedykowany krzem do DL (Volta 2017) → Transformer Engine (Hopper 2022) → FP8/FP4 (Blackwell).
Fabryka AI
Fabryka AI
Data center = fabryka zamieniająca dane+energię w tokeny/inteligencję; generative AI jako nowy przemysł.
„iPhone moment of AI”
ChatGPT = moment masowej adopcji AI (GTC III 2023, NIE Computex); generative AI wychodzi do setek mln ludzi.
Ekonomia tokenów
Token = nowy towar ('tokenomics'); 'compute is revenues'; tokens-per-watt jako KPI fabryki AI.
Blackwell / roczny roadmap
B200/GB200 NVL72 (dual-die, 208 mld tranz.) jako 'AI factory' produkt; roczny rytm: Blackwell→Rubin→Feynman.
Sovereign AI
Każdy kraj własną infrastrukturę/AI; dane = zasób narodowy. (Zbieżne z popytem na GPU — konflikt interesów.)
Physical AI / robotyka
'ChatGPT moment for robotics'; Cosmos/Isaac GR00T/Newton; 'wszystko, co się porusza, będzie robotyczne'.
Ekonomia inferencji (reasoning)
Test-time/reasoning scaling: 'inference 100×'; agentic AI jako największy konsument compute; 'demand parabolic'.
Wybrane cytaty
„Naszej firmie zostało trzydzieści dni do bankructwa.”
„GPU zaczynało jako silnik do symulowania ludzkiej wyobraźni. Teraz GPU od NVIDIA uruchamia algorytmy głębokiego uczenia, symulując ludzką inteligencję.”
„CUDA tak ogromnie zwiększyła nasz koszt tego GPU, który jest produktem konsumenckim, że całkowicie pochłonęła cały zysk brutto firmy.”
„To był moment, który był wielkim wybuchem nowoczesnej sztucznej inteligencji.”
„Jesteśmy w momencie iPhone'a dla AI.”
„Tokeny to nowy towar.”
„Nie zrobiłbym tego.”
„Budowa Nvidii okazała się milion razy trudniejsza, niż się spodziewałem — niż ktokolwiek z nas się spodziewał.”
„Gdybyśmy zdawali sobie sprawę z bólu i cierpienia oraz tego, jak bardzo bezbronnie będziemy się czuć, z wyzwań, zażenowania i wstydu — nikt przy zdrowych zmysłach by tego nie zrobił.”
„Moją pierwszą pracą przed stanowiskiem CEO było zmywanie naczyń. I robiłem to bardzo dobrze.”
„Wiem, że będzie idealnie, bo jeśli nie będzie, wypadniemy z biznesu.”
„Pewnego razu musiałem polecieć do Japonii i wytłumaczyć prezesowi SEGA, że technologia, którą zlecili nam zbudować, nie zadziała. Poprosiłem o zwolnienie z kontraktu, którego nie mogliśmy dokończyć. A potem poprosiłem, żeby i tak nam zapłacili. Bez tych pieniędzy NVIDIA wyparowałaby.”
Kluczowe wydarzenia
- 05.04.1993 Założenie NVIDIA (Denny's, San Jose)
- 08.11.2006 CUDA — zakład na obliczenia równoległe
- 05.04.2016 GTC 2016 — Pascal P100, DGX-1, 'AI'
- 04.01.2017 CES 2017 — Xavier, AI Co-Pilot, 'AI is the future'
- 13.08.2018 SIGGRAPH 2018 — Turing/RTX, real-time ray tracing
- 14.05.2020 GTC 2020 — Ampere A100 ('kitchen keynote')
- 22.03.2022 GTC 2022 — Hopper H100, Transformer Engine, 'AI factories'
- 24.05.2023 Earnings FY24 Q1 — szok guidance, teza '$1T data center'
- 23.08.2023 Earnings — eksplozja popytu na H100
- 15.03.2024 Stanford SIEPR/GSB — 'pain and suffering', niskie oczekiwania
- 22.05.2024 Earnings — sovereign AI, 'AI generation factories'
- 20.11.2024 Earnings FY25 Q3 — 'Blackwell demand is staggering'
- 18.03.2025 GTC 2025 — Vera Rubin roadmap, reasoning, physical AI
- 09.07.2025 Kamienie milowe wyceny $1T → $5T
- 15.04.2026 Dwarkesh/Stratechery — fosa CUDA, 'cały data center'