Wywiad z Alexandr Wang

Founder and CEO @ Scale.ai

przez 20VC with Harry Stebbings2024-06-12

Alexandr Wang

W fascynującej i szczerej rozmowie z Harrym Stebbingsem w programie 20VC, Alexandr Wang, CEO Scale AI, odsłonił kulisy obecnego krajobrazu AI, kwestionując powszechne przekonania i wskazując na prawdziwe wąskie gardło w wydajności modeli nowej generacji. Podczas gdy świat ma obsesję na punkcie mocy obliczeniowej (compute), Wang twierdzi, że prawdziwy wyścig – i potencjalny czynnik wyróżniający – nie leży w krzemie, lecz w danych.

Ściana Danych: Dlaczego Moc Obliczeniowa Już Nie Wystarcza

Rozmowa natychmiast przeszła do prowokującego pytania: czy obserwujemy spadające zwroty w wydajności modeli AI, gdzie większa moc obliczeniowa nie gwarantuje już lepszych wyników? Odpowiedź Wanga była jednoznaczne „tak”. Zwrócił uwagę, że pomimo wykładniczego wzrostu wydatków na procesory graficzne Nvidia (GPU) od końca 2022 roku (z 5 miliardów do ponad 20 miliardów dolarów kwartalnie), nie zaobserwowaliśmy „oszałamiająco lepszego” modelu bazowego niż GPT-4, który poprzedza ten znaczący wzrost mocy obliczeniowej.

Wang wyjaśnił, że postęp AI opiera się na trzech filarach: mocy obliczeniowej (compute), algorytmach i danych. Chociaż moc obliczeniowa rozwinęła się dramatycznie, pozostałe dwa filary nie nadążyły. Co kluczowe, uważa, że branża uderzyła w „ścianę danych”. „Łatwo dostępne dane” — wszystko, co jest swobodnie dostępne w otwartym internecie, pozyskane ze wspólnych skanowań (crawls) lub torrentów — zostały w dużej mierze wyczerpane. Modele te są teraz „wyjątkowo dobre w naśladowaniu internetu”, ale to nie wystarcza do złożonych zadań i rozumowania wymaganych dla prawdziwej AGI lub skutecznych agentów AI.

Kluczowe spostrzeżenia:

  • Postęp AI zależy od mocy obliczeniowej, danych i algorytmów, które rozwijają się równocześnie.
  • Masowe inwestycje w moc obliczeniową po GPT-4 nie przyniosły proporcjonalnych skoków w wydajności modeli bazowych.
  • Branża w dużej mierze wyczerpała „łatwo dostępne dane” (dane internetowe), co prowadzi do plateau wydajności.

Wytyczanie Granic: Kultywowanie Obfitości Danych

Aby przezwyciężyć tę ścianę danych, Wang wprowadził koncepcję „danych granicznych” (Frontier data). Podkreślił, że wiele złożonego rozumowania i rozwiązywania problemów, które napędzają dzisiejszą gospodarkę – jak proces dedukcyjny analityka ds. oszustw – nie jest zapisywane online. Oznacza to, że modele trenowane wyłącznie na danych internetowych nie mają zdolności uczenia się z tej głębszej ludzkiej inteligencji.

Jak więc uchwycić te nieuchwytne dane graniczne (Frontier data)? Wang przedstawił dwie główne ścieżki. Po pierwsze, istnieje kolosalny zbiór danych własnych (proprietary data) zamkniętych w przedsiębiorstwach. Przytoczył 150 petabajtów danych wewnętrznych JPMorgan, które przyćmiewają internetowy zbiór danych GPT-4, liczący mniej niż jeden petabajt. Dane te są jednak wysoce wrażliwe i wymagałyby od przedsiębiorstw ich wydobywania i udoskonalania dla własnych systemów AI, prawdopodobnie lokalnie (on-prem) lub z silnymi gwarancjami przed użyciem zewnętrznym. Po drugie, i co ważniejsze dla uogólnionych przełomów, jest „produkcja danych przyszłościowych” (forward data production). Nie chodzi tu tylko o zbieranie istniejących danych, ale o tworzenie nowych, wysoce złożonych danych. Obejmuje to „hybrydowy proces człowiek-syntetyk”, w którym AI generuje dane, a ludzcy eksperci działają jako „kierowcy bezpieczeństwa”, prowadząc AI, korygując błędy i dostarczając kluczowych danych wejściowych, gdy modele utkną. Wang uważa, że ci „trenerzy AI” lub „współtwórcy” zajmują stanowiska o największym wpływie społecznym. „Jako ludzki ekspert,” zauważył, „masz możliwość wywarcia wpływu na całe społeczeństwo, produkując dane, które pomogą ulepszyć te modele.”

Kluczowe zmiany:

  • Przejście od łatwo dostępnych „łatwych danych” do „danych granicznych” (Frontier data) jest kluczowe dla zaawansowanej AI.
  • Dane graniczne (Frontier data) obejmują złożone łańcuchy rozumowania, wykorzystanie narzędzi i zachowania agencyjne, których nie ma w otwartym internecie.
  • Obfitość danych zostanie osiągnięta poprzez wydobywanie własnych danych przedsiębiorstw i aktywne wytwarzanie nowych, wysokiej jakości danych.
  • Pojawią się nowe role dla ludzi, którzy będą kierować i korygować systemy AI w generowaniu danych syntetycznych, podobnie do kierowców bezpieczeństwa w pojazdach autonomicznych.

Geopolityczny Wyścig o Dane: Nowa Zimna Wojna?

Rozmowa skręciła w stronę głębokich implikacji geopolitycznych AI, tematu, który zdaniem Wanga jest niewystarczająco omawiany. Stwierdził dobitnie: „W swej istocie ta technologia AI ma potencjał, aby być jednym z największych aktywów militarnych, jakie ludzkość kiedykolwiek widziała, potencjalnie nawet większym aktywem militarnym niż broń nuklearna.” Przedstawił mrożący krew w żyłach scenariusz, w którym reżim totalitarny posiadający AGI mógłby podbić naród, który jej nie posiada.

Wang wyraził znaczące zaniepokojenie szybkim postępem Chin w dziedzinie AI. Podczas gdy dwa lata temu ich możliwości „nie zbliżały się do” GPT-4, niedawny chiński model, Yi-Large od 0101, plasuje się obecnie wśród najlepszych na świecie, tuż za GPT-4o, Gemini i Claude 3 Opus. Przypisał to wyjątkowej zdolności Komunistycznej Partii Chin (CCP) do wdrażania „bardzo agresywnych działań scentralizowanych i scentralizowanej polityki przemysłowej w celu napędzania kluczowych branż”. Ten wzorzec, widoczny w sektorze solarnym i pojazdach elektrycznych, sugeruje, że Chiny mają „jasną szansę na szybkie wyprzedzenie nas”. Biorąc to pod uwagę, Wang uważa, że musi się wyłonić „dychotomia”: najnowocześniejsze, prawdziwie potężne systemy AI powinny być utrzymywane w zamknięciu ze względów militarnych i geopolitycznych, podczas gdy mniej zaawansowane, otwarte modele mogą nadal napędzać wartość gospodarczą.

Kluczowe wnioski:

  • AI, zwłaszcza AGI, może być najpotężniejszym aktywem militarnym ludzkości, z głębokimi konsekwencjami geopolitycznymi.
  • Scentralizowana polityka przemysłowa Chin umożliwia szybki rozwój AI, szybko zmniejszając lukę w stosunku do możliwości Zachodu.
  • Krytyczne jest strategiczne rozróżnienie między otwartymi a zamkniętymi systemami AI: najnowocześniejsze modele mogą wymagać zamknięcia ze względów bezpieczeństwa, podczas gdy mniej potężne mogą pozostać otwarte dla szerokich korzyści ekonomicznych.

Redefiniowanie Konkurencji: Dane jako Ostateczny Wał Obronny

W zaciekle konkurencyjnym świecie modeli fundacyjnych, Wang mocno wierzy, że dane będą ostatecznym czynnikiem wyróżniającym. Podkreślił, że algorytmy mogą ostatecznie zostać poddane inżynierii odwrotnej lub stać się wiedzą powszechną, a moc obliczeniowa (compute) może być po prostu kupiona. „Dane to jeden z nielicznych obszarów,” stwierdził, „gdzie faktycznie można zbudować długoterminową, zrównoważoną przewagę konkurencyjną.” Jako wczesne wskaźniki tej zmiany cytuje partnerstwa Open AI z Financial Times i Axel Springer.

Wang śmiało przewidział przyszłość, w której liderzy AI nie będą chwalić się liczbą swoich GPU, ale „do jakich danych mają dostęp i jakie są ich unikalne prawa do różnych źródeł danych”. Ten nacisk na unikalne, własne dane będzie napędzał dyferencjację rynku. Ponadto, przewiduje znaczącą zmianę w oprogramowaniu, odchodzącą od modelu „zamkniętego ogrodu” (walled garden) SaaS na rzecz wysoce spersonalizowanych, specjalnie zaprojektowanych aplikacji dla przedsiębiorstw, przypominającą wczesne podejście Palantira. Będzie to napędzane przez AI, dramatycznie obniżającą koszty tworzenia oprogramowania, co doprowadzi do nowej ery spersonalizowanych rozwiązań software’owych. W konsekwencji, długotrwały model cenowy „za miejsce” (per-seat) prawdopodobnie ustąpi miejsca cenom opartym na zużyciu (consumption-based pricing), odzwierciedlającym pracę wykonywaną zarówno przez ludzkich pracowników, jak i agentów AI.

Kluczowe spostrzeżenia:

  • Dane wyłaniają się jako główna i najtrwalsza przewaga konkurencyjna w wyścigu modeli fundacyjnych.
  • Przyszła konkurencja będzie koncentrować się na dostępie do danych własnych, ich własności i zdolności do tworzenia unikalnych zbiorów danych.
  • Ukomodyzowanie tworzenia oprogramowania doprowadzi do niestandardowych, spersonalizowanych aplikacji dla przedsiębiorstw, wykraczających poza ogólne SaaS.
  • Modele cenowe oprogramowania ewoluują z modelu „za miejsce” (per-seat) do modelu opartego na zużyciu, dostosowując się do wartości dostarczanej zarówno przez ludzi, jak i agentów AI.

Nawigowanie w Szumie: Bezpośrednie Kanały i Zaufanie

Zmieniając temat na budowanie firmy, Wang podzielił się swoim niekonwencjonalnym podejściem do public relations: „najlepsze PR to brak PR”. Twierdził, że tradycyjne media, często napędzane kliknięciami, mają tendencję do sensacjonalizowania i zniekształcania narracji, wzmacniając i niszcząc firmy dla zaangażowania. Ujawnił zaskakujące osobiste doświadczenie: „Otrzymałem bardziej sprawiedliwe traktowanie, zeznając przed Kongresem, niż od różnych mediów przez lata.”

Ta perspektywa doprowadziła Scale AI do priorytetyzowania bezpośrednich kanałów, takich jak podcasty i blogi firmowe, gdzie mogą przekazywać swoją wiadomość autentycznie i bez zmian. To posiadanie własnej narracji zapewnia, że ich historia jest „najczystsza” i nieskażona, budując zaufanie i klarowność u swojej publiczności.

Kluczowe praktyki:

  • Przyjąć strategię „bez PR” lub minimalnego angażowania się w tradycyjne media, aby uniknąć sensacjonalizmu i zniekształcania narracji.
  • Priorytetyzować bezpośrednie kanały komunikacji (podcasty, treści firmowe) dla autentycznych i niezmienionych wiadomości.
  • Założyciele i firmy muszą aktywnie posiadać i zarządzać swoją narracją w coraz bardziej hałaśliwym krajobrazie informacyjnym.

„W swej istocie ta technologia AI ma potencjał, aby być jednym z największych aktywów militarnych, jakie ludzkość kiedykolwiek widziała, potencjalnie nawet większym aktywem militarnym niż broń nuklearna.” – Alexandr Wang