Interview mit Alexandr Wang

Founder and CEO @ Scale.ai

von 20VC with Harry Stebbings2024-06-12

Alexandr Wang

In einem fesselnden und offenen Gespräch mit Harry Stebbings auf 20VC hat Alexandr Wang, CEO von Scale AI, die Schichten der aktuellen KI-Landschaft aufgedeckt, konventionelle Ansichten in Frage gestellt und den wahren Engpass für die Modellleistung der nächsten Generation beleuchtet. Während die Welt von Rechenleistung (Compute) besessen ist, argumentiert Wang, dass der wahre Wettlauf – und potenzielle Unterschied – nicht in Silizium, sondern in Daten liegt.

Die Datenmauer: Warum Rechenleistung nicht mehr ausreicht

Das Interview stieg direkt in eine provokative Frage ein: Sehen wir bei der KI-Modellleistung abnehmende Erträge, wo mehr Rechenleistung keine besseren Ergebnisse mehr garantiert? Wangs Antwort war ein klares "Ja". Er wies darauf hin, dass wir trotz eines exponentiellen Anstiegs der Ausgaben für Nvidia GPUs seit Ende 2022 (von 5 Milliarden auf über 20 Milliarden Dollar pro Quartal) kein "umwerfend besseres" Basismodell als GPT-4 gesehen haben, das dieser massiven Compute-Wende vorausgeht.

Wang erklärte, dass der KI-Fortschritt auf drei Säulen ruht: Rechenleistung (Compute), Algorithmen und Daten. Während die Rechenleistung dramatisch skaliert wurde, haben die beiden anderen nicht Schritt gehalten. Entscheidend ist, dass er glaubt, die Branche sei an eine "Datenmauer" gestoßen. Die "leicht zugänglichen Daten" – alles, was im offenen Internet leicht verfügbar ist, aus gängigen Crawls oder Torrents extrahiert – ist weitgehend konsumiert worden. Diese Modelle sind jetzt "außergewöhnlich gut darin, das Internet zu emulieren", aber das reicht nicht für die komplexen Aufgaben und Denkprozesse, die für eine wahre AGI oder effektive KI-Agenten erforderlich sind.

Wichtige Erkenntnisse:

  • Der Fortschritt der KI beruht auf dem synchronen Voranschreiten von Rechenleistung (Compute), Daten und Algorithmen.
  • Massive Investitionen in Rechenleistung (Compute) nach GPT-4 haben keine entsprechenden Sprünge in der Basismodellleistung hervorgebracht.
  • Die Branche hat "leicht zugängliche Daten" (Internetdaten) weitgehend ausgeschöpft, was zu einem Leistungsplateau führt.

Die Frontier gestalten: Datenüberfluss kultivieren

Um diese Datenmauer zu überwinden, führte Wang das Konzept der "Frontier-Daten" ein. Er betonte, dass ein Großteil der komplexen Denk- und Problemlösungsprozesse, die die heutige Wirtschaft antreiben – wie der deduktive Prozess eines Betrugsanalysten – nicht online festgehalten werden. Das bedeutet, dass Modelle, die ausschließlich mit Internetdaten trainiert wurden, nicht in der Lage sind, aus dieser tieferen menschlichen Intelligenz zu lernen.

Wie also erfassen wir diese schwer fassbaren Frontier-Daten? Wang skizzierte zwei Hauptwege. Erstens gibt es einen kolossalen Schatz an proprietären Daten, der in Unternehmen gebunden ist. Er nannte die 150 Petabyte an internen Daten von JPMorgan, die den weniger als ein Petabyte großen Internet-Datensatz von GPT-4 in den Schatten stellen. Diese Daten sind jedoch hochsensibel und würden erfordern, dass Unternehmen sie für ihre eigenen KI-Systeme extrahieren und verfeinern, wahrscheinlich On-Premise oder mit starken Garantien gegen externe Nutzung. Zweitens, und entscheidender für verallgemeinerte Durchbrüche, ist die "vorausschauende Datenproduktion". Hier geht es nicht nur darum, bestehende Daten zu sammeln, sondern darum, neue, hochkomplexe Daten zu erzeugen. Dies beinhaltet einen "menschlich-synthetischen Hybridprozess", bei dem die KI Daten generiert und menschliche Experten als "Sicherheitsfahrer" fungieren, die die KI leiten, Fehler korrigieren und entscheidenden Input geben, wenn Modelle stecken bleiben. Wang sieht diese "KI-Trainer" oder "Beitragende" als Jobs mit dem größten Hebeleffekt für die gesellschaftliche Wirkung an. "Als menschlicher Experte", bemerkte er, "haben Sie die Möglichkeit, gesellschaftsweite Wirkung zu erzielen, indem Sie Daten produzieren, um diese Modelle zu verbessern."

Wichtige Änderungen:

  • Der Übergang von leicht verfügbaren "einfachen Daten" zu "Frontier-Daten" ist essenziell für fortschrittliche KI.
  • Frontier-Daten umfassen komplexe Argumentationsketten, Werkzeugnutzung und agentisches Verhalten, die im offenen Internet nicht zu finden sind.
  • Datenüberfluss wird durch die Extraktion proprietärer Unternehmensdaten und die aktive Produktion neuer, hochwertiger Daten erreicht.
  • Neue menschliche Rollen werden entstehen, um KI-Systeme bei der Generierung synthetischer Daten zu leiten und zu korrigieren, ähnlich wie Sicherheitsfahrer bei autonomen Fahrzeugen.

Das geopolitische Datenrennen: Ein neuer Kalter Krieg?

Das Gespräch nahm eine Wendung hin zu den tiefgreifenden geopolitischen Implikationen der KI, ein Thema, das Wang seiner Meinung nach zu wenig diskutiert wird. Er erklärte unmissverständlich: "Im Kern hat diese KI-Technologie das Potenzial, eines der größten militärischen Güter zu sein, die die Menschheit je gesehen hat, potenziell sogar ein mächtigeres militärisches Gut als Atomwaffen." Er malte ein beunruhigendes Szenario, in dem ein totalitäres Regime mit AGI eine Nation ohne diese erobern könnte.

Wang äußerte große Besorgnis über Chinas rasante KI-Fortschritte. Während sie vor zwei Jahren "bei weitem nicht" an die Fähigkeiten von GPT-4 heranreichten, zählt ein aktuelles chinesisches Modell, Yi-Large von 0101, nun zu den besten der Welt, gleich hinter GPT-4o, Gemini und Claude 3 Opus. Er führte dies auf die außergewöhnliche Fähigkeit der KPCh zurück, "sehr aggressive zentralisierte Maßnahmen und eine zentralisierte Industriepolitik umzusetzen, um kritische Industrien voranzutreiben". Dieses Muster, das bei Solar und Elektrofahrzeugen (EVs) zu beobachten ist, deutet darauf hin, dass China "eine klare Chance hat, voranzupreschen und uns zu überholen". Angesichts dessen glaubt Wang, dass eine "Dichotomie entstehen muss": fortschrittliche, wirklich leistungsfähige KI-Systeme sollten aus militärischen und geopolitischen Gründen geschlossen gehalten werden, während weniger fortschrittliche, offene Modelle weiterhin wirtschaftlichen Wert schaffen können.

Wichtige Erkenntnisse:

  • KI, insbesondere AGI, könnte das mächtigste militärische Gut der Menschheit sein, mit tiefgreifenden geopolitischen Folgen.
  • Chinas zentralisierte Industriepolitik ermöglicht einen raschen KI-Fortschritt und schließt schnell die Lücke zu westlichen Fähigkeiten.
  • Eine strategische Unterscheidung zwischen offenen und geschlossenen KI-Systemen ist entscheidend: Fortschrittliche Modelle müssen möglicherweise aus Sicherheitsgründen geschlossen werden, während weniger leistungsstarke für einen breiten wirtschaftlichen Nutzen offen bleiben können.

Wettbewerb neu definieren: Daten als der ultimative Graben

In der hart umkämpften Welt der Basismodelle ist Wang fest davon überzeugt, dass Daten der ultimative Unterscheidungsfaktor sein werden. Er führte aus, dass Algorithmen schließlich reverse-engineered werden oder Gemeingut werden können und Rechenleistung (Compute) einfach gekauft werden kann. "Daten sind einer der wenigen Bereiche", behauptete er, "in denen man tatsächlich einen langfristigen nachhaltigen Wettbewerbsvorteil erzielen kann." Er nannte die Partnerschaften von OpenAI mit der Financial Times und Axel Springer als frühe Anzeichen dieses Wandels.

Wang sagte kühn eine Zukunft voraus, in der KI-Führer nicht mit ihrer GPU-Anzahl prahlen werden, sondern "welche Daten sie Zugang haben und welche einzigartigen Rechte sie an verschiedenen Datenquellen besitzen". Diese Betonung einzigartiger, proprietärer Daten wird die Marktdifferenzierung vorantreiben. Des Weiteren erwartet er eine signifikante Verschiebung in der Software, weg von "Walled Garden" SaaS hin zu hochgradig maßgeschneiderten, zweckgebundenen Anwendungen für Unternehmen, die an Palantirs frühen Ansatz erinnern. Dies wird dadurch angetrieben, dass KI die Softwareentwicklungskosten drastisch senkt, was zu einer neuen Ära personalisierter Softwarelösungen führt. Folglich wird das langjährige Pro-Seat-Preismodell wahrscheinlich einem verbrauchsabhängigen Preismodell weichen, das die von menschlichen Mitarbeitern und KI-Agenten geleistete Arbeit widerspiegelt.

Wichtige Erkenntnisse:

  • Daten entwickeln sich zum primären und dauerhaftesten Wettbewerbsvorteil im Rennen um Basismodelle.
  • Zukünftiger Wettbewerb wird sich um den Zugang zu proprietären Daten, deren Besitz und die Fähigkeit zur Produktion einzigartiger Datensätze drehen.
  • Die Kommodifizierung der Softwareerstellung wird zu maßgeschneiderten, kundenspezifischen Anwendungen für Unternehmen führen, die über generische SaaS hinausgehen.
  • Software-Preismodelle werden sich von Pro-Seat zu verbrauchsabhängig entwickeln, passend zum Wert, der von Menschen und KI-Agenten geliefert wird.

Den Lärm navigieren: Direkte Kanäle und Vertrauen

Beim Thema Unternehmensaufbau teilte Wang seinen unkonventionellen Ansatz für Öffentlichkeitsarbeit (PR): "Die beste PR ist keine PR." Er argumentierte, dass traditionelle Medien, oft von Klicks angetrieben, dazu neigen, Narrative zu sensationalisieren und zu verzerren, indem sie Unternehmen für Engagement auf- und abbauen. Er enthüllte eine überraschende persönliche Erfahrung: "Ich habe bei meiner Aussage vor dem Kongress eine fairere Behandlung erfahren als von verschiedenen Medien über die Jahre hinweg."

Diese Perspektive hat Scale AI dazu veranlasst, direkte Kanäle wie Podcasts und Unternehmensblogs zu priorisieren, wo sie ihre Botschaft authentisch und unverändert übermitteln können. Dieser Besitz ihrer Narrative stellt sicher, dass ihre Geschichte "reinst" und unbefleckt ist, was Vertrauen und Klarheit bei ihrem Publikum fördert.

Wichtige Praktiken:

  • Verfolgen Sie eine Strategie der "No-PR" oder minimalen Interaktion mit traditionellen Medien, um Sensationslust und Narrative-Verzerrungen zu vermeiden.
  • Priorisieren Sie direkte Kommunikationskanäle (Podcasts, Unternehmensinhalte) für authentische und unveränderte Botschaften.
  • Gründer und Unternehmen müssen ihre Narrative in einer zunehmend lauten Informationslandschaft aktiv besitzen und verwalten.

"Im Kern hat diese KI-Technologie das Potenzial, eines der größten militärischen Güter zu sein, die die Menschheit je gesehen hat, potenziell sogar ein mächtigeres militärisches Gut als Atomwaffen." - Alexandr Wang