Intervista con Alexandr Wang
Founder and CEO @ Scale.ai
di 20VC with Harry Stebbings • 2024-06-12

In una conversazione avvincente e schietta con Harry Stebbings su 20VC, Alexandr Wang, CEO di Scale AI, ha fatto luce sul panorama attuale dell'IA, mettendo in discussione la saggezza convenzionale e evidenziando il vero collo di bottiglia per le prestazioni dei modelli di prossima generazione. Mentre il mondo si ossessiona per la potenza computazionale, Wang sostiene che la vera corsa — e il potenziale elemento distintivo — non risiede nel silicio, ma nei dati.
Il Muro dei Dati: Perché la Potenza Computazionale Non Basta Più
L'intervista è entrata subito nel vivo con una domanda provocatoria: stiamo assistendo a rendimenti decrescenti nelle prestazioni dei modelli di IA, dove più potenza computazionale non garantisce più risultati migliori? La risposta di Wang è stata un sonoro "sì". Ha sottolineato che, nonostante un'impennata esponenziale nella spesa per le GPU Nvidia dalla fine del 2022 (da 5 a oltre 20 miliardi di dollari a trimestre), non abbiamo visto un modello di base "nettamente migliore" di GPT-4, che precede questa massiccia ondata di investimenti nel calcolo.
Wang ha spiegato che il progresso dell'IA si basa su tre pilastri: potenza computazionale, algoritmi e dati. Mentre la potenza computazionale è cresciuta drasticamente, gli altri due non hanno tenuto il passo. Fondamentalmente, egli ritiene che l'industria abbia colpito un "muro di dati". I "dati facili" — tutto ciò che è prontamente disponibile su internet, raccolto da common crawl o torrent — è stato in gran parte consumato. Questi modelli sono ora "eccezionalmente bravi a emulare internet", ma questo non è sufficiente per i compiti complessi e il ragionamento richiesti per una vera AGI o agenti IA efficaci.
Punti Chiave:
- Il progresso dell'IA si basa sull'avanzamento in parallelo di potenza computazionale, dati e algoritmi.
- Massicci investimenti nella potenza computazionale dopo GPT-4 non hanno prodotto salti commisurati nelle prestazioni dei modelli di base.
- L'industria ha in gran parte esaurito i "dati facili" (dati internet), portando a un plateau di prestazioni.
Conquistare la Frontiera: Coltivare l'Abbondanza di Dati
Per superare questo muro di dati, Wang ha introdotto il concetto di "dati di Frontiera". Ha sottolineato che gran parte del ragionamento complesso e della risoluzione dei problemi che alimentano l'economia odierna – come il processo deduttivo di un analista antifrode – non viene registrato online. Ciò significa che i modelli addestrati esclusivamente sui dati di internet mancano della capacità di imparare da questa intelligenza umana più profonda.
Quindi, come catturiamo questi sfuggenti dati di Frontiera? Wang ha delineato due vie principali. In primo luogo, esiste un'ingente quantità di dati proprietari bloccati all'interno delle aziende. Ha citato i 150 petabyte di dati interni di JPMorgan, che sminuiscono il dataset internet di GPT-4, inferiore a un petabyte. Questi dati, tuttavia, sono altamente sensibili e richiederebbero alle aziende di estrarli e affinarli per i propri sistemi di IA, probabilmente on-premise o con forti garanzie contro l'uso esterno. In secondo luogo, e più criticamente per progressi generalizzati, vi è la "produzione proattiva di dati". Non si tratta solo di raccogliere dati esistenti, ma di creare dati nuovi e altamente complessi. Ciò implica un "processo ibrido umano-sintetico" in cui l'IA genera dati, e gli esperti umani agiscono come "supervisori di sicurezza", guidando l'IA, correggendo gli errori e fornendo input cruciali quando i modelli si bloccano. Wang considera questi "addestratori di IA" o "contributori" come figure con alcuni dei lavori a maggiore leva per l'impatto sociale. "Come esperti umani", ha osservato, "avete la capacità di avere un impatto a livello di società producendo dati per aiutare a migliorare questi modelli".
Cambiamenti Chiave:
- Il passaggio da "dati facili" prontamente disponibili a "dati di Frontiera" è essenziale per l'IA avanzata.
- I dati di Frontiera comprendono catene di ragionamento complesse, uso di strumenti e comportamento agentivo non trovati sull'internet aperto.
- L'abbondanza di dati sarà raggiunta estraendo dati proprietari aziendali e producendo attivamente nuovi dati di alta qualità.
- Emergeranno nuovi ruoli umani per guidare e correggere i sistemi di IA nella generazione di dati sintetici, simili ai conducenti di sicurezza dei veicoli autonomi.
La Corsa Geopolitica ai Dati: Una Nuova Guerra Fredda?
La conversazione ha preso una piega verso le profonde implicazioni geopolitiche dell'IA, un argomento che Wang ritiene sia sottodiscusso. Ha dichiarato senza mezzi termini: "Nella sua essenza, questa tecnologia IA ha il potenziale per essere uno dei più grandi asset militari che l'Umanità abbia mai visto, potenzialmente anche più di un asset militare delle armi nucleari". Ha dipinto uno scenario agghiacciante in cui un regime totalitario con AGI potrebbe conquistare una nazione che ne è sprovvista.
Wang ha espresso notevole preoccupazione per i rapidi progressi dell'IA in Cina. Mentre due anni fa potevano essere "nemmeno lontanamente vicini" alle capacità di GPT-4, un recente modello cinese, Yi-Large di 0101, è ora classificato tra i migliori al mondo, subito dopo GPT-4o, Gemini e Claude 3 Opus. Ha attribuito ciò all'eccezionale capacità del PCC di implementare "azioni centralizzate molto aggressive e una politica industriale centralizzata per spingere avanti le industrie critiche". Questo modello, visto nel solare e nei veicoli elettrici, suggerisce che la Cina ha "un'opportunità concreta di avanzare e superarci". Dato ciò, Wang ritiene che debba emergere "una dicotomia": i sistemi di IA all'avanguardia, veramente potenti, dovrebbero essere tenuti chiusi per ragioni militari e geopolitiche, mentre i modelli open source meno avanzati possono continuare a generare valore economico.
Punti di Apprendimento Chiave:
- L'IA, in particolare l'AGI, potrebbe essere l'asset militare più potente dell'umanità, con profonde conseguenze geopolitiche.
- La politica industriale centralizzata della Cina consente un rapido avanzamento dell'IA, colmando rapidamente il divario con le capacità occidentali.
- Una distinzione strategica tra sistemi di IA aperti e chiusi è fondamentale: i modelli all'avanguardia potrebbero dover essere chiusi per sicurezza, mentre quelli meno potenti possono rimanere aperti per un ampio beneficio economico.
Riconfigurare la Concorrenza: i Dati come il Fossato Definitivo
Nel mondo ferocemente competitivo dei modelli fondamentali, Wang crede fermamente che i dati saranno il fattore distintivo ultimo. Ha sottolineato che gli algoritmi possono alla fine essere sottoposti a reverse engineering o diventare conoscenza comune, e la potenza computazionale può semplicemente essere acquistata. "I dati sono una delle poche aree", ha affermato, "dove si può effettivamente produrre un vantaggio competitivo sostenibile a lungo termine". Ha citato le partnership di Open AI con il Financial Times e Axel Springer come primi indicatori di questo cambiamento.
Wang ha audacemente previsto un futuro in cui i leader dell'IA non si vanteranno del numero delle loro GPU, ma di "a quali dati hanno accesso e quali sono i loro diritti unici su diverse fonti di dati". Questa enfasi sui dati unici e proprietari guiderà la differenziazione del mercato. Inoltre, egli anticipa un significativo cambiamento nel software, passando da SaaS a "giardino recintato" ad applicazioni altamente personalizzate e su misura per le aziende, che ricordano l'approccio iniziale di Palantir. Questo sarà alimentato dall'IA che abbasserà drasticamente i costi di creazione del software, portando a una nuova era di soluzioni software personalizzate. Di conseguenza, il modello di prezzo per posto a sedere di lunga data lascerà probabilmente il posto a un modello di prezzo basato sul consumo, riflettendo il lavoro svolto sia dai dipendenti umani che dagli agenti IA.
Punti Chiave:
- I dati stanno emergendo come il principale e più duraturo vantaggio competitivo nella corsa ai modelli fondamentali.
- La competizione futura ruoterà attorno all'accesso, alla proprietà e alla capacità di produrre dataset unici di dati proprietari.
- La mercificazione della creazione di software porterà ad applicazioni su misura e personalizzate per le aziende, andando oltre il SaaS generico.
- I modelli di prezzo del software si evolveranno da per-seat a basati sul consumo, allineandosi al valore fornito sia dagli umani che dagli agenti IA.
Navigare nel Rumore: Canali Diretti e Fiducia
Cambiando marcia, per quanto riguarda la costruzione dell'azienda, Wang ha condiviso il suo approccio non convenzionale alle pubbliche relazioni: "la migliore PR è nessuna PR". Ha sostenuto che i media tradizionali, spesso guidati dai click, tendono a sensazionalizzare e distorcere le narrazioni, esaltando e denigrando le aziende per generare engagement. Ha rivelato una sorprendente esperienza personale: "Ho ricevuto un trattamento più equo testimoniando di fronte al Congresso di quanto non abbia ricevuto da vari organi di stampa nel corso degli anni".
Questa prospettiva ha portato Scale AI a dare priorità ai canali diretti, come podcast e blog aziendali, dove possono trasmettere il loro messaggio autenticamente e senza alterazioni. Questa proprietà della loro narrazione garantisce che la loro storia sia "la più pura" e incontaminata, favorendo fiducia e chiarezza con il loro pubblico.
Pratiche Chiave:
- Adottare una strategia di "nessuna PR" o di minimo coinvolgimento con i media tradizionali per evitare sensazionalismo e distorsione della narrazione.
- Dare priorità ai canali di comunicazione diretti (podcast, contenuti aziendali) per messaggi autentici e inalterati.
- Fondatori e aziende devono attivamente possedere e gestire la propria narrazione in un panorama informativo sempre più rumoroso.
"Nella sua essenza, questa tecnologia IA ha il potenziale per essere uno dei più grandi asset militari che l'Umanità abbia mai visto, potenzialmente anche più di un asset militare delle armi nucleari." - Alexandr Wang


