Röportaj: Alexandr Wang
Founder and CEO @ Scale.ai
tarafından 20VC with Harry Stebbings • 2024-06-12

Harry Stebbings ile 20VC'de yaptığı büyüleyici ve samimi bir sohbette, Scale AI CEO'su Alexandr Wang, mevcut yapay zeka manzarasının katmanlarını araladı, geleneksel bilgilere meydan okudu ve yeni nesil model performansının önündeki gerçek darboğazı gözler önüne serdi. Dünya işlem gücüne (compute) takılıp kalmışken, Wang asıl yarışın – ve potansiyel fark yaratıcının – silikonda değil, veride yattığını savunuyor.
Veri Duvarı: Neden İşlem Gücü Artık Yeterli Değil?
Röportaj doğrudan kışkırtıcı bir soruya daldı: yapay zeka model performansında, daha fazla işlem gücünün artık daha iyi sonuçları garanti etmediği azalan getiriler mi görüyoruz? Wang'ın yanıtı yankılanan bir "evet" oldu. 2022'nin sonlarından bu yana Nvidia GPU harcamalarında (çeyrek başına 5 milyar dolardan 20 milyar doların üzerine) üstel bir artışa rağmen, bu devasa işlem gücü kırılmasından önce gelen GPT-4'ten "ağızları açık bırakacak kadar iyi" bir temel model görmediğimize dikkat çekti.
Wang, yapay zeka ilerlemesinin üç temel sütun üzerine kurulu olduğunu açıkladı: işlem gücü, algoritmalar ve veri. İşlem gücü çarpıcı bir şekilde ölçeklenirken, diğer ikisi aynı hızda ilerleyemedi. Daha da önemlisi, sektörün bir "veri duvarına" çarptığına inanıyor. Açık internette kolayca bulunabilen, genel taramalardan veya torrentlerden toplanan "kolay veri" büyük ölçüde tüketildi. Bu modeller artık "interneti taklit etmede olağanüstü derecede iyi", ancak bu, gerçek AGI veya etkili yapay zeka ajanları için gereken karmaşık görevler ve akıl yürütme için yeterli değil.
Temel Çıkarımlar:
- Yapay zeka gelişimi, işlem gücü, veri ve algoritmaların eşzamanlı ilerlemesine bağlıdır.
- GPT-4 sonrası işlem gücüne yapılan devasa yatırımlar, temel model performansında orantılı sıçramalar getirmedi.
- Sektör, "kolay veri"yi (internet verileri) büyük ölçüde tüketerek bir performans platosuna ulaştı.
Sınırı Şekillendirmek: Veri Bolluğu Yaratmak
Bu veri duvarını aşmak için Wang, "Frontier data" (sınır veri) kavramını tanıttı. Günümüz ekonomisini ayakta tutan karmaşık akıl yürütme ve problem çözmenin çoğunun – bir dolandırıcılık analistinin tümdengelim süreci gibi – çevrimiçi olarak yazıya dökülmediğini vurguladı. Bu, yalnızca internet verileriyle eğitilmiş modellerin bu daha derin insan zekasından öğrenme yeteneğinden yoksun olduğu anlamına geliyor.
Peki, bu ele geçirilmesi zor "Frontier data"yı nasıl yakalarız? Wang iki ana yolu özetledi. Birincisi, işletmelerin içinde kilitli duran devasa bir özel veri hazinesi var. JPMorgan'ın 150 petabaytlık dahili verisini örnek gösterdi; bu, GPT-4'ün bir petabayttan az olan internet veri setini gölgede bırakıyor. Ancak bu veriler son derece hassas olup, işletmelerin bunları kendi yapay zeka sistemleri için, muhtemelen şirket içinde veya dış kullanıma karşı güçlü garantilerle işlemelerini ve rafine etmelerini gerektirecektir. İkincisi ve genelleştirilmiş çığır açıcı gelişmeler için daha kritik olan, "ileri veri üretimi"dir. Bu sadece mevcut verileri toplamakla ilgili değil, yeni, son derece karmaşık veriler oluşturmakla ilgilidir. Bu, yapay zekanın veri ürettiği ve insan uzmanların "güvenlik sürücüleri" gibi hareket ederek yapay zekayı yönlendirdiği, hataları düzelttiği ve modeller takıldığında kritik girdiler sağladığı "insan-sentetik hibrit bir süreç" içerir. Wang, bu "yapay zeka eğitmenleri" veya "katkıda bulunanları" toplumsal etki açısından en yüksek etkiye sahip işlerden bazıları olarak görüyor. "Bir insan uzman olarak," diye belirtti, "bu modelleri geliştirmeye yardımcı olmak için veri üreterek toplum çapında bir etkiye sahip olma yeteneğine sahipsiniz."
Temel Değişiklikler:
- Kolayca erişilebilir "kolay veri"den "Frontier data"ya geçiş, gelişmiş yapay zeka için elzemdir.
- Frontier data, açık internette bulunmayan karmaşık akıl yürütme zincenlerini, araç kullanımını ve ajansvari davranışları kapsar.
- Veri bolluğu, tescilli kurumsal verilerin işlenmesi ve aktif olarak yeni, yüksek kaliteli verilerin üretilmesi yoluyla sağlanacaktır.
- Sentetik veri üretiminde yapay zeka sistemlerini yönlendirmek ve düzeltmek için yeni insan rolleri ortaya çıkacak, bu otonom araçlardaki güvenlik sürücülerine benzer.
Jeopolitik Veri Yarışı: Yeni Bir Soğuk Savaş mı?
Sohbet, Wang'ın yeterince tartışılmadığına inandığı yapay zekanın derin jeopolitik etkilerine doğru bir dönüş yaptı. Açıkça belirtti: "Temelinde bu yapay zeka teknolojisi, insanlığın şimdiye kadar gördüğü en büyük askeri varlıklardan biri olma potansiyeline sahip, potansiyel olarak nükleer silahlardan bile daha büyük bir askeri varlık." AGI'ye sahip totaliter bir rejimin, buna sahip olmayan bir ulusu fethedebileceği ürpertici bir senaryo çizdi.
Wang, Çin'in hızlı yapay zeka ilerlemesi konusunda önemli endişe duyduğunu ifade etti. İki yıl önce GPT-4'ün yeteneklerine "yakın bile olmasalar da", 0101'den çıkan yeni bir Çin modeli olan Yi-Large, şu anda GPT-4o, Gemini ve Claude 3 Opus'un hemen arkasında, dünyanın en iyileri arasında yer alıyor. Bunu, ÇKP'nin "kritik endüstrileri ileriye taşımak için çok agresif merkezi eylemleri ve merkezi endüstriyel politikaları uygulama konusundaki olağanüstü yeteneğine" bağladı. Güneş enerjisi ve elektrikli araçlarda görülen bu model, Çin'in "ilerlemekte ve önümüze geçmekte açık bir şansı" olduğunu gösteriyor. Bu göz önüne alındığında, Wang "ortaya çıkması gereken bir ikilem" olduğuna inanıyor: son teknoloji, gerçekten güçlü yapay zeka sistemleri askeri ve jeopolitik nedenlerle kapalı tutulmalı, daha az gelişmiş, açık modeller ise ekonomik değer sağlamaya devam edebilir.
Temel Öğrenmeler:
- Yapay zeka, özellikle AGI, insanlığın en güçlü askeri varlığı olabilir ve derin jeopolitik sonuçlar doğurabilir.
- Çin'in merkezi endüstriyel politikası, hızlı yapay zeka gelişimini mümkün kılarak Batı yetenekleriyle aradaki farkı hızla kapatıyor.
- Açık ve kapalı yapay zeka sistemleri arasında stratejik bir ayrım yapmak kritik öneme sahiptir: son teknoloji modeller güvenlik nedeniyle kapalı tutulabilirken, daha az güçlü olanlar geniş ekonomik fayda için açık kalabilir.
Rekabeti Yeniden Tanımlamak: Nihai Hendek Olarak Veri
Temel modellerin şiddetli rekabet ortamında, Wang verinin nihai fark yaratıcı olacağına kesinlikle inanıyor. Algoritmaların sonunda tersine mühendislik yapılabileceğini veya ortak bilgi haline gelebileceğini ve işlem gücünün basitçe satın alınabileceğini belirtti. "Veri," diye iddia etti, "uzun vadeli sürdürülebilir bir rekabet avantajı sağlayabileceğiniz birkaç alandan biridir." Open AI'ın Financial Times ve Axel Springer ile yaptığı ortaklıkları bu değişimin erken göstergeleri olarak örnek gösterdi.
Wang, yapay zeka liderlerinin GPU sayılarından değil, "hangi verilere erişimlerinin olduğu ve farklı veri kaynakları üzerinde ne tür benzersiz haklara sahip oldukları" ile övünecekleri bir gelecek cesurca tahmin etti. Benzersiz, tescilli verilere yapılan bu vurgu, pazar farklılaşmasını yönlendirecek. Ayrıca, yazılımda önemli bir değişim öngörüyor; "kapalı bahçe" SaaS'tan, Palantir'in erken dönem yaklaşımını anımsatan, işletmeler için yüksek düzeyde özelleştirilmiş, amaca yönelik uygulamalara doğru bir geçiş. Bu, yapay zekanın yazılım oluşturma maliyetlerini çarpıcı bir şekilde düşürmesiyle beslenecek ve kişiselleştirilmiş yazılım çözümlerinin yeni bir çağına yol açacak. Sonuç olarak, uzun süredir devam eden koltuk başına fiyatlandırma modelinin, hem insan çalışanlar hem de yapay zeka ajanları tarafından yapılan işi yansıtan tüketime dayalı fiyatlandırmaya yerini bırakması muhtemel.
Temel Çıkarımlar:
- Veri, temel model yarışında birincil ve en kalıcı rekabet avantajı olarak ortaya çıkıyor.
- Gelecekteki rekabet, tescilli verilere erişim, sahiplik ve benzersiz veri kümeleri üretme yeteneği etrafında dönecek.
- Yazılım oluşturmanın ticarileşmesi, genel SaaS'ın ötesine geçerek işletmeler için özel yapım, özelleştirilmiş uygulamalara yol açacak.
- Yazılım fiyatlandırma modelleri, koltuk başına modelden tüketime dayalıya doğru gelişecek ve hem insanlar hem de yapay zeka ajanları tarafından sağlanan değerle uyumlu hale gelecek.
Gürültüde Yol Almak: Doğrudan Kanallar ve Güven
Şirket kurmaya dönersek, Wang halkla ilişkilere alışılmadık yaklaşımını paylaştı: "en iyi PR, PR yapmamaktır." Geleneksel medyanın, genellikle tıklamalarla hareket ettiğini, anlatıları sansasyonelleştirme ve çarpıtma, etkileşim için şirketleri yüceltip sonra yıpratma eğiliminde olduğunu savundu. Şaşırtıcı bir kişisel deneyimini açıkladı: "Yıllar boyunca çeşitli medya kuruluşlarından gördüğümden daha adil muameleyi Kongre önünde ifade verirken gördüm."
Bu bakış açısı, Scale AI'ın mesajlarını otantik bir şekilde ve hiçbir değişiklik olmaksızın iletebilecekleri podcast'ler ve şirket blogları gibi doğrudan kanallara öncelik vermesine yol açtı. Kendi anlatılarına sahip çıkmaları, hikayelerinin "en saf" ve bozulmamış olmasını sağlayarak hedef kitleleriyle güven ve netlik oluşturuyor.
Temel Uygulamalar:
- Sansasyonellik ve anlatı çarpıtmasını önlemek için "PR yapmama" veya geleneksel medya ile minimum düzeyde etkileşim stratejisi benimseyin.
- Otantik ve değiştirilmemiş mesajlaşma için doğrudan iletişim kanallarına (podcast'ler, şirket içeriği) öncelik verin.
- Kurucular ve şirketler, giderek gürültülü hale gelen bir bilgi ortamında kendi anlatılarına aktif olarak sahip çıkmalı ve yönetmelidir.
"Temelinde bu yapay zeka teknolojisi, insanlığın şimdiye kadar gördüğü en büyük askeri varlıklardan biri olma potansiyeline sahip, potansiyel olarak nükleer silahlardan bile daha büyük bir askeri varlık." - Alexandr Wang


