Wawancara dengan Alexandr Wang
Founder and CEO @ Scale.ai
oleh 20VC with Harry Stebbings • 2024-06-12

Dalam percakapan yang menarik dan blak-blakan dengan Harry Stebbings di 20VC, Alexandr Wang, CEO Scale AI, mengupas tuntas seluk-beluk lanskap AI saat ini, menantang kebijaksanaan konvensional, dan menyoroti hambatan sesungguhnya terhadap kinerja model generasi berikutnya. Sementara dunia terobsesi pada komputasi, Wang berpendapat bahwa perlombaan sesungguhnya—dan pembeda potensial—tidak terletak pada silikon, melainkan pada data.
Dinding Data: Mengapa Komputasi Tidak Cukup Lagi
Wawancara langsung mengupas pertanyaan provokatif: apakah kita melihat penurunan hasil (diminishing returns) dalam kinerja model AI, di mana komputasi yang lebih banyak tidak lagi menjamin hasil yang lebih baik? Jawaban Wang adalah "ya" yang bergema. Dia menunjukkan bahwa meskipun ada lonjakan eksponensial dalam pengeluaran GPU Nvidia sejak akhir 2022 (dari $5 miliar menjadi lebih dari $20 miliar per kuartal), kita belum melihat model dasar yang "jauh lebih unggul secara mengejutkan" daripada GPT-4, yang muncul sebelum titik balik komputasi yang masif ini.
Wang menjelaskan bahwa kemajuan AI bertumpu pada tiga pilar: komputasi, algoritma, dan data. Sementara komputasi telah meningkat secara dramatis, dua pilar lainnya belum mengimbangi. Yang krusial, ia percaya industri telah mencapai "dinding data." 'Data mudah'—segala sesuatu yang tersedia di internet terbuka, yang dikumpulkan dari common crawls atau torrent—sebagian besar telah dikonsumsi. Model-model ini kini "sangat mahir dalam meniru internet," tetapi itu tidak cukup untuk tugas kompleks dan penalaran yang diperlukan untuk AGI sejati atau agen AI yang efektif.
Wawasan Utama:
- Kemajuan AI bergantung pada komputasi, data, dan algoritma yang maju secara beriringan.
- Investasi besar dalam komputasi pasca-GPT-4 belum menghasilkan lompatan yang sepadan dalam kinerja model dasar.
- Industri sebagian besar telah menghabiskan "data mudah" (data internet), menyebabkan plateau kinerja.
Membangun Batasan: Mengembangkan Kelimpahan Data
Untuk mengatasi dinding data ini, Wang memperkenalkan konsep "data Frontier." Dia menyoroti bahwa banyak penalaran kompleks dan pemecahan masalah yang menggerakkan ekonomi saat ini – seperti proses deduktif analis penipuan – tidak dituliskan secara online. Ini berarti model yang hanya dilatih pada data internet kurang memiliki kemampuan untuk belajar dari kecerdasan manusia yang lebih mendalam ini.
Jadi, bagaimana kita menangkap data Frontier yang sulit didapat ini? Wang menguraikan dua jalur utama. Pertama, ada harta karun data proprietary yang sangat besar yang terkunci di dalam perusahaan. Dia menyebut 150 petabyte data internal JPMorgan, yang mengerdilkan dataset internet GPT-4 yang kurang dari satu petabyte. Data ini, bagaimanapun, sangat sensitif dan akan membutuhkan perusahaan untuk menambang dan memurnikannya untuk sistem AI mereka sendiri, kemungkinan secara on-prem (lokal) atau dengan jaminan kuat terhadap penggunaan eksternal. Kedua, dan lebih krusial untuk terobosan yang digeneralisasi, adalah "produksi data ke depan." Ini bukan hanya tentang mengumpulkan data yang sudah ada tetapi menciptakan data baru yang sangat kompleks. Ini melibatkan "proses hibrida manusia-sintetis" di mana AI menghasilkan data, dan pakar manusia bertindak sebagai "pengemudi keselamatan" (safety drivers), membimbing AI, mengoreksi kesalahan, dan memberikan masukan penting saat model mengalami kebuntuan. Wang melihat "pelatih AI" atau "kontributor" ini sebagai pekerjaan yang memiliki dampak sosial paling besar. "Sebagai pakar manusia," katanya, "Anda memiliki kemampuan untuk memberikan dampak di seluruh masyarakat dengan menghasilkan data untuk membantu meningkatkan model-model ini."
Perubahan Utama:
- Transisi dari "data mudah" yang siap tersedia ke "data Frontier" sangat penting untuk AI tingkat lanjut.
- Data Frontier mencakup rantai penalaran kompleks, penggunaan alat, dan perilaku agentik yang tidak ditemukan di internet terbuka.
- Kelimpahan data akan dicapai melalui penambangan data enterprise proprietary dan secara aktif memproduksi data baru berkualitas tinggi.
- Peran manusia baru akan muncul untuk membimbing dan mengoreksi sistem AI dalam menghasilkan data sintetik, mirip dengan pengemudi keselamatan kendaraan otonom.
Perlombaan Data Geopolitik: Perang Dingin Baru?
Percakapan beralih ke implikasi geopolitik AI yang mendalam, sebuah topik yang menurut Wang kurang dibahas. Dia dengan tegas menyatakan, "Inti dari teknologi AI ini memiliki potensi untuk menjadi salah satu aset militer terbesar yang pernah dilihat umat manusia, bahkan berpotensi lebih besar daripada senjata nuklir." Dia menggambarkan skenario yang mengerikan di mana rezim totalitarian dengan AGI dapat menaklukkan negara yang tidak memilikinya.
Wang mengungkapkan kekhawatiran signifikan atas kemajuan AI China yang pesat. Meskipun dua tahun lalu mereka mungkin "jauh tertinggal" dari kemampuan GPT-4, model China terbaru, Yi-Large dari 0101, kini menduduki peringkat di antara yang terbaik di dunia, tepat di belakang GPT-4o, Gemini, dan Claude 3 Opus. Dia menghubungkan hal ini dengan kemampuan luar biasa CCP untuk menerapkan "tindakan terpusat yang sangat agresif dan kebijakan industri terpusat untuk mendorong kemajuan Industri-industri penting." Pola ini, terlihat dalam industri surya dan EV, menunjukkan bahwa China memiliki "peluang nyata untuk maju dan mendahului kita." Mengingat hal ini, Wang percaya ada "dikotomi yang harus muncul": sistem AI mutakhir yang benar-benar kuat harus tetap tertutup untuk alasan militer dan geopolitik, sementara model terbuka yang kurang canggih dapat terus mendorong nilai ekonomi.
Pembelajaran Utama:
- AI, khususnya AGI, bisa menjadi aset militer paling ampuh bagi umat manusia, dengan konsekuensi geopolitik yang mendalam.
- Kebijakan industri terpusat China memungkinkan kemajuan AI yang pesat, dengan cepat menutup kesenjangan dengan kemampuan Barat.
- Perbedaan strategis antara sistem AI terbuka dan tertutup sangat penting: model mutakhir mungkin perlu ditutup untuk keamanan, sementara yang kurang kuat dapat tetap terbuka untuk manfaat ekonomi yang luas.
Mendefinisikan Ulang Persaingan: Data sebagai Parit Utama
Dalam dunia model dasar yang sangat kompetitif, Wang sangat yakin data akan menjadi pembeda utama. Dia menguraikan bahwa algoritma pada akhirnya dapat direkayasa ulang atau menjadi pengetahuan umum, dan komputasi dapat dengan mudah dibeli. "Data adalah salah satu dari sedikit area," tegasnya, "di mana Anda benar-benar dapat menghasilkan keunggulan kompetitif yang berkelanjutan dalam jangka panjang." Dia menyebut kemitraan OpenAI dengan Financial Times dan Axel Springer sebagai indikator awal pergeseran ini.
Wang dengan berani memprediksi masa depan di mana para pemimpin AI tidak akan membanggakan jumlah GPU mereka, melainkan "data apa yang mereka akses dan apa hak unik mereka atas berbagai sumber data." Penekanan pada data unik dan proprietary ini akan mendorong diferensiasi pasar. Selanjutnya, ia mengantisipasi pergeseran signifikan dalam perangkat lunak, beralih dari SaaS "walled garden" ke aplikasi yang sangat disesuaikan dan dibangun sesuai tujuan untuk perusahaan, mengingatkan pada pendekatan awal Palantir. Ini akan didorong oleh AI yang secara dramatis menurunkan biaya pembuatan perangkat lunak, mengarah pada era baru solusi perangkat lunak yang dipersonalisasi. Akibatnya, model harga "per-seat" yang sudah lama ada kemungkinan akan beralih ke penetapan harga berbasis konsumsi, mencerminkan pekerjaan yang dilakukan oleh karyawan manusia dan agen AI.
Wawasan Utama:
- Data muncul sebagai keunggulan kompetitif utama dan paling tahan lama dalam perlombaan model dasar.
- Persaingan di masa depan akan berputar di sekitar akses data proprietary, kepemilikan, dan kemampuan untuk menghasilkan dataset unik.
- Komoditisasi pembuatan perangkat lunak akan mengarah pada aplikasi khusus dan disesuaikan untuk perusahaan, melampaui SaaS generik.
- Model penetapan harga perangkat lunak akan berkembang dari "per-seat" menjadi berbasis konsumsi, selaras dengan nilai yang disampaikan oleh manusia dan agen AI.
Menavigasi Kebisingan: Saluran Langsung dan Kepercayaan
Mengalihkan fokus ke pembangunan perusahaan, Wang membagikan pendekatan tidak konvensionalnya terhadap hubungan masyarakat: "PR terbaik adalah tanpa PR." Dia berpendapat bahwa media tradisional, yang seringkali didorong oleh klik, cenderung mensensasionalisasi dan mendistorsi narasi, membangun dan meruntuhkan perusahaan demi engagement. Dia mengungkapkan pengalaman pribadi yang mengejutkan: "Saya menerima perlakuan yang lebih adil saat bersaksi di depan Kongres daripada yang saya dapatkan dari berbagai media selama bertahun-tahun."
Perspektif ini telah mendorong Scale AI untuk memprioritaskan saluran langsung, seperti podcast dan blog perusahaan, di mana mereka dapat menyampaikan pesan mereka secara otentik dan tanpa perubahan. Kepemilikan atas narasi mereka memastikan cerita mereka "paling murni" dan tidak tercemar, menumbuhkan kepercayaan dan kejelasan dengan audiens mereka.
Praktik Utama:
- Mengadopsi strategi "tanpa PR" atau keterlibatan minimal dengan media tradisional untuk menghindari sensasionalisme dan distorsi narasi.
- Memprioritaskan saluran komunikasi langsung (podcast, konten perusahaan) untuk pesan yang otentik dan tidak diubah.
- Para pendiri dan perusahaan harus secara aktif memiliki dan mengelola narasi mereka di tengah lanskap informasi yang semakin bising.
"Inti dari teknologi AI ini memiliki potensi untuk menjadi salah satu aset militer terbesar yang pernah dilihat umat manusia, bahkan berpotensi lebih besar daripada senjata nuklir." - Alexandr Wang


