के साथ साक्षात्कार Alexandr Wang
Founder and CEO @ Scale.ai
द्वारा 20VC with Harry Stebbings • 2024-06-12

हैरी स्टेबिंग्ज के साथ 20VC पर एक आकर्षक और सीधी बातचीत में, Scale AI के CEO, अलेक्जेंडर वांग ने वर्तमान AI परिदृश्य की परतों को खोला, पारंपरिक सोच को चुनौती दी और अगली पीढ़ी के मॉडल के प्रदर्शन में वास्तविक बाधा पर प्रकाश डाला। जहाँ दुनिया कंप्यूट (compute) को लेकर जुनूनी है, वहीं वांग का तर्क है कि असली दौड़ — और संभावित विभेदक — सिलिकॉन में नहीं, बल्कि डेटा में है।
डेटा की दीवार: कंप्यूट अब पर्याप्त क्यों नहीं है
यह साक्षात्कार सीधे एक उत्तेजक सवाल में उतर गया: क्या हम AI मॉडल के प्रदर्शन में घटते प्रतिफल (diminishing returns) देख रहे हैं, जहाँ अधिक कंप्यूट अब बेहतर परिणामों की गारंटी नहीं देता? वांग का जवाब जोरदार 'हाँ' था। उन्होंने बताया कि 2022 के अंत से Nvidia GPU व्यय में घातीय वृद्धि (प्रति तिमाही $5 बिलियन से $20 बिलियन से अधिक) के बावजूद, हमने GPT-4 से कोई "चौंकाने वाला बेहतर" आधार मॉडल नहीं देखा है, जो कंप्यूट में इस भारी बदलाव से पहले का है।
वांग ने समझाया कि AI की प्रगति तीन स्तंभों पर आधारित है: कंप्यूट, एल्गोरिदम और डेटा। जबकि कंप्यूट नाटकीय रूप से बढ़ा है, अन्य दो तालमेल नहीं बिठा पाए हैं। महत्वपूर्ण बात यह है कि उनका मानना है कि उद्योग 'डेटा की दीवार' से टकरा गया है। 'आसान डेटा' — खुले इंटरनेट पर आसानी से उपलब्ध सब कुछ, सामान्य क्रॉल या टॉरेंट से निकाला गया — काफी हद तक उपयोग हो चुका है। ये मॉडल अब "इंटरनेट का अनुकरण करने में असाधारण रूप से अच्छे हैं", लेकिन वास्तविक AGI या प्रभावी AI एजेंटों के लिए आवश्यक जटिल कार्यों और तर्क के लिए यह पर्याप्त नहीं है।
मुख्य अंतर्दृष्टि:
- AI की प्रगति कंप्यूट, डेटा और एल्गोरिदम के एक साथ आगे बढ़ने पर निर्भर करती है।
- GPT-4 के बाद कंप्यूट में भारी निवेश से आधार मॉडल के प्रदर्शन में समान उछाल नहीं आया है।
- उद्योग ने 'आसान डेटा' (इंटरनेट डेटा) को काफी हद तक खत्म कर दिया है, जिससे प्रदर्शन में ठहराव आ रहा है।
सीमांत का निर्माण: डेटा की प्रचुरता पैदा करना
इस डेटा की दीवार को पार करने के लिए, वांग ने "फ्रंटियर डेटा" की अवधारणा पेश की। उन्होंने इस बात पर प्रकाश डाला कि जटिल तर्क और समस्या-समाधान का अधिकांश हिस्सा जो आज की अर्थव्यवस्था को शक्ति देता है – जैसे एक धोखाधड़ी विश्लेषक की निगमनात्मक प्रक्रिया (deductive process) – ऑनलाइन लिखा नहीं जाता। इसका मतलब है कि केवल इंटरनेट डेटा पर प्रशिक्षित मॉडल इस गहरी मानवीय बुद्धिमत्ता से सीखने की क्षमता का अभाव रखते हैं।
तो, हम इस मायावी फ्रंटियर डेटा को कैसे कैप्चर करें? वांग ने दो मुख्य रास्ते बताए। पहला, उद्यमों के भीतर बंद मालिकाना डेटा का एक विशाल खजाना है। उन्होंने JPMorgan के 150 पेटाबाइट आंतरिक डेटा का हवाला दिया, जो GPT-4 के एक पेटाबाइट से भी कम इंटरनेट डेटासेट को छोटा कर रहा है। हालाँकि, यह डेटा अत्यधिक संवेदनशील है और उद्यमों को इसे अपने स्वयं के AI सिस्टम के लिए खनन और परिष्कृत करना होगा, संभवतः ऑन-प्रमिसिस या बाहरी उपयोग के खिलाफ मजबूत गारंटी के साथ। दूसरा, और सामान्यीकृत सफलताओं के लिए अधिक महत्वपूर्ण, 'फॉरवर्ड डेटा उत्पादन' है। यह केवल मौजूदा डेटा एकत्र करने के बारे में नहीं है, बल्कि नया, अत्यधिक जटिल डेटा बनाने के बारे में है। इसमें एक "मानव-सिंथेटिक हाइब्रिड प्रक्रिया" शामिल है जहाँ AI डेटा उत्पन्न करता है, और मानव विशेषज्ञ "सुरक्षा चालकों" के रूप में कार्य करते हैं, AI का मार्गदर्शन करते हैं, त्रुटियों को सुधारते हैं, और जब मॉडल फंस जाते हैं तो महत्वपूर्ण इनपुट प्रदान करते हैं। वांग इन "AI प्रशिक्षकों" या "योगदानकर्ताओं" को सामाजिक प्रभाव के लिए सबसे अधिक प्रभावशाली नौकरियों में से एक मानते हैं। उन्होंने कहा, "एक मानव विशेषज्ञ के रूप में, आपके पास इन मॉडलों को बेहतर बनाने में मदद करने के लिए डेटा का उत्पादन करके समाज-व्यापी प्रभाव डालने की क्षमता है।"
मुख्य बदलाव:
- आसानी से उपलब्ध 'आसान डेटा' से 'फ्रंटियर डेटा' में बदलाव उन्नत AI के लिए आवश्यक है।
- फ्रंटियर डेटा में जटिल तर्क श्रृंखलाएं, उपकरण का उपयोग और एजेंटिक व्यवहार शामिल हैं जो खुले इंटरनेट पर नहीं मिलते।
- डेटा की प्रचुरता मालिकाना उद्यम डेटा के खनन और सक्रिय रूप से नया, उच्च-गुणवत्ता वाला डेटा का उत्पादन करके प्राप्त की जाएगी।
- सिंथेटिक डेटा उत्पन्न करने में AI सिस्टम का मार्गदर्शन और सुधार करने के लिए नई मानवीय भूमिकाएं उभरेंगी, जो स्वायत्त वाहन सुरक्षा चालकों के समान होंगी।
भू-राजनीतिक डेटा दौड़: एक नया शीत युद्ध?
बातचीत AI के गहन भू-राजनीतिक निहितार्थों की ओर मुड़ गई, एक ऐसा विषय जिसे वांग कम चर्चा की गई मानते हैं। उन्होंने स्पष्ट रूप से कहा, "अपने मूल में यह AI तकनीक मानवजाति ने कभी देखा है ऐसा सबसे बड़ा सैन्य संपत्ति बनने की क्षमता रखती है, संभावित रूप से परमाणु हथियारों से भी अधिक सैन्य संपत्ति।" उन्होंने एक भयावह परिदृश्य चित्रित किया जहाँ AGI वाला एक सर्वाधिकारवादी शासन (totalitarian regime) एक ऐसे राष्ट्र को जीत सकता है जिसके पास यह नहीं है।
वांग ने चीन की तीव्र AI प्रगति पर महत्वपूर्ण चिंता व्यक्त की। जबकि दो साल पहले वे GPT-4 की क्षमताओं के "कहीं भी नहीं करीब" थे, 0101 का एक हालिया चीनी मॉडल, Yi-Large, अब दुनिया के सर्वश्रेष्ठ में से एक है, जो GPT-4o, Gemini और Claude 3 Opus के ठीक पीछे है। उन्होंने इसका श्रेय CCP की असाधारण क्षमता को दिया कि वह "महत्वपूर्ण उद्योगों को आगे बढ़ाने के लिए बहुत आक्रामक केंद्रीकृत कार्रवाई और केंद्रीकृत औद्योगिक नीति" लागू कर सके। सौर और EV में देखा गया यह पैटर्न, बताता है कि चीन के पास "हमसे आगे निकलने और दौड़ में आगे बढ़ने का एक स्पष्ट अवसर है।" इसे देखते हुए, वांग का मानना है कि "एक द्वंद्व जो उभरना चाहिए" है: अत्याधुनिक, वास्तव में शक्तिशाली AI सिस्टम को सैन्य और भू-राजनीतिक कारणों से बंद रखा जाना चाहिए, जबकि कम उन्नत, खुले मॉडल आर्थिक मूल्य बढ़ाना जारी रख सकते हैं।
मुख्य सीख:
- AI, विशेष रूप से AGI, मानवजाति की सबसे शक्तिशाली सैन्य संपत्ति हो सकती है, जिसके गहन भू-राजनीतिक परिणाम होंगे।
- चीन की केंद्रीकृत औद्योगिक नीति तीव्र AI उन्नति को सक्षम बनाती है, जिससे पश्चिमी क्षमताओं के साथ अंतर तेजी से पट रहा है।
- खुले और बंद AI सिस्टम के बीच एक रणनीतिक अंतर महत्वपूर्ण है: सुरक्षा के लिए अत्याधुनिक मॉडलों को बंद रखने की आवश्यकता हो सकती है, जबकि कम शक्तिशाली वाले व्यापक आर्थिक लाभ के लिए खुले रह सकते हैं।
प्रतिस्पर्धा को फिर से परिभाषित करना: डेटा ही परम सुरक्षा कवच है
फाउंडेशन मॉडल की अत्यधिक प्रतिस्पर्धी दुनिया में, वांग दृढ़ता से मानते हैं कि डेटा ही अंतिम विभेदक (differentiator) होगा। उन्होंने बताया कि एल्गोरिदम को अंततः रिवर्स-इंजीनियर किया जा सकता है या सामान्य ज्ञान बन सकता है, और कंप्यूट को केवल खरीदा जा सकता है। उन्होंने जोर देकर कहा, "डेटा उन कुछ क्षेत्रों में से एक है जहाँ आप वास्तव में एक दीर्घकालिक स्थायी प्रतिस्पर्धी लाभ का उत्पादन कर सकते हैं।" उन्होंने इस बदलाव के शुरुआती संकेतकों के रूप में फाइनेंशियल टाइम्स और एक्सेल स्प्रिंगर के साथ Open AI की साझेदारी का हवाला दिया।
वांग ने एक ऐसे भविष्य की साहसपूर्वक भविष्यवाणी की जहाँ AI नेता अपने GPU गणना के बारे में डींग नहीं मारेंगे, बल्कि "उनके पास किस डेटा तक पहुंच है और विभिन्न डेटा स्रोतों के लिए उनके पास किस प्रकार के अद्वितीय अधिकार हैं" के बारे में बात करेंगे। अद्वितीय, मालिकाना डेटा पर यह जोर बाजार में विभेदन (differentiation) को बढ़ावा देगा। इसके अलावा, वह सॉफ्टवेयर में एक महत्वपूर्ण बदलाव की उम्मीद करते हैं, 'वॉलड गार्डन' SaaS से हटकर उद्यमों के लिए अत्यधिक अनुकूलित, उद्देश्य-निर्मित अनुप्रयोगों की ओर बढ़ रहा है, जो Palantir के शुरुआती दृष्टिकोण की याद दिलाता है। यह AI द्वारा सॉफ्टवेयर निर्माण लागत को नाटकीय रूप से कम करने से प्रेरित होगा, जिससे व्यक्तिगत सॉफ्टवेयर समाधानों के एक नए युग की ओर अग्रसर होगा। परिणामस्वरूप, लंबे समय से चला आ रहा प्रति-सीट मूल्य निर्धारण मॉडल संभवतः खपत-आधारित मूल्य निर्धारण को रास्ता देगा, जो मानव कर्मचारियों और AI एजेंटों दोनों द्वारा किए गए काम को दर्शाता है।
मुख्य अंतर्दृष्टि:
- डेटा फाउंडेशन मॉडल की दौड़ में प्राथमिक और सबसे टिकाऊ प्रतिस्पर्धी लाभ के रूप में उभर रहा है।
- भविष्य की प्रतिस्पर्धा मालिकाना डेटा पहुंच, स्वामित्व और अद्वितीय डेटासेट उत्पन्न करने की क्षमता के इर्द-गिर्द घूमेगी।
- सॉफ्टवेयर निर्माण का कमोडिटीकरण (commoditization) उद्यमों के लिए विशेष, अनुकूलित अनुप्रयोगों को जन्म देगा, जो सामान्य SaaS से परे होगा।
- सॉफ्टवेयर मूल्य निर्धारण मॉडल प्रति-सीट से खपत-आधारित में विकसित होंगे, जो मनुष्यों और AI एजेंटों दोनों द्वारा प्रदान किए गए मूल्य के साथ संरेखित होगा।
शोर को नेविगेट करना: सीधे चैनल और विश्वास
कंपनी निर्माण की ओर बढ़ते हुए, वांग ने जनसंपर्क के लिए अपना अपरंपरागत दृष्टिकोण साझा किया: "सबसे अच्छा पीआर कोई पीआर नहीं है।" उन्होंने तर्क दिया कि पारंपरिक मीडिया, जो अक्सर क्लिकों से प्रेरित होता है, कहानियों को सनसनीखेज बनाने और विकृत करने की प्रवृत्ति रखता है, जुड़ाव (engagement) के लिए कंपनियों को बनाता और गिराता है। उन्होंने एक आश्चर्यजनक व्यक्तिगत अनुभव का खुलासा किया: "मुझे सालों से विभिन्न मीडिया आउटलेट्स की तुलना में कांग्रेस के सामने गवाही देने में अधिक निष्पक्ष व्यवहार मिला है।"
इस दृष्टिकोण ने Scale AI को पॉडकास्ट और कंपनी ब्लॉग जैसे सीधे चैनलों को प्राथमिकता देने के लिए प्रेरित किया है, जहाँ वे अपने संदेश को प्रामाणिक रूप से और बिना किसी बदलाव के प्रसारित कर सकें। अपनी कहानी का यह स्वामित्व यह सुनिश्चित करता है कि उनकी कहानी "सबसे शुद्ध" और बेदाग है, जो उनके दर्शकों के साथ विश्वास और स्पष्टता को बढ़ावा देता है।
मुख्य अभ्यास:
- सनसनीखेज और कथा विकृति से बचने के लिए पारंपरिक मीडिया के साथ 'नो पीआर' या न्यूनतम जुड़ाव की रणनीति अपनाना।
- प्रामाणिक और अपरिवर्तित संदेश के लिए सीधे संचार चैनलों (पॉडकास्ट, कंपनी सामग्री) को प्राथमिकता देना।
- एक तेजी से शोरगुल वाले सूचना परिदृश्य में संस्थापकों और कंपनियों को अपनी कहानी का सक्रिय रूप से स्वामित्व और प्रबंधन करना चाहिए।
"अपने मूल में यह AI तकनीक मानवजाति ने कभी देखा है ऐसा सबसे बड़ा सैन्य संपत्ति बनने की क्षमता रखती है, संभावित रूप से परमाणु हथियारों से भी अधिक सैन्य संपत्ति।" - अलेक्जेंडर वांग


